수식 읽는 법
by DANBI
수식에 대해서
업무를 하면서 인터넷을 통해 다양한 자료나 논문을 찾아 읽다 보면, 어김없이 아래와 같은 수식을 접하게 됩니다.
\[f(x) = a_0 + \sum_{n=1}^\infty\Bigl(a_n\cos \frac{n\pi x}{L}+b_n\sin\frac{n\pi x}{L}\Bigl)\ (푸리에\ 급수)\]수식에 익숙한 사람이라면 모르겠지만, 수학과 그다지 친하지 않은 사람들은 대충 눈으로 훑어보고 (혹은 패스하고) 다음 설명을 읽어나가게 되고, 결국 자료의 내용 전체를 이해하지 못하는 경우가 종종 생겨납니다. 이번 포스트에서는 왜 수식이 어려운가, 수식은 대체 뭔가, 어떻게 해야 수식을 잘 읽을 수 있을까에 대한 간단한 고찰을 짤막하게 정리해 봅니다.
수식이 어려운 이유
보통 수나 계산, 논리 등의 개념을 간결하게 표현하기 위해서 ‘수학 기호‘가 사용됩니다. 어떤 의미를 함축적으로 표현하기 위해서, +, -, x, ÷와 같은 기호가 사용되기도 하고, Σ, σ와 같은 그리스 문자가 사용되기도 하며, 그냥 수를 대신해서 a나 b와 같은 알파벳을 쓰거나, α, β와 같은 그리스 문자가 쓰이곤 합니다. 우리가 어릴 때 배웠던 1 + 2 = 3 이라는 연산만 보아도, +와 =이라는 수학 기호가 사용됩니다. 하지만 +와 =은 쉽고, 앞서 언급한 푸리에 급수와 같은 수식은 어렵게만 느껴집니다.
수학에서는 숫자를 대신하여 문자를 사용하는 것을 ‘대수’라고 합니다. 하지만 지금처럼 수학 기호를 쓰기 시작한 것은 그리 오래되지는 않았다고 합니다. 수학 기호가 없었을 때에는 그냥 말로 ‘더하고, 빼고 등등’과 같이 표현했기 때문에 책을 쓰려고 하면, 책 두께가 엄청났다는 썰(?)도 있습니다. 어쨌든 요지는 이렇게 말로 설명하면 이러쿵 저러쿵 긴 내용을 간결하게 표현하기 위해서 바로 기호가 사용되기 시작했다는 점이죠. 또 말로 설명할 때에는 말하는 사람 혹은 듣는 사람에 따라서 그 내용이 와전되는 경우도 있는데, 기호를 사용하면 그 의미가 분명해지는 이점도 있습니다.
수식이 어렵게 느껴지는 가장 큰 이유는 바로 우리가 이런 기호에 익숙하지 않다는 것. 그리고 그 기호는 함축적인 의미를 가진다는 점 때문인 것 같습니다. +나 =은 우리가 어렸을 때부터 그 의미를 확실히 알고 많이 사용해 왔기 때문에 ‘+’라는 기호만 봐도 ‘아 얘는 더한다는 의미구나’하고 바로 인식이 됩니다. 하지만 그 외의 그리스 문자나 다른 수학 기호들은 특별히 수학 공부를 많이한 사람이 아닌 이상, 평상시에는 크게 접하는 일이 없기 때문에 다소 생소하게 느껴집니다. 특히 수식에는 알파벳이나 그리스 문자와 같은 서양권의 글자가 많이 쓰이기 때문에, 기호에 대한 의미를 논하기 이전에 글자 자체에 대한 생소함이 더 크게 느껴지는 것 같습니다. 새로운 기호들도 그 의미를 확실히 익히고, 많이 사용하다보면 점점 익숙해지리라 믿습니다.
그리스 문자 읽는 법
학교다닐 때, 수학 시간에 선생님이 “주번, 일어나서 128페이지 읽어봐” 했을 때, 식이 나와서 어떻게 읽어야할지 몰라 당황했던 경험은 없으신가요. 수식에 사용되는 그리스 문자들을 어떻게 발음해서 읽어야 하는지는 다음의 표에 잘 정리되어 있어, 참조하면 좋을 것 같습니다. 또 각 문자별로 어떤 의미를 대신해서 사용되는지의 용례가 정리되어 있습니다. 보통은 의미하는 바의 알파벳 앞글자를 따서 대체하여 사용하는 경우가 많기 때문에, 영어가 익숙하면 수식으로 표현하는데 좀 더 수월할 수도 있겠네요.
예를 들어, 밀도는 Density이기 때문에 알파벳 D에 해당하는 그리스 문자인 델타를 사용하고, 오차(Error)는 E에 해당하는 엡실론, 모평균(Mean)은 M에 해당하는 뮤, 원주율(Pi)는 P에 해당하는 파이를 사용하는 방식입니다.
수학 기호와 그 뜻
몇가지 항목별로 나눠서 많이 쓰이는 수학 기호와 그 뜻을 간략하게 살펴보겠습니다.
수의 집합
수식 | 의미 |
---|---|
N | 자연수 전체의 집합 (\(\mathbb{N}, \mathbb{Z}, \mathbb{Q},\mathbb{R},\mathbb{C}\)와 같이 이중 취소선으로 표기하기도 함) |
Z | 정수 전체의 집합 |
Q | 유리수 전체의 집합 |
R | 실수 전체의 집합 |
C | 복소수 전체의 집합 |
\(R^n\) | R × … × R, n차원의 유클리드공간 |
-
사용 예) 최소제곱법에 대한 설명 중에 위의 표현이 사용된 경우
\[given\ A \in R^{m\times n} and \ b \in R^m,\ find\ vector\ x \in R^n\ that\ minimizes \\ ||Ax - b ||^2 = \sum_{i=1}^m\Biggl(\sum_{j=1}^nA_{ij}x_j-b_i\Biggl)^2\]이 때 \(A \in R^{m\times n}\): A가 임의의 m x n의 행렬이라는 것을 의미 (∈: 왼쪽이 오른쪽의 원소임을 의미함)
기초 통계
수식 | 의미 |
---|---|
\(\mu = \frac{\sum_{i=1}^nx_i}{n}\) | 평균 |
\(\sigma^2 = \frac{\sum_{i=1}^n(x_i-\mu)^2}{n}\) | 분산 (편차 제곱의 평균) |
\(\sigma = \sqrt\frac{\sum_{i=1}^n(x_i-\mu)^2}{n}\) | 표준편차 |
확률
수식 | 의미 |
---|---|
P(A), Pr(A) | 사상 A의 확률 |
P(B|A) | 조건 A에서의 사상 B의 확률 (조건부확률) |
P(A,B) = P(B|A) P(A) | 결합 확률. A이면서 B일 확률 |
E(X) | 기대값. 확률변수 X의 평균. \(E(X) = \sum_{i=1}^nx_iP(x_i)\) |
- 사용 예) 베이즈 정리: \(P(X \mid Y) = \frac{P(Y \mid X) P(X)}{P(Y)}\)
순열, 조합
수식 | 의미 |
---|---|
\(n! = \Pi_{k=1}^nk=n\times(n-1)\times(n-2)\ \times...\times\ 3\times2\times1\) | 계승. 그 수보다 작거나 같은 모든 양의 정수의 곱. 팩토리얼이라고 부름. !로 표시 |
\(\Pi\) | 곱집합 |
\(_nP_r = \frac{n!}{(n-r)!}\) | 순열. 서로 다른 n개의 원소에서 r개를 중복없이 골라 순서에 상관있게 나열하는 것 |
\(_nC_r = _nP_r \ /\ r! = \frac{n!}{(n-r)!\times r!} = \begin{pmatrix} n \\ r \end{pmatrix}\) | 조합. 서로 다른 n개의 원소에서 순서에 상관없이 r개를 뽑을 때 |
벡터, 행렬
수식 | 의미 |
---|---|
\({||a||}\) | 벡터의 norm, 벡터의 크기, 길이를 의미함 |
det(A) 또는 |A| | 행렬식, 선형 행렬 A의 크기를 나타냄. 2 X 2 행렬일 경우, \(A = \begin{bmatrix} a & b \\ c & d\end{bmatrix}\) 라면, det(A) = ad - bc로 정의됨 |
\(A^T\) | 전치 행렬. A의 행렬에서 행과 열을 바꾼 형태 |
\(A^{-1}\) | 역행렬. A행렬과 곱했을 때, 단위행렬이 되는 행렬 |
\(I\) (E나 U로도 씀) | 단위 행렬. 주 대각선이 전부 1이고 나머지 원소는 0을 값으로 갖는 정사각행렬 |
- 사용 예) 회귀모델의 coefficients(계수)가 \(w = (w_1, ..., w_p)\) 라고 할 때, 편차의 제곱이 최소가 되는 w를 구하는 공식: \(argmin_{w}{\|X w-y \|{_2}^2}\)
미적분
수식 | 의미 |
---|---|
\(\frac{\partial f}{\partial x} = \frac{dy}{dx} = f'(x)\) | 함수 f(x)의 도함수(미분) |
\(\int f(x)dx\) | 함수 f(x)의 적분 |
-
사용 예) 어떤 다변수 함수 \(f(x_1,x_2,...,x_n)\) 이 있을 때, f의 그레디언트(Gradient)는 다음과 같이 표현: \(\nabla f=\Bigl(\frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, ..., \frac{\partial f}{\partial x_n}\Bigl)\)
- \(\nabla f\): 함수 \(f(x_1,x_2,...,x_n)\)의 기울기 (Gradient)
- 경사하강법(Gradient descent) 공식: \(x_{i+1} = x_i -\lambda_i\nabla f(x_i)\)
정리하며
수식을 읽기 어려울 때는 아래의 단계처럼 수식을 이해하려는 노력을 해보면 좋을 것 같습니다.
-
논문 같은 경우에는 수식을 사용할 때, 해당 기호나 문자가 무엇을 의미하는지 따로 적어놓는 경우가 있습니다. 처음보는 수식이 어려울 때는, 우선 수식 근처에 해당 기호나 문자가 의미하는 바가 따로 설명되어 있는지 찾아보면 좋을 것 같습니다.
- 따로 설명이 없다면, 해당 기호가 원래 많이 쓰이는 기호인지 찾아봅니다. 도움이 될만한 링크는 아래와 같습니다. (보통 많이 쓰이는 수식들은 외워두면 좋을 듯 합니다)
- 그래도 어렵다면, 기호가 나타내는 바에 대한 개념을 찾아봐야 합니다. 예를 들어, \(\int\)는 적분이라고 하는데, 그래도 잘 모르겠다면, 적분의 개념 이해가 안되었기 때문입니다. 이 단계라면, 개념 자체를 이해해야 하는 문제로 넘어가게 됩니다. 이해가 안가는 것이 어떤 공식이라면, 그 공식이 어떤 문제를 해결하기 위해 나온 것인지에 대한 배경을 좀 더 찾아보는 것도 도움이 될 수 있으리라 생각합니다.
참고자료
https://ko.wikipedia.org/wiki/%EC%88%98%ED%95%99_%EA%B8%B0%ED%98%B8
http://pigbrain.github.io/math/2015/07/15/MathematicalSymbol_on_Math
https://librewiki.net/wiki/%EC%88%98%ED%95%99_%EA%B8%B0%ED%98%B8