DANBI
Data Analytics aNd Business Insights
-
R을 활용한 게임 데이터 분석 #3
이번엔 R와 직접 연관이 있으면서도 좀 더 포괄적인 이야기를 다뤄보도록하겠습니다. 데이터 분석에 있어 가장 중요한 게 뭘까요? 제가 생각하기에 그것은 바로 ‘재현성(reproducibility)’ 과 ‘실행 가능성(actionability)’입니다. #재현성과 실행가능성 재현성은 어떤 분석 결과에 대해 다른 사람이 같은 방법으로 분석했을 때, 같은 결과가 나올 수 있는 것을 말합니다. 데이터 분석이 소위 말하는 ‘데이터과학’이라...
-
R을 활용한 게임 데이터 분석 #2
게임 데이터 분석 절차 엔씨소프트 데이터분석팀에서 진행하는 분석 프로젝트는 크게 1) 탐사분석 2) 예측 모델링 3) 시스템 혹은 서비스 개발 단계로 나눌 수 있습니다. 1단계인 탐사 분석은 말 그대로 초기 분석 방향조차 정해지지 않은 단계에서 다양한 탐사를 위해, 혹은 예측 분석에 앞서 예측 대상이 갖고 있는 패턴이나 특징을 찾는것이죠. 최근에...
-
R을 활용한 게임 데이터 분석 #1
#데이터 분석가들이 가장 선호하는 언어 R은 통계 분석을 하기 위해 개발한 언어이자 소프트웨어도구입니다. 원래 Bell 연구소에서 만든 ‘S’라는 프로그래밍 언어가 있었는데, 로버트 젠틀맨(Robert Gentleman)과 로스 이하카(Ross Ihaka)라는사람이 S를 참고해서 누구나 자유롭게 사용할 수 있도록 오픈 소스로 구현한 것이 R입니다(*눈치채셨겠지만 R이라는이름은 S라는 언어에서 비롯되었고 S라는 이름은 Statistics의 S를 뜻합니다). R이 처음...
-
수식 읽는 법
수식에 대해서 업무를 하면서 인터넷을 통해 다양한 자료나 논문을 찾아 읽다 보면, 어김없이 아래와 같은 수식을 접하게 됩니다. \[f(x) = a_0 + \sum_{n=1}^\infty\Bigl(a_n\cos \frac{n\pi x}{L}+b_n\sin\frac{n\pi x}{L}\Bigl)\ (푸리에\ 급수)\] 수식에 익숙한 사람이라면 모르겠지만, 수학과 그다지 친하지 않은 사람들은 대충 눈으로 훑어보고 (혹은 패스하고) 다음 설명을 읽어나가게 되고, 결국 자료의 내용 전체를...
-
회귀 모델의 종류와 특징
회귀 모델이란? 회귀 모델을 한 마디로 정의하면 ‘어떤 자료에 대해서 그 값에 영향을 주는 조건을 고려하여 구한 평균’ 입니다. 통계학적인 관점에서 보면 모든 데이터는 아래와 같은 수식으로 표현할 수 있다고 가정합니다. \[y = h(x_1, x_2, x_3, ..., x_k; \beta_1, \beta_2, \beta_3, ..., \beta_k) + \epsilon\] 위 수식에서 h() 가 위에서...