• 인턴 생활기 시즌2 #1

    7월 1일부터 7주간 분석모델링팀에서 2명의 사원이 인턴의 업무를 수행하게 되었습니다. 인턴 생활 동안 저희가 배우고 느낀 바를 간략하게나마 전달해 드리고자 합니다. 매주 성장해나가는 모습 지켜 봐주시면 감사하겠습니다. A - 안녕하세요. 저는 컴퓨터 공학과 통계학을 전공하였으며 데이터 분석과 머신 러닝 관련 공부를 하고 있습니다. 지금까지 진행했던 프로젝트들로는 Expedia 데이터 관련 패키지를...


  • promotionImpact R 패키지 CRAN 등록기

    피땀 흘려 만든 R 패키지… CRAN에 등록해볼까? 이전 포스팅에서 설명했듯이, 집계된 지표를 토대로 여러 가지 프로모션들의 효과를 추정하는 데 필요한 데이터 전처리 및 회귀 분석 과정을 도와주는 R 패키지 ‘promotionImpact’를 만들었다. (https://danbi-ncsoft.github.io/works/2019/01/08/works-promotionImpact.html) 그리고 이왕 R 패키지를 만든 김에, R의 공식 Repository, CRAN에 등록해보고자 어쩌면 험난할지도 모르는 여정을 시작했다. ​ 그런데...


  • 2018 빅콘테스트 후기

    이 글은 2019년 1월에 발간된 마이크로소프트웨어 395호에 기고했던 글입니다. 시작하며 데이터 분석 및 기계 학습에 대한 관심과 중요도가 커짐에 따라 데이터 분석 경진 대회의 인기도 점점 커지고 있다. 특히, 사람들에게 가장 널리 알려진 것은 캐글이라고 하는, 2010년에 설립된 데이터 분석 경진 대회 전문 플랫폼이다 (https://www.kaggle.com/). 캐글에서 사람들은 레이블과 함께 주어진...


  • 인과관계를 찾아서 2

    인과관계 시리즈의 두 번째로 인과관계의 식별을 방해하는 요소들에 대해서 세 가지로 나누어 살펴보자. 그림에서 우리의 목표는 X가 Y에게 주는 인과관계, 즉 1번을 밝혀내는 것이다. X와 Y가 함께 움직인다는 사실 만으로 1번의 인과관계를 확정할 수 없다. 우연의 일치 1,2,3이 전부 없어도 X, Y는 함께 움직일 수 있다. 상관 관계가 있다고 해서...


  • 인과관계를 찾아서 1

    도대체 인과관계란 무엇인가? “상관관계와 인과관계는 다르다,” 는 말은 이 업계에서 너무 흔하게 들을 수 있다. “Orange is new black”과 비슷한 느낌이랄까? 둘은 다르잖아요! 그렇죠? 솔직히 이렇게 말하는 분들 보면 바지 자락을 잡고 이렇게 묻고 싶다. 그래서 인과관계는 뭡니까? 둘이 서로 다르다고 강조하는 분들 중에서 정작 인과관계를 명확하게 정의하거나 설명하는 분들은...