• promotionImpact R 패키지 CRAN 등록기

    피땀 흘려 만든 R 패키지… CRAN에 등록해볼까? 이전 포스팅에서 설명했듯이, 집계된 지표를 토대로 여러 가지 프로모션들의 효과를 추정하는 데 필요한 데이터 전처리 및 회귀 분석 과정을 도와주는 R 패키지 ‘promotionImpact’를 만들었다. (https://danbi-ncsoft.github.io/works/2019/01/08/works-promotionImpact.html) 그리고 이왕 R 패키지를 만든 김에, R의 공식 Repository, CRAN에 등록해보고자 어쩌면 험난할지도 모르는 여정을 시작했다. ​ 그런데...


  • 인과관계를 찾아서 2

    인과관계 시리즈의 두 번째로 인과관계의 식별을 방해하는 요소들에 대해서 세 가지로 나누어 살펴보자. 그림에서 우리의 목표는 X가 Y에게 주는 인과관계, 즉 1번을 밝혀내는 것이다. X와 Y가 함께 움직인다는 사실 만으로 1번의 인과관계를 확정할 수 없다. 우연의 일치 1,2,3이 전부 없어도 X, Y는 함께 움직일 수 있다. 상관 관계가 있다고 해서...


  • 인과관계를 찾아서 1

    도대체 인과관계란 무엇인가? “상관관계와 인과관계는 다르다,” 는 말은 이 업계에서 너무 흔하게 들을 수 있다. “Orange is new black”과 비슷한 느낌이랄까? 둘은 다르잖아요! 그렇죠? 솔직히 이렇게 말하는 분들 보면 바지 자락을 잡고 이렇게 묻고 싶다. 그래서 인과관계는 뭡니까? 둘이 서로 다르다고 강조하는 분들 중에서 정작 인과관계를 명확하게 정의하거나 설명하는 분들은...


  • 실전 이탈 예측 모델링을 위한 세 가지 고려 사항 #2

    실전 이탈 예측 모델링을 위한 세 가지 고려 사항 #1 2. Concept drift 는 모델링 전반에 걸쳐 고려해야할 문제이다. 실전에서 예측 모델을 서비스에 적용해 본 분이라면 예측 모델이 처음에는 잘 맞다가 시간이 지날수록 점점 정확도가 떨어지면서 결국 유명무실해진 경험을 해본 적이 있을 것입니다. 이것을 ‘concept drift 문제’ 라고 부릅니다. ‘Concept...


  • 실전 이탈 예측 모델링을 위한 세 가지 고려 사항 #1

    0. 시작하며 최근 몇 년간 이탈 예측 모델링 관련 업무를 하고 있습니다. 공식적으로 프로젝트를 진행하거나 팀 내부적으로 조사 및 연구를 진행한 적도 있고, 경진 대회를 통해 다양한 참가자들의 결과물을 심사하기도 했죠. 하지만 아쉽게도 여전히 이탈 예측 모델 결과를 실제 서비스에 적용하지는 못하고 있습니다. 이렇게 다양한 방법을 시도하고 실패하면서 몇 가지...