• 실전 이탈 예측 모델링을 위한 세 가지 고려 사항 #2

    실전 이탈 예측 모델링을 위한 세 가지 고려 사항 #1 2. Concept drift 는 모델링 전반에 걸쳐 고려해야할 문제이다. 실전에서 예측 모델을 서비스에 적용해 본 분이라면 예측 모델이 처음에는 잘 맞다가 시간이 지날수록 점점 정확도가 떨어지면서 결국 유명무실해진 경험을 해본 적이 있을 것입니다. 이것을 ‘concept drift 문제’ 라고 부릅니다. ‘Concept...


  • 실전 이탈 예측 모델링을 위한 세 가지 고려 사항 #1

    0. 시작하며 최근 몇 년간 이탈 예측 모델링 관련 업무를 하고 있습니다. 공식적으로 프로젝트를 진행하거나 팀 내부적으로 조사 및 연구를 진행한 적도 있고, 경진 대회를 통해 다양한 참가자들의 결과물을 심사하기도 했죠. 하지만 아쉽게도 여전히 이탈 예측 모델 결과를 실제 서비스에 적용하지는 못하고 있습니다. 이렇게 다양한 방법을 시도하고 실패하면서 몇 가지...


  • promotionImpact - 프로모션 효과 분석용 R 패키지

    우리 지금 잘하고 있는 거 맞지? 어느 기업이든 회사의 서비스나 상품에 대한 판매 전략을 세우고 매출을 올리기 위한 다양한 마케팅 이벤트나 프로모션을 하고 있을 것이다. 이 때 진행 중인 이벤트나 프로모션이 실제로 얼마나 효과가 있는지 파악하는 것은 중요한 문제이다. 그런데 그 효과는 어떻게 측정할 수 있을까? 가장 직접적인 방법은 실험을...


  • 의사결정 나무와 엔트로피

    엔트로피? 문송한 사람들은 대체로 ‘이과’의 새로운 개념을 접하면 머리가 멍해진다. 글쓴이의 문과 상식으로 엔트로피는 ‘무질서도’ 된다. 열역학의 개념 말이다. 그런데 기계학습에서 이 녀석이 왜 나오지? 결론부터 말하면 배움이 짧았다. 엔트로피라는 개념을 놓고 물리학과 정보학 사이에 내밀한 교류가 있었더라. 제임스 글릭이 쓴 “인포메이션” 9장에 관련된 내용이 자세하게 소개되어 있으니 관심이 있으시다면...


  • Visual Studio Code로 편리한 Pylife!

    이 포스팅은 일종의 구 버전입니다. 혹시 이 글의 링크를 보고 오신 분이라면 여기를 참고하시면 좋겠습니다. 들어가며 아마 각자 알아서 잘 쓰는 Python 설정이 있을 것이다. 그대로 잘 쓰면 되겠다. 하지만 막 Python으로 코딩을 시작하려는 사람이 있다면 이런 글도 조금은 도움이 되지 않을까 한다. 이 가이드의 목표는 다음과 같다. 되도록 꼬이지...