• Snorkel을 활용해 라벨 보정하기

    배경 이번 글은 Fraud Detection System 개발 과정 중 탐지 모델 라벨 보정 도구를 적용한 작업에 대해 소개해 드리려 합니다. 게임 서비스에서 Fraud Detection이란 매크로나 핵등의 불법 프로그램 사용이나 계정 도용과 같은 부정 행위를 탐지하는 것을 말합니다. 이러한 행위를 하는 집단을 부정 사용자라 정의하며 일반 고객에게 악영향을 끼치기 때문에 적절한...


  • R Markdown을 활용한 Interactive Report 만들기

    작업의 배경 지난 포스팅 게임 속 시장을 들여다보기 위한 단 하나의 지표 에서는 게임 내 거래의 활성화 정도를 살펴보는 거래 종합 지표의 개발 과정을 소개했다. 앞선 글에서 소개했던 종합 지표를 접하면 대부분의 사람들은 추가적인 정보에 대한 궁금증을 가질 것이다. 지난 기간 대비 지표가 얼마나 증감했는지, 세부적으로 어떤 활동의 변동이 전체...


  • 게임 고객 LTV를 활용한 예상 매출 추정하기

    배경 이번 포스팅에서는 게임 고객 LTV 추정 작업 이후, 이를 직접적으로 활용하여 개발했던 예상 매출 추정 작업에 관해 소개 드리려 합니다. 고객 생애 가치를 의미하는 LTV는 특정 서비스를 이용하는 고객이 일생 동안 얼마만큼의 이익을 가져다 줄 것 인지 정량적으로 추정한 것을 의미합니다. 이와 관련하여 유저 세그먼트별 정보와 기간에 따른 단/중/장기...


  • 게임 속 시장을 들여다보기 위한 단 하나의 지표

    게임 속 시장은 어떻게 움직일까? 게임은 또 다른 사회이자 하나의 경제 시스템이다. 이 가상의 세계에서 무심코 하는 모든 행동들이 모여 사회를 구성하고 시스템을 작동시킨다. 수많은 유저들이 캐릭터를 생성함으로써 인구를 늘려 나가고, 다양한 컨텐츠를 이용하면서 화폐를 얻고, 이는 소득이 되어 필요한 아이템을 구매함으로써 소비를 한다. 아래 예시를 보자. 유저 A는 몬스터를...


  • 도메인 지식이 결여된 인과 추정이 위험한 이유

    시작하며 간혹 ‘데이터 분석가에게 도메인 지식이 필요한가?’ 에 대한 질문을 받거나 관련된 논의글을 보곤 합니다. 전 도메인 지식이 필요할 뿐만 아니라 도메인 지식이 없는 상태에서 데이터 분석을 하는 것은 위험하다는 입장입니다. 특히, 분석의 목적이 인과 추론인 경우에는 더욱 그렇습니다. 이번 글에서는 가상의 사례를 통해 그 이유를 설명할까 합니다. 다음과 같은...