• 2018 빅콘테스트

    2018 빅콘테스트 ​ 게임 데이터는 현실과 매우 유사한 가상 세계에서 한 개체 (게임 캐릭터)의 모든 행동들이 기록된다는 점에서 높은 분석 가치를 지니고 있지만, 일반적으로 관련 회사에서 일하거나, 협약을 맺지 않는 이상, 게임 데이터를 접하기는 쉽지 않습니다. 그렇기 때문에 엔씨소프트, 특히 저희 I&I실에서는 게임 데이터를 공개하고, 게임 데이터에 대한 연구 활성화,...


  • 인턴 생활기 #2

    인턴생활 1주차에는 회사 및 팀의 전반적인 사항들에 대한 교육을 받았다면, 2주차에는 실무에 한걸음 더 다가가기 위한 교육을 받았습니다. 특히 서버에 적재되어있는 DB에서 분석에 필요한 데이터만을 추출하기 위한 Hive 쿼리를 본격적으로 실습했는데요. DB에는 게임 내에서 초 단위로 일어나는 유저들의 다양한 행동을 표현한 자료인 로그와 함께 유저들의 게임 결제 내역까지 각각 테이블로,...


  • 데이터 시각화 - #1 탐사분석이란?

    데이터 시각화 - #1 탐사분석이란? 정보 시대를 맞이해, 매 순간마다 무한이라고 표현해도 무방할 만큼 많은 양의 데이터가 생산되고 저장되고 있습니다. 특히 개인의 행동 뿐만 아닌 유저간의 모든 사건들이 기록되는 가상세계, 즉 “게임”을 제작하고 운영하는 저희 회사의 특성상, 거래내역, 사회 활동, 개인의 결제내역 등 방대한 양의 데이터가 항시 축적되고 있습니다. 워낙에...


  • 자연실험은 어떻게 인과관계 추론에 활용되는가?

    TL; DR 많은 경우 통제된 실험을 하는 것은 불가능하다. 이 경우 우리는 데이터 탐정이 되어 ‘자연실험’을 찾는 것을 생각해볼 수 있겠다. 우리는 “실험”을 원한다! 잘 아시다시피, 인과관계와 상관관계는 다릅니다. 그리고 역시 아시다시피 상관관계가 가짜(spurious)인 경우가 많습니다. 이곳에 가보시면 황당하고 다양한 가짜 상관관계가 많습니다. 하나 같이 황당한 것들이지만 상관계수는 0.8이 넘습니다....


  • 인턴 생활기 #1

    앞선 글에서도 언급되었듯이, Data Analysis & Programming 직무로 2명의 사원이 하계 인턴을 수행하게 되었습니다. 인턴생활 동안 배우는 내용과 하는 일에 대하여 간략하게나마 소개해 드리고자 매주 인턴생활기를 포스팅하려고 합니다. 먼저, 2명의 인턴을 소개합니다! A - 안녕하세요, 저는 통계학을 전공하며 현재 데이터마이닝 연구실에서 관련 공부를 하고 있습니다. 진행했던 프로젝트로는 분포가정을 통한 영화...