DANBI
Data Analytics aNd Business Insights
-
인턴 생활기 #5
무더운 여름날 늘 같은 일만 하다 보면 지치기 마련인데요! 이번 주에는 지난 주에 선물을 교환했던 마니또 미션 이후, 서로의 마니또와 함께 사내 카페에서 커피 한 잔 마시며 친해지는 시간을 잠깐 가졌습니다. (피젯큐브를 드렸는데 잘 쓰고 계셔서 뿌듯했습니다.ㅎㅎ) 저희는 인턴 과제로 게임로그 데이터를 통해 유저들을 분석하지만, 다른 팀 인턴 분들은 직접...
-
인턴 생활기 #4
이번 주는 인턴 과제로 수행 중인 프로젝트 배경을 소개하고 다음 포스팅에서 그 내용을 이어 작성하려 합니다! 돌이켜보니 인턴생활기 라는 제목과는 달리, 저희의 생활기를 자세하게 적지는 않았었던 것 같은데요. 저희는 앞서 소개했던 Hive 쿼리 교육과 더불어 팀의 과거 업무와 데이터 관련 서비스에 대해 배우고 실무에 필요한 회귀나 분류 등의 분석 기법,...
-
너의 폰트를 써라! (R에서도)
알파벳이 아닌 그런 경우 R을 쓸 때 폰트 문제는 쉬운 듯 어려운 문제다. 그냥 OS에서 폰트 깔아서 쓰듯 쓸 수 있으면 좋으련만 ‘그렇게’ 쉽게 쓸 수는 없다. R에서 그래프를 그려본 사람이라면, 어 “왜 (그래프에서) 폰트가 네모박스로 나와”하는 상황을 한번은 마주쳐 봤을 것이다. 이는 R과 RStudio가 OS에서 끌어다 쓰는 부분이 제한적이기...
-
데이터 시각화 - #2 Box Plot과 Scatter Plot
데이터 시각화 - #2 Box Plot과 Scatter Plot ※본 글에서 제공되는 코드는 모두 R을 기준으로 작성되었습니다. 이전 데이터 시각화 글에서 언급한 것과 같이, 가장 기본적인 데이터 시각화 방식 중 하나인 Box Plot과 Scatter Plot에 대해서 얘기해보도록 하겠습니다. Box Plot과 Scatter Plot은 각각 단변수(Univariate)와 이변수(Bivariate) 값을 시각화하는 가장 기본적인 그래프 중...
-
인턴 생활기 #3
이번 주 역시 여러 과제들을 풀며 서버에 적재되어 있는 많은 DB에 익숙해지는 시간을 가졌고, Hive 쿼리를 직접 작성하며 필요에 맞게 데이터를 추출하는 연습을 했습니다. 쿼리문을 이론으로 접할 때와 달리 실제로 쓰이는 문제들을 가지고 쿼리를 짜는 연습을 하다 보니, 생각지 않은 장애물들도 많았습니다. 이번 포스팅에서는 Hive 쿼리를 작성하며, 실제로 겪었던 장애물들에...