저번 편에 이어서 같은 데이터를 가지고 빅데이터 분석 툴인 Spotfire로 데이터 분석을 시도해 보겠다.


Spotfire 란 ? 

mySQL, msSQL과 같은 기능을 하는 데이터 분석 도구 중의 하나로, 무료 다운로드 판에서 더욱 손쉽게 데이터를 돌리며 분석할 수 있다. 



Excel로 얻어낸 패턴을 Spotfire로 불러와서 Day 1~5까지의 유저 접속 시간 패턴을 분석하였다. 방법은 아래에 내가 작성한 ppt에 자세하게 나와있다 ! 




▶ 위와 같이 비슷한 기울기를 가진 다섯 개의 그래프를 얻을 수 있다. 그런데 2일차 이후에는 이탈 기울기가 완만한 것을 확인 가능하다. 여기서 1일차 당일에 게임 지속 여부가 결정난다는 것을 예측할 수 있다.




▶ 또한 그래프 상에서 최고 꼭짓점을 확인했을 때, 주로 20 - 22시 사이를 가리키는 것을 알 수 있다. 이로써 peak time이 20 - 22시 사이라는 것을 짐작할 수 있다. 



게임 데이터 분석을 하는 과제는 이 수많은 데이터를 어떻게 활용할 것인지, 어떤 그래프를 뽑아내야 할 것인지 생각하는 데에 오랜 시간이 걸린다. 하지만 결국 패턴 및 결과를 찾아냈을 때, 거기서 오는 성취감이 정말 큰 것 같다. 

어렵지만 재미있는 과제였다.  




지난 해에 들었던 '소프트웨어 신기술특론(게임 편)' 수업에서는 즐기기만 했던 게임의 형태를 분류하고, 직접 평가해보는 시간을 가졌었다. 또한 가상으로 게임회사 지원을 위한 자기소개서를 써보며 '게임'에 대해 많이 이해하게 되었다. 


이번 학기에는 UI/UX의 인문학적 기능과 게임 데이터 분석을 배우고 있다. 정말이지 많많치 않은 주제다. 

게임을 인문학적으로 파헤치기도 쉽지 않았지만 가장 어려운 것은 단연코 게임 데이터 분석이었다.아직 R을 다뤄보지 않은 나에게 편리한(?) 데이터 분석 tool로 게임 데이터 분석을 하는 것이 과제로 주어졌다. 



주어진 데이터를 통하여 유저 트래픽 관련 분석을 진행하려고 한다.

(주어진 데이터 : user id, ip address, mac address, gender, level, regdate(접속 시간))


여기서 잠깐 ! 

IP address MAC address 의 차이점을 알아보자.

 

IP address 컴퓨터가 인터넷과 연결될 때 받는 고유번호로 전화번호 와 같다. but, 고정값은 아님.

MAC address 는 인터넷에 연결되는 개별 단말기들을 식별할 수 있는 주소이다. 인증 과정에 사용되는 주민등록번호 와 같다. 


(안타깝게도, 위 두 데이터는 주로 어뷰징에 쓰이는 것 같아 데이터 분석 시 건드리지 않았다.)



이번 포스팅에서는 Excel 피벗으로 데이터를 분석해 보겠다. 


▶ User id를 이용하여 일자 별 접속 기록 패턴 얻기 




Excel의 date, hour, concatenate함수는 기본적인 함수이지만 이를 통해 일자별 접속 유저 기록을 얻어내는 것은 쉽지 않았다. 

다음 포스팅에는 같은 데이터를 가지고 빅데이터 분석 툴인 Spotfire로 데이터 분석을 시도해 보겠다. 


+ Recent posts