고객지원 > 지식/노하우

지식/노하우

지식/노하우

웹분석 도구마다 측정 수치는 왜 다를까? - 5. 분석 알고리즘의 미묘한 차이

페이지 정보

작성일2015-09-14

본문

 

웹분석 도구마다 측정 수치는 왜 다를까?

분석 알고리즘의 미묘한 차이

​넷스루 웹분석 컨설팅팀

지금까지 로그 파일에 의한 측정값 차이에 대해 살펴보았습니다. 서로 다른 로그 파일을 분석하기 때문에 결과값도 달라질 수 있다는 것에 대해 확인해 보았습니다. 그러나 동일한 로그 파일을 분석하는 경우 측정 결과가 달라지는 이유는 무엇일까요? 이번 장에서는 각 웹분석 도구들의 분석 방식에 의한 측정값 차이를 확인해 보겠습니다.

넷스루의 와이즈로그(WiseLog) 뿐만 아니라 국내/외 웹로그 분석 제품들은 주요 측정값을 정의하는 독자적인 알고리즘을 갖고 있습니다. 측정값에 대한 의미는 동일하지만 각 웹분석 도구들이 중요하게 보는 관점에 따라 분석 과정에서 차이가 발생합니다.

 

 

방문(Visit)이라는 측정지표를 통해 그 의미를 알아보고자 합니다. 방문은 거의 대부분의 분석 보고서에 표시되기 때문에 기본 방문에 대한 측정값이 다르다면 다른 보고서 방문 수치에도 영향을 주게 됩니다. 그럼 각 제품별로 방문을 어떻게 식별하고 계산하는지 기준을 살펴보겠습니다.

 웹분석 도구

 측정방법

 특이사항

WiseLog
(넷스루)

측정기준 : (IP, 영구쿠키값, 회원ID)+방문 타임아웃
방문 타임아웃(마지막 간주 시간) : 기본 30분
측정방법 : 측정 3가지 기준에 대한 조합 및 마지막 방문 간주 시간 고려 

회원ID를 추가 사용함으로써 방문이 정교해짐

 국내 A 사

측정기준 : (IP, 영구쿠키값) + 방문 타임아웃
방문 타임아웃(마지막 간주 시간) : 기본 40분
측정방법 : 측정 기준 및 마지막 방문 시간 고려

방문 타임아웃 시간을 40분으로 처리하여 타사 대비 방문수가 적을 수 있음

 국내 B사

측정기준 : (IP, 영구쿠키값) + 방문 타임아웃
방문 타임아웃(마지막 간주 시간) : 기본 30분
측정방법 : 측정 기준 및 마지막 방문 시간 고려

일반적인 방법

 국외 G사

측정기준 : 방문 확인용 쿠키(_utmb) +
방문 타임아웃 : 30분
측정방법 : 페이지 클릭마다 방문 확인용 쿠키에 현재시각 +30분 된 수치를 기록하여 30분이 경과한 시점에 expire되도록 처리

영구쿠키가 아닌 방문 확인용 쿠키값을 이용하여 정확성 보장에 노력

 

간단한 예를 통해 넷스루의 WiseLog, A사, B사 제품의 방문수를 확인해 보겠습니다.

 예제1

IP                   DateTime                             Cookie

111.111.111.111 [20/Jun/2015:15:08:03 +0900]  “PCID=1234567890”  → ①
111.111.111.111 [20/Jun/2015:15:09:03 +0900]  “PCID=1234567890”  → ②
111.111.111.111 [20/Jun/2015:15:40:03 +0900]  “PCID=1234567890”  → ③

WiseLog 

Visit = 2
이유 : 세션 타임아웃(30분)으로 인한 방문 분리
8ac02bff7f1e6f293eda75e5aaaf9bfa_1442214

A사 

Visit = 1
이유 : 세션 타임아웃(40분) 안에 일어난 행동이므로 방문 분리 없음

8ac02bff7f1e6f293eda75e5aaaf9bfa_1442214

B사

Visit = 2
이유 : 세션 타임아웃(30분) 으로 인한 방문 분리 발생

8ac02bff7f1e6f293eda75e5aaaf9bfa_1442214

 

다음은 회원ID가 기록된 예제를 이용해 넷스루의 WiseLog와 A사, B사 제품의 방문수 차이를 확인해 보겠습니다.

 예제2

IP                       DateTime                              Cookie

111.111.111.111     [20/Jun/2015:15:08:03 +0900]   “PCID=12345”                 
111.111.111.111     [20/Jun/2015:15:09:03 +0900]   “PCID=12345”  UID=”u1”    
111.111.111.111     [20/Jun/2015:15:40:03 +0900]   “PCID=12345”  UID=”u1”    

WiseLog 

Visit = 2
이유 : IP, 영구쿠키가 동일하고 회원ID가 없다가 발생한 경우 방문 중 로그인 활동으로 간주하여 동일 방문 처리 + 세션 타임아웃 반영된 방문 처리

8ac02bff7f1e6f293eda75e5aaaf9bfa_1442215

A사 

Visit = 2
이유 : 회원ID로 인한 방문 분리 + 세션 타임아웃(40분) 안에 일어난 행동으로 동일 방문 처리

8ac02bff7f1e6f293eda75e5aaaf9bfa_1442215

B사

Visit = 3
이유 : 회원ID로 인한 방문 분리 + 세션 타임아웃으로 인한 방문 분리

8ac02bff7f1e6f293eda75e5aaaf9bfa_1442215 

 

이제 분석 방식에 따른 측정값 차이를 확인하셨으리라 생각합니다. 분석 툴 도입 전 기본 측정값에 대한 처리 방식을 한 번쯤 확인해 보시면 보고서 이해에 많은 도움이 되리라 생각합니다.

웹분석 도구마다 측정 수치는 왜 다를까? - 1. 측정 수치 차이는 어디에서 시작되는가?
웹분석 도구마다 측정 수치는 왜 다를까? - 2. 로그에 기록되는 정보의 차이
웹분석 도구마다 측정 수치는 왜 다를까? - 3. 로그 수집방식의 차이
웹분석 도구마다 측정 수치는 왜 다를까? - 4. 로그 수집방식의 측정값 영향
웹분석 도구마다 측정 수치는 왜 다를까? - 5. 분석 알고리즘의 미묘한 차이
웹분석 도구마다 측정 수치는 왜 다를까? - 6. DB데이터의 차이

 

 

34105d05eeb817a50c26d4edcc32a642_1436174

 

 

 

  • 트위터로 보내기
  • 페이스북으로 보내기

모바일 페이지로 이동