고객지원 > 지식/노하우

지식/노하우

지식/노하우

웹분석 도구마다 측정 수치는 왜 다를까? - 3. 로그 수집방식의 차이

페이지 정보

작성일2015-08-31

본문

 

웹분석 도구마다 측정 수치는 왜 다를까?

로그 수집방식의 차이

​넷스루 웹분석 컨설팅팀

로그 수집 방식에 따라서 기록되는 정보가 다릅니다. 예를 들면 스크립트 방식에서는 봇(Bot)이나 프로그램 등에 의해 요청된 정보가 기록되지 않습니다. 로그에 기록되는 정보의 범위가 로그 파일 내 컬럼의 차이라면 로그 수집 방식은 로그 파일 양의 차이를 가져옵니다. 로그 데이터를 수집할 때에는 주로 이용하는 방식으로 웹서버 방식, 스크립트 방식, 스니퍼 방식이 있습니다. 각 방식은 저마다의 특징과 장/단점을 가지고 있습니다. 따라서, 어떤 방식이 좋다/아니다를 얘기하기 보다는 고객사에 맞는 방식이다/아니다를 찾는 것이 중요합니다.

 

8cdf64d63f3a85d8f81cd0af74e01fa4_1440997

[로그 수집 방식]


1. 웹서버 방식
웹서버에서 기록하는 웹로그 파일을 사용하는 방식입니다. 모든 웹서버는 표준 웹로그를 남기고 있습니다. 웹서버에서 전달된 모든 클라이언트의 요청을 빠짐없이 기록하고 있기 때문에 가장 많고 다양한 정보를 기록한 로그입니다. (단, 웹서버 앞 단에 캐쉬서버를 운영하는 경우 캐쉬서버에서 처리된 요청은 기록되지 않을 수 있습니다.) 적용이 쉽고 웹사이트 변경 시 영향을 받지 않기 때문에 전통적으로 많이 사용되는 방법입니다.

그러나 정상적인 사용자가 아닌 봇(Bot)이나 프로그램 등에 의해 요청된 정보, 리다이렉트된 페이지 정보도 기록되기 때문에 필요에 따라 필터링 작업을 진행해야 합니다.

2. 스크립트 방식
웹페이지에 로그를 기록할 수 있는 스크립트를 삽입하고, 해당 페이지가 로딩될 때 필요한 정보를 스크립트 수집 서버로 전송하여 수집서버에서 로그 파일을 기록하는 방식입니다. 정상적으로 로딩되는 페이지 혹은 분석가가 원하는 페이지 이용 정보만을 로그로 남길 수 있기 때문에 분석에 필요한 정확한 데이터가 기록되는 방법입니다. 최근 서비스 형태의 웹로그 분석 방식을 제공하는 벤더들 사이에서 가장 많이 사용하는 방법입니다.

그러나 웹페이지에 삽입해야 하는 스크립트 태깅을 누락할 시에는 웹로그를 전혀 남길 수 없기 때문에 사이트 운영 혹은 리뉴얼 시 상당한 주의를 요합니다.

3.  패킷 스니핑 방식
웹사이트 접근 시 고객들이 인터넷을 통해 요청하는 트래픽은 스위치나 탭 장비를(사이트 운영 구조에 따라 달라질 수 있습니다.) 거치게 됩니다. 패킷 스니핑 방식은 용어에서 알 수 있듯이 인터넷 상에 떠도는 패킷을 몰래(?) 읽어보면서 로그 파일을 기록하는 방식입니다. 스위치나 탭 장비를 통해 들어오는 패킷(인바운드 패킷)을 특정 포트로 미러링하여 스니퍼 서버에 연결시키고 서버 내 스니퍼가 패킷을 분석한 후 로그 파일을 기록합니다. 주로 웹서버가 많고 트래픽이 많은 대용량 사이트에서 사용하는 방식입니다.

그러나 포트 미러링과 같은 기술적인 문제가 해결되어야 하고, 암호화된 패킷은 스니핑이 어렵기 때문에 로그 파일에 기록할 수 없습니다.

웹분석 도구마다 측정 수치는 왜 다를까? - 1. 측정 수치 차이는 어디에서 시작되는가?
웹분석 도구마다 측정 수치는 왜 다를까? - 2. 로그에 기록되는 정보의 차이
웹분석 도구마다 측정 수치는 왜 다를까? - 3. 로그 수집방식의 차이
웹분석 도구마다 측정 수치는 왜 다를까? - 4. 로그 수집방식의 측정값 영향
웹분석 도구마다 측정 수치는 왜 다를까? - 5. 분석 알고리즘의 미묘한 차이
웹분석 도구마다 측정 수치는 왜 다를까? - 6. DB데이터의 차이

 

 

34105d05eeb817a50c26d4edcc32a642_1436174

 

 

  • 트위터로 보내기
  • 페이스북으로 보내기

모바일 페이지로 이동