[ [로그분석 Chapter#1 로그파일의개요] 로그파일의 종류 1 ]
로그파일의 종류 #1
- 로그파일의 개념
- 로그파일이란 웹서버를 통해 이루어지는 모든 작업들에 대한 기록이라고 펴현할 수 있다. 우리가 웹사이트를 방문한다는 것은 브라우저를 통해서 해당웹사이트의 웹서버에 필요한 정보를 요청하는것이고, 이때부터 방문정보, 활동내역, 활동시간등은 웹서버에 미리 저장해 놓은 위치에 데이터로 남게 된다.
- 웹서버에 미리 저장해 놓은 데이터는 이미지파일, 이미지데이터, Include파일등에 대한정보부터 방문시간, 대기시간, 링크에러정보, 로그인정보, 로그인시간, 페이지로딩 성공/실패여부등의 모든 정보를 표시할 수 있다.
- 서버별 로그파일의 형식
- 윈도우 서버
- 윈도우계열 서버는 Event Log라 불리는 로그기록 시스템을 가지고 있다. 총 3종류의 로그파일(Security Log, System Log, Application Log)을 생성하고있으며, 이는 로그분석 API를 이용하여 Log분석 및 응용분석을 할 수 있도록 되어있다. (이 Window API를 사용하면 실제분석도 가능하지만 새로운 형식의 로그파일 생성도 가능하다)
- 표 집어넣음 (윈도우에서 생성 가능한 로그파일)
- 또한 윈도우웹서버인 IIS(Internet Information Server)에서 제공해 주는 Web Log가 있다.
- 리눅스/유닉스
- 리눅스서버군에서 OS상의 대표적인 로그시스템은 사용자접속로그, 프로세스로그, 에러로그의 3가지로 되어있다. 또한 이 외에 웹서버운영 관련하여 웹로그로도 기록이 되며 가장많이 사용되는 웹서버로는 아파치웹서버의 경우 접속로그(Access Log, Error Log 및 Agent Log)의 3가지 형태의 로그를 기록하여 제공하고있다.
- 서버에 따른 웹로그파일의 구조
- 웹서버는 사용자가 웹사이트에 방문시 해당 웹사이트 대한 요청과 제공에 대한 기록을 모두 로그파일에 저장 및 제공하고있다. 따라서 로그파일을 보면 누가 언제 무엇을 요청했고 가져갔는지를 알 수 있으며, 웹서버에 얼마나 많은 사람들이 왔었고, 어디에서 왔으며, 어떤 페이지를 가장 오래 머무르고, 제일많이 웹사이트에를 떠난 페이지가 무엇인지, 가장 오래보는 페이지, 가장 많이보는 페이지등을 읽어 낼 수 있다.
- 이러한 로그파일은 웹서버가 지정하는 곳에 위치하며, 웹 서버 관리자가 웹서버를 설치시 로그파일 저장 위치와 기록방법등을 지정해 놓았으므로 그 위치와 저장형태를 확인해 두는 것이 좋다.
- 가장 많이 사용하는 웹서버 및 로그파일
- 웹서버 및 로그파일을 종류마다 각각 파일 형식이 틀리기에 웹로그형식이라고 하자.
- 아파치 로그파일
- 아파치 로그파일은 원래 CLF(Common Logfile Format) 또는 Extended CLF라고 하며, 이는 웹서버의 원조라 할 수 있는 NCSA계열의 웹서버에서 사용하는 파일형식이다.
- 아파치에서 사용하는 CLF로그파일의 형식은 다음과 같다.
- IIS 로그파일
- MS윈도우군서버는 IIS(internet Information Server)로 되어있다. 사용로그파일형식은 NCSA방식이며 이 방식은 파일의 기록기간을 단위별로 지정할 수 있다. 예를들어 일별, 주월, 월별로 기록기간을 설정할 수 있는 특징이 있다.
- IIS에서 사용하는 NCSA방식의 형식
Web Log의 형식은 텍스트로 되어 있어 대부분의 로그분석툴들이 이를 분석/응용할 수 있게 되어 있다. IIS에서 로그파일은 기간별(매일, 매주, 매월, 주단위)등으로 자동화되게끔 설정도 가능하다. 이를 기반으로 리포트도 가능하며, 응용분석프로그램도 많이 나와있다.
가장 많이 사용되는 웹로그형식은 아파치로그, IIS로그, W3C Extended가 있다.
(어려운 용어 다 외울 필요 없다 걍 있다는것만 알아두자)
123.141.135.10 - plan[07/Jun/2007:15:34:14-0630 *POST/iisadmin/default.html HTTP/1.0*2008401
설명: 123.141.135.10의 아이피를 가진 PC에서 plan이라는 이름으로 2007년 오후3시 34분 14초, 그리니치표준시로부터 6시간30분 떨어진 곳에서 POST방법으로 iisadmin/default.html을 요청하였으며 이는 HTTP버전 1.0프로토콜에 의해 페이지에러없이 조회가 되었고 총이동한 데이터는 8,401Byte이다
123.141.135.10 - 07-11-05-18:32:48 W3SVC SUN 1 123.141.135.88 5654 132 3454 200 0 Get 1.gif Mozilla/3.01Gold(WinXP-1)
설명: 123.141.135.10의 IP를 가진 방문자가 2007년 11월 5일 오후6시32분48초에 SUN이라는 이름과 123.141.135.88이라는 아이피를 가진 웹서버에 웹페이지를 요청했으며, 웹서버는 5,654msec(5.654초)동안 이것을 처리했으며 그동안 132Byte의 명령어를 사용했고, 결과값(페이지전송)을 3454Byte의 데이터를 에러없이(코드 200)방문자에게 전송했다. 여기에 사용된 HTTP명령방식은 GET이며 요청파일명은 1.gif이고 마지막으로 사용된 프로토콜은 Mozilla/3.01Gold(WinXP-1)이다.




