Communicatie.net
Bureau voor online communicatie

Wat is een logfile?

Een logfile is een tekstbestand waar de (web)server informatie over de bezoekers van uw website naar wegschrijft. Zo'n logfile bestaat doorgaans uit drie delen.


Eerste deel

In dit deel staat informatie over de browser die uw bezoeker gebruikt. En omdat ook het besturingssysteem wordt weergegeven weet u tevens welke hardware de betreffende websurfer gebruikt. Een regel uit dit deel van het logfile ziet er zo uit:

Mozilla / 5.0 (Windows NT 6.3;) WOW64; Trident / 7.0; Touch; MASEJS; rv:11.0

Uit de bovenstaande tekst valt op te maken dat de bezoeker gebruik maakt van een PC met daarop Windows 8.1 in combinatie met Internet Explorer versie 11. De twee bezoekers hieronder daarentegen surfen met respectievelijk Firefox op een Apple desktop (met Mac OS X) en Safari op een HTC One smartphone (met Android).

Mozilla / 5.0 (Macintosh; Intel Mac OS X 10.9; rv:30.0) Gecko / 20100101 Firefox / 30.0
Mozilla / 5.0 (Linux; U; Android 4.4.2; nl-nl; HTC_One Build / KOT49H) AppleWebKit / 534.30 (KHTML, like Gecko) Version / 4.0 Mobile Safari / 534.30


Tweede deel

Het tweede deel van het logfile is verreweg het meest interessant: hierin staat een compleet overzicht van alle bestanden die van uw site zijn opgevraagd. Een regel uit dit deel van het logfile ziet er zo uit:

st-a1543.chem.tue.nl - - [15/Jul/2014:17:48:01 +0100] "GET /binnenhof.html HTTP / 1.1" 200 9255

Wat zegt deze regel? Om te beginnen kunnen we zien waar iemand vandaan komt. In dit geval gaat het om een medewerker of student van de Technische Universiteit Eindhoven (TUE). Hij of zij bekeek op 15 juli om twaalf minuten voor zes op www.cijfers.net de webpagina binnenhof.html.

HTTP/1.1 geeft aan welk protocol gebruikt werd voor het versturen van de pagina, namelijk: HyperText Transfer Protocol versie 1.1. De code 200 betekent dat het bestand goed is aangekomen. Er kan ook een andere code staan: zo betekent 404 dat een pagina niet is aangekomen omdat deze niet (meer) op de website staat. Het getal 9255 tenslotte geeft het aantal verzonden bytes weer. Dit getal komt dus overeen met de omvang (uitgedrukt in bytes) van de betreffende webpagina.


Derde deel

Uit het laatste deel van het logfile kunt u opmaken waar uw bezoeker vandaan kwam vóórdat hij of zij uw website betrad. Om die reden wordt dit deel van het logfile "referer" genoemd. Hieronder een klein deel van het logfile van (opnieuw) www.cijfers.net:

"GET /bevolking.html HTTP / 1.1" 200 12997 "http://nl.wikipedia.org/ wiki/ Wereldbevolking"

Uit deze regel blijkt dat op de Nederlandse Wikipedia een hyperlink naar een artikel over de wereldbevolking (bevolking.html) op www.cijfers.net staat.

Dit soort informatie is bijzonder nuttig, maar ook zeer privacygevoelig. Nuttig, omdat u bijvoorbeeld kunt zien wat er over uw site geschreven wordt. Gevoelig, omdat de gebruiker, vaak zonder het te weten, een deel van zijn of haar surfgedrag prijsgeeft. Als iemand rechtstreeks van een sekssite naar uw website komt kunt u dat in uw logfile zien! Overigens is daarmee natuurlijk nog niet de identiteit van die bezoeker bij uw bekend.

Tenslotte kunt u aan dit deel van het logfile ook zien in welke zoekprogramma's uw site staat en (soms, maar niet altijd) met behulp van welke zoekwoorden uw site gevonden wordt.

http://www.bing.com/ search? q=cijfers & qs= n& form= QALH& filt= all & pq= cijfers & sc= 8-7 & sp= -1 & sk= & cvid= 5afa843322be 4993ae 505cc 39aega 610
http://www.google.nl/ url? sa= t & rct= j & q= & esrc= s & frm= 1 & source= web & cd= 1 & sqi= 2 & ved= 0CDAQGjAA & url= http%3A%2F%2F www.cijfers.net%2Findex.html & ei= su DIU8eo F8Gr O9fkg HA & usg=AFQj CMFu- q6FJMO cw_jlrnyigo 94AMx ZYA
http://r.search.yahoo.com/ _ ylt= A0LEWwv J4ch T3BUAg YZXNyo A; _ ylu= X3o EMTE zd GR p ZjZu BHNlY w Nzcg Rwb3 MDMw Rjb2xv A2Jm MQR2d GlkA1ZJVDQ2N 18x / RV= 2/RE= 1405702730 / RO= 10 / RU= http%3a%2f%2f www.cijfers.net%2findex.html / RK= 0/RS= Sz ZPKV5ggvacghu 58FK1 l GSzdYw-

In de bovenstaande regels ziet u steeds het zoekprogramma (resp. Bing, Google en Yahoo!), het woord waarop werd gezocht (cijfers), de website die werd gevonden (cijfers.net) en een speciale code van de search engine.