06 Metodi per la
rilevazione dei dati di traffico
- BBM, browser-based measurement (misurazione
basata sul browser)
- Questo tipo di misurazione avviene sempre sulla base di dati registrati in
file di log, ma la generazione dei log non è più determinata dall’attività del
server web bensì dal caricamento nel browser dell’utente di un apposito
frammento di codice, denominato page tag. Si tratta in genere di alcune righe
contenenti un javascript, il cui compito è di inviare una richiesta HTTP al
server addetto alla registrazione del traffico-web, per informarlo che è stata
generata una page impression (1).
Questo metodo di rilevazione offre alcuni indubbi vantaggi:
-
Consente ad esempio di superare il problema – tipico delle
misurazioni site-centric - di definire dei filtri omogenei per separare i tipi di file
associabili ad una page view (HTML, ASP, ecc.) dai tipi di file
non
associabili (JPG, GIF, PNG, ecc.). Con il sistema dei page tag, infatti, solo
i file che contengono l’apposito frammento di codice javascript sono in grado
di generare una page impression. I responsabili tecnici del sito potranno così
di volta in volta valutare se e dove inserire il codice in questione
(2).
- Consente di eliminare l’incertezza legata alla non quantificabile interfenza
di strumenti di caching interposti
tra il server web ed i visitatori del sito.
Infatti anche le pagine recuperate da cache locali, se dotate dell’opportuno
page tag, invieranno al server deputato della registrazione dei log le
chiamate necessarie a generare una page impression.
Per contro, la misurazione basata sul browser presenta anche degli svantaggi:
-
In primo luogo, va tenuto presente che le statistiche di traffico generate con
questo sistema riguardano solo ed esclusivamente le pagine in cui è stato
inserito, e nel modo corretto, l’apposito page tag. Ciò significa che, laddove
vi sia una realtà aziendale molto complessa - con molti siti da monitorare,
moltissime pagine pubblicate e numerose persone addette al processo produttivo
–, sarà molto difficile (per non dire impossibile) avere la certezza che la
totalità delle pagine da sottoporre ad analisi statistica sia stata
effettivamente modificata con l’inserimento dell’opportuno codice javascript.
Si rischia cioè, con l’andar del tempo, di trovarsi di fronte ad un nuovo tipo
di incertezza: di non sapere, cioè, se le rilevazioni del traffico
browser-based di cui si è in possesso coprano la totalità degli accessi
effettuati ai propri siti e siano perciò davvero attendibili
(3).
- La presenza – per quanto minima e tendenzialmente non avvertibile – di un
ritardo nel caricamento della pagina, dovuto alle chiamate HTTP aggiuntive
presenti nel codice del page tag, indirizzate – nel caso che il servizio sia
fornito da terzi – ad un server differente da quello che ospita il sito.
Esistono molti società che offrono servizi di rilevazione statistica
basati sul browser, sia gratuiti sia a pagamento. Spesso la formula prevede
un’offerta base gratuita ed una, più completa, a pagamento. Tra i fornitori di
statistiche di tipo BBM citiamo
FreeStats,
Sitetracker, SuperStats di
MyComputer.com,
ShinyStat,
Site Stats. Una menzione particolare
merita RedSheriff, con sedi in oltre 30
nazioni, che sta assumendo un ruolo di primo piano a livello internazionale
nella fornitura di servizi professionali BBM.
- Site-centric measurement (misurazione
centrata sul sito)
- La fonte principale per questo tipo di rilevazione sono i
file di log che
registrano l’attività del server web. Il limite maggiore di tale metodo è da
ricercarsi nella scarsa corrispondenza tra le registrazioni dei log e
l’effettiva attività dei visitatori del sito. Vi sono infatti molti fattori
che generano incertezza. Tra questi:
-
la difficoltà di definire univocamente quali tipi di file sono da considerare
“pagine” e quali no;
- il caching delle pagine effettuato da
proxy server, motori di ricerca, browser
utente, ecc. Non vi è modo di sapere il rapporto esatto tra le page view
registrate nei log e le pagine fornite dai vari sistemi di caching interposti
tra server web ed utente finale;
- l’assegnazione di IP dinamici agli utenti da parte di server
DHCP: non è
possibile sapere né se visite successive eseguite da uno stesso IP provengano
da una stessa persona né se visite successive, eseguite da IP differenti,
provengano da persone diverse o da un medesimo utente a cui sia stato
assegnato dinamicamente un nuovo IP.
Tra i vantaggi offerti dalle misurazioni site-centric c’è la possibilità di
sottoporre i propri log file all’analisi di una società terza, avente funzioni
di ente certificatore dei dati di traffico registrati
(4). La certificazione
riguarda essenzialmente due punti:
-
l’autenticità delle registrazioni dell’attività del web server;
- l’accuratezza delle statistiche da esse derivate.
L’utilità commerciale di simili certificazioni è notevole, in quanto,
conferendo un valore “quasi” oggettivo alle statistiche di traffico di un
sito, aumenta di conseguenza la forza di contrattazione nella vendita di spazi
pubblicitari: la certificazione infatti accresce la fiducia dell’acquirente
nella possibilità di ottenere un numero di ad impression realmente commisurato
al numero di page view dichiarato.
- User-centric measurement (misurazione
centrata sull’utente)
- Questo tipo di misurazione è completamente differente dalle altre due. Non
si tratta, infatti, di un’elaborazione statistica effettuata a partire dai
dati registrati nei file di log; si tratta piuttosto di una vera e propria
indagine di mercato, basata su elementi tipici del settore:
-
un campione di popolazione significativo del tipo di utenza che si
vuole misurare;
- uno strumento per la rilevazione del comportamento degli individui che
compongono il campione, applicato ai loro computer ed in grado di monitorare
attimo per attimo qualsiasi tentativo, riuscito o non riuscito, di navigazione
su Internet;
- strumenti statistici studiati per effettuare proiezioni più o meno
attendibili, che estendono alla totalità della popolazione i dati ricavati
dall’analisi del campione.
La validità delle proiezioni di traffico ricavate per mezzo di indagini di
mercato è strettamente dipendente dalla significatività del campione
selezionato – che è evidentemente una variabile difficilmente quantificabile –
e dalla raffinatezza ed affidabilità degli strumenti statistici adoperati.
Esistono diverse società che effettuano ricerche di questo tipo. Tra esse
citiamo Nielsen//NetRatings,
Jupiter MMXI,
NetValue.
(1) Si parla in questo caso di page
impression e non di page view per analogia con il meccanismo di registrazione di
un ad impression: la presenza cioè nella pagina HTML di un frammento di codice
specificamente destinato a generare la registrazione di un accesso in un
file di log.
(2) I filtri applicabili ai file di
log di un web server di solito includono o escludono dalla registrazione
un’intera categoria di file, anche se è comunque possibile personalizzare i
filtri, in modo tale da creare per ogni categoria le opportune eccezioni. In
ogni caso, agire tramite filtri sulle registrazioni dei log, allo scopo di tener
conto quotidianamente della mutevole struttura delle pagine e dei contenuti di
un sito, richiede sicuramente più attenzione e lavoro che non decidere, caso per
caso, di includere oppure no in una nuova pagina il codice javascript che
determina la registrazione di una page impression.
(3) Si potrebbe pensare di fugare i
dubbi incrociando i dati di traffico browser-based con i dati ricavati dai
normali file di log. Va tenuto presente, però, che tale comparazione è
estremamente difficile e tutto sommato poco attendibile: infatti i dati relativi
all’attività del web server sono influenzati in una misura non quantificabile da
una serie di fattori di incertezza (proxy, caching, IP dinamici), che si
riverberano inevitabilmente sulla possibilità di confrontare in modo utile i
dati statistici provenienti dalle due fonti.
(4) Per la Gran Bretagna e l’Irlanda
questa funzione è svolta da ABC Electronic.
Le sue certificazioni avvengono sulla base di una serie di standard definiti da
un consorzio volontario di aziende, lo IFABC (International Federation of Audit
Bureaux of Circulations). Le definizioni dei dati standard soggetti a
rilevazione sono consultabili in Rete alla pagina
http://www.ifabc.org/web/index.html.
Leggi
Conclusioni
Vai al
sommario
Scrivi a
info@diodati.org
Aggiornato Wednesday, 11-Sep-2002 10:56:26 CEST
inizio
pagina