PRIMA PAGINA

07 Conclusioni

Al termine della lettura di questo glossario, dovrebbe essere ormai chiaro che la rilevazione del traffico web è una "scienza" giovane, che si scontra con una serie di ostacoli oggettivi, che influiscono per ora piuttosto seriamente sull'affidabilità dei dati registrati.

Tra i tre sistemi di rilevazione analizzati nella pagina precedente è difficile dire quale sia il più attendibile, dal momento che ognuno di essi presenta vantaggi e svantaggi. Nel caso di siti con un numero non eccessivamente ampio di pagine, o di siti con una gestione centrale ben organizzata, la rilevazione di tipo BBM sembra essere la soluzione migliore, dal momento che permette di superare in buona parte le notevoli incertezze legate, nel caso della rilevazione site-centric, all'impossibilità di quantificare l'influenza di fattori quali caching, DHCP, NAT, ecc.

Al contrario, nel caso di domini contenenti una notevole quantità di siti, forse la soluzione migliore rimane la rilevazione site-centric, basata sull'analisi dei file di registro, magari certificata da una società specializzata. Quando infatti le pagine da monitorare sono migliaia - e se ne aggiungono di nuove ogni giorno, e le persone coinvolte nell'aggiornamento sono numerose e disperse, non esistendo un gestione centralizzata - diventa un fattore critico avere la certezza che i dati statistici registrati riguardino la totalità delle pagine esistenti e non una percentuale indefinibile delle stesse. I file di registro, conservando la totalità delle transazioni HTTP effettuate dai server web del dominio, consentono appunto di avere questa certezza. Anche se non bisogna dimenticare che tali registrazioni sono soprattutto uno strumento per la diagnosi dell'attività del server piuttosto che una fotografia oggettiva del numero degli utenti connessi e dei loro comportamenti di navigazione.

Per quanto riguarda il terzo sistema, cioè l'analisi a campione delle navigazioni effettuate dagli utenti, bisogna dire che il ricorso a questo strumento di inferenza statistica - essendo notevolmente costoso - non è alla portata di tutte le società presenti su Internet. La stessa affidabilità dei dati prodotti dall'analisi dipende fortemente dalla rappresentatività del campione selezionato e dalla validità degli strumenti tecnico-matematici utilizzati.

In definitiva, si potrebbe concludere che le rilevazioni statistiche del traffico generato da un sito, più che essere prese in se stesse come numeri assoluti, dovrebbero essere prese in senso relativo, cioè come rapporto proporzionale esistente tra le visite ricevute dalle differenti pagine di un sito. Voglio dire che, se il sistema di rilevazione adoperato ci dice che due pagine di uno stesso sito ricevono l'una 1000 visite al mese e l'altra 200, è sì molto probabile che il numero effettivo di volte in cui qualcuno ha caricato le due pagine sia più o meno differente da quello registrato dalle statistiche, ma è altresì molto probabile che il rapporto tra le volte in cui la prima pagina è stata caricata e le volte in cui è stata caricata la seconda sia prossimo a quel 5:1 rilevato dal sistema di misurazione in uso. Ciò pur con tutte le precauzioni del caso, dovute alla possibile influenza di diversi fattori non precisamente quantificabili.

Dall'analisi di simili informazioni, i gestori di un sito possono trarre una serie di conclusioni utili a migliorare la struttura e i contenuti delle proprie pagine web, anche se rimane relativamente inconoscibile il numero reale di visitatori in un certo arco di tempo.

Vai al sommario
Scrivi a info@diodati.org
Aggiornato Wednesday, 11-Sep-2002 11:45:22 CEST

inizio pagina