06 - Metodi per la rilevazione dei dati di traffico
di Michele Diodati, 03 Dicembre 2002
L'articolo proviene da Diodati.org ed è stato riprodotto per gentile concessione dell'autore.
- BBM, browser-based measurement (misurazione basata sul browser)
- Site-centric measurement (misurazione centrata sul sito)
- User-centric measurement (misurazione centrata sull’utente)
BBM, browser-based measurement (misurazione basata sul browser)
Questo tipo di misurazione avviene sempre sulla base di dati registrati
in
Questo metodo di rilevazione offre alcuni indubbi vantaggi:
- Consente ad esempio di superare il problema - tipico delle misurazioni site-centric - di definire dei filtri omogenei per separare i tipi di file associabili ad una page view (HTML, ASP, ecc.) dai tipi di file non associabili (JPG, GIF, PNG, ecc.). Con il sistema dei page tag, infatti, solo i file che contengono l'apposito frammento di codice javascript sono in grado di generare una page impression. I responsabili tecnici del sito potranno così di volta in volta valutare se e dove inserire il codice in questione.
- Consente di eliminare l'incertezza legata alla non quantificabile interfenza di strumenti di caching interposti tra il server web ed i visitatori del sito. Infatti anche le pagine recuperate da cache locali, se dotate dell'opportuno page tag, invieranno al server deputato della registrazione dei log le chiamate necessarie a generare una page impression.
Per contro, la misurazione basata sul browser presenta anche degli svantaggi:
- In primo luogo, va tenuto presente che le statistiche di traffico generate con questo sistema riguardano solo ed esclusivamente le pagine in cui è stato inserito, e nel modo corretto, l'apposito page tag. Ciò significa che, laddove vi sia una realtà aziendale molto complessa - con molti siti da monitorare, moltissime pagine pubblicate e numerose persone addette al processo produttivo -, sarà molto difficile (per non dire impossibile) avere la certezza che la totalità delle pagine da sottoporre ad analisi statistica sia stata effettivamente modificata con l'inserimento dell'opportuno codice javascript. Si rischia cioè, con l'andar del tempo, di trovarsi di fronte ad un nuovo tipo di incertezza: di non sapere, cioè, se le rilevazioni del traffico browser-based di cui si è in possesso coprano la totalità degli accessi effettuati ai propri siti e siano perciò davvero attendibili.
- La presenza - per quanto minima e tendenzialmente non avvertibile - di un ritardo nel caricamento della pagina, dovuto alle chiamate HTTP aggiuntive presenti nel codice del page tag, indirizzate - nel caso che il servizio sia fornito da terzi - ad un server differente da quello che ospita il sito.
Esistono molti società che offrono servizi di rilevazione statistica basati sul browser, sia gratuiti sia a pagamento. Spesso la formula prevede un'offerta base gratuita ed una, più completa, a pagamento. Tra i fornitori di statistiche di tipo BBM citiamo FreeStats, Sitetracker, SuperStats di MyComputer.com, ShinyStat, Site Stats. Una menzione particolare merita RedSheriff, con sedi in oltre 30 nazioni, che sta assumendo un ruolo di primo piano a livello internazionale nella fornitura di servizi professionali BBM.
Site-centric measurement (misurazione centrata sul sito)
La fonte principale per questo tipo di rilevazione sono i file di log che registrano l'attività del server web. Il limite maggiore di tale metodo è da ricercarsi nella scarsa corrispondenza tra le registrazioni dei log e l'effettiva attività dei visitatori del sito. Vi sono infatti molti fattori che generano incertezza. Tra questi:
- la difficoltà di definire univocamente quali tipi di
file sono da considerare "
pagine" e quali no; - il caching delle pagine effettuato da proxy server, motori di ricerca, browser utente, ecc. Non vi è modo di sapere il rapporto esatto tra le page view registrate nei log e le pagine fornite dai vari sistemi di caching interposti tra server web ed utente finale;
- l'assegnazione di IP dinamici agli utenti da parte di server DHCP: non è possibile sapere né se visite successive eseguite da uno stesso IP provengano da una stessa persona né se visite successive, eseguite da IP differenti, provengano da persone diverse o da un medesimo utente a cui sia stato assegnato dinamicamente un nuovo IP.
Tra i vantaggi offerti dalle misurazioni site-centric c'è la possibilità di sottoporre i propri log file all'analisi di una società terza, avente funzioni di ente certificatore dei dati di traffico registrati. La certificazione riguarda essenzialmente due punti:
- l'autenticità delle registrazioni dell'attività del web server;
- l'accuratezza delle statistiche da esse derivate.
L'utilità commerciale di simili certificazioni è notevole, in quanto, conferendo un valore "quasi" oggettivo alle statistiche di traffico di un sito, aumenta di conseguenza la forza di contrattazione nella vendita di spazi pubblicitari: la certificazione infatti accresce la fiducia dell'acquirente nella possibilità di ottenere un numero di ad impression realmente commisurato al numero di page view dichiarato.
User-centric measurement (misurazione centrata sull'utente)
Questo tipo di misurazione è completamente differente dalle altre due. Non si tratta, infatti, di un'elaborazione statistica effettuata a partire dai dati registrati nei file di log; si tratta piuttosto di una vera e propria indagine di mercato, basata su elementi tipici del settore:
- un campione di popolazione significativo del tipo di utenza che si vuole misurare;
- uno strumento per la rilevazione del comportamento degli individui che compongono il campione, applicato ai loro computer ed in grado di monitorare attimo per attimo qualsiasi tentativo, riuscito o non riuscito, di navigazione su Internet;
- strumenti statistici studiati per effettuare proiezioni più o meno attendibili, che estendono alla totalità della popolazione i dati ricavati dall'analisi del campione.
La validità delle proiezioni di traffico ricavate per mezzo di indagini
di mercato è strettamente dipendente dalla significatività del
campione selezionato - che è evidentemente una variabile difficilmente
quantificabile - e dalla raffinatezza ed affidabilità degli
strumenti statistici adoperati.
Esistono diverse società che effettuano ricerche di questo tipo. Tra
esse citiamo Nielsen//NetRatings, Jupiter
MMXI, NetValue.
» Vai alla prossima lezione:
Conclusioni
» Torna all'indice del corso
al top nei motori






