05 - Profilazione degli utenti e concetti collegati
di Michele Diodati, 03 Dicembre 2002
L'articolo proviene da Diodati.org ed è stato riprodotto per gentile concessione dell'autore.
- Clickstream analysis
- Data mart
- Data mining
- Data warehouse
- OLAP, online analytical processing
- Profiling (profilazione)
- Profiling esplicito
- Profiling implicito
Clickstream analysis
È l'analisi della serie registrata di clic del mouse, ovvero di scelte di navigazione effettuate dagli utenti di un sito. Costituisce uno degli elementi fondamentali del processo di profilazione degli utenti.
Data mart
È un database contenente dati raccolti in vista di un uso specifico. Può essere un sottoinsieme di un data warehouse, ma, rispetto al carattere generico di quest'ultimo, l'accento - in un data mart - è posto sulla capacità di venire incontro alle esigenze di particolari gruppi di utenti in termini di dati raccolti, presentazione delle informazioni, semplicità d'uso.
Data mining
È l’esame complessivo dei dati raccolti sull'attività dei propri utenti/clienti, tendente a trovare nei loro comportamenti correlazioni significative da un punto di vista commerciale. Costituisce pertanto una parte del complesso procedimento di profilazione degli utenti. I risultati a cui può giungere l'attività di data mining sono molteplici:
- associazioni - due eventi si verificano spesso insieme (ad esempio chi compra delle scarpe tende ad acquistare anche dei calzini);
- sequenze - due eventi successivi sembrano legati da una relazione di causa-effetto (chi compra un mouse su Internet, tempo dopo acquista anche un tappetino);
- classificazioni - il riconoscimento di un ordine in una serie di eventi, con la conseguente riorganizzazione dei dati in proprio possesso;
- raggruppamenti - la ricerca e la presentazione di gruppi di fatti non precedentemente noti;
- previsioni - lo studio della probabile evoluzione futura della propria attività in base alle risultanze dei dati raccolti.
Data warehouse
Si definisce così la base dati centrale di un'azienda o di un suo settore di attività. È il serbatoio in cui confluiscono, spesso da numerose e differenti fonti, tutti i dati grezzi suscettibili di future elaborazioni. La massa di dati in esso contenuta rimane poco significativa, ai fini ad esempio della pianificazione commerciale dell'attività, finché questo insieme "bruto" di dati non viene filtrato ed analizzato da apposite applicazioni, per mezzo di una specifica attività di data mining.
OLAP, online analytical processing
Si tratta di applicazioni che, agendo su una base dati preesistente, consentono agli analisti di estrarre e correlare i dati in modo da generare una grande varietà di punti di vista e di associazioni. L'attività di data mining, descritta al punto precedente di questo glossario, è resa possibile appunto da applicazioni di tipo OLAP, le quali conservano i propri dati in database multidimensionali, così detti per distinguerli dai più comuni database relazionali. Mentre questi ultimi possono essere descritti come strutture bidimensionali, cioè piatte, nelle quali l'organizzazione delle informazioni sta nello schema di righe e colonne delle tabelle che li compongono, i database multidimensionali vanno associati piuttosto all'immagine di un solido, tipicamente un cubo, che simboleggia il fatto che ogni tipo di informazione presente in simili database può divenire il perno, ovvero la dimensione di riferimento, per una serie di associazioni con altri dati.
Profiling (profilazione)
È l'attività per mezzo della quale una serie complessa di dati relativi ad utenti/clienti viene elaborata da specifici programmi - come ad esempio l'Observation Management Server del notissimo Vignette - per generare alla fine la segmentazione della propria utenza in gruppi omogenei di comportamento. I dati che possono essere presi in considerazione per la profilazione sono molteplici. Tra questi citiamo:
- la serie delle scelte di navigazione effettuate sul sito in esame dagli utenti unici identificati;
- la dichiarazione esplicita di preferenze e interessi ottenuta tramite procedure di registrazione o sondaggi;
- la raccolta di dati demografici;
- la risposta degli utenti identificati a promozioni o a contenuti particolari.
I sistemi di profilazione più avanzati mettono a disposizione del settore commerciale di un'azienda la possibilità di segmentare in gruppi la propria utenza sia manualmente, scegliendo i parametri da prendere in considerazione, sia automaticamente, in base alle capacità native del software utilizzato. In entrambi i casi, il valore aggiunto è dato dalle molteplici correlazioni che è possibile istituire tra i dati raccolti, al fine di ricavarne informazioni commercialmente utili. Ecco a titolo esemplificativo alcune di queste correlazioni:
- Content affinities (affinità di contenuto) - gli insiemi di contenuti che tendono ad essere visti insieme dagli utenti del sito esaminato;
- Content effectiveness (efficacia dei contenuti) - per i siti di commercio in Rete, i contenuti che tendono ad essere visti in sessioni-utente che si concludono con un acquisto;
- Product affinities (affinità di prodotto) - sempre per i siti di commercio in Rete, l'elenco dei prodotti che sono più spesso acquistati insieme.
Profiling esplicito
Si ottiene per mezzo di un'apposita procedura di registrazione, che implica l'invio tramite un modulo di dati personali da parte dell'utente. I dati inviati, archiviati in un' apposita base dati, forniranno una serie di parametri utili a segmentare in gruppi omogenei la totalità degli utenti registrati.
Profiling implicito
È il tracciamento del comportamento di utenti anonimi nel corso delle loro visite ad un sito. Il tracciamento può avvenire sia tramite IP sia tramite cookie. L'insieme delle scelte di navigazione effettuate alimenta una base dati, da cui appositi programmi possono estrarre associazioni e correlazioni, in grado di segmentare la totalità degli utenti tracciati in gruppi omogenei.
» Vai alla prossima lezione: Metodi
per la rilevazione dei dati di traffico
» Torna all'indice del corso
al top nei motori






