Le fasi della gestione dei dati in una Headless CDP

Al giorno d’oggi, le aziende investono sempre più in nuove tecnologie in grado di raccogliere e aggregare vari tipi di dati per rendere il lavoro più agile ed efficiente. Tuttavia, quando si utilizza uno stack tecnologico complesso, spesso sorgono sfide significative, come:

L’impossibilità di gestire i dati centralmente perché organizzati in silos che non comunicano tra loro, con conseguente duplicazione delle informazioni e aumento della manutenzione per la pulizia e l’aggiornamento.
La creazione di segmenti di pubblico incompleti e inaffidabili a causa della dispersione delle informazioni.
La difficoltà, se non l’impossibilità, di integrare diverse piattaforme, il che porta a problemi nell’attivazione dei dati per la creazione di campagne di marketing personalizzate ed efficaci.

Queste sfide spingono molte aziende ad adottare una Customer Data Platform (CDP).

Una CDP può raccogliere, unificare e gestire dati di prima e terza parte in un unico data warehouse, fornendo una visione a 360 gradi dei propri clienti. Ciò consente alle organizzazioni di ottenere la business intelligence necessaria per aumentare le vendite, fidelizzare i clienti e prendere decisioni strategiche basate sui dati.

Vuoi implementare questa strategia?

I nostri modelli di IA possono aiutarti a raggiungere questi risultati in settimane, non in mesi.

Scopri come

In un affascinante podcast di Humans of Martech, Michael Katz ricorda gli 8 passaggi essenziali che costituiscono una Customer Data Platform, come riportato da Arpit Choudhury nella sua serie di articoli sulle Customer Data Platform:

Customer Data Infrastructure
ETL (Extract, Transform, Load)
Storage
Identity Resolution
Segmentazione del pubblico
Reverse ETL
Qualità dei dati
Data Governance e conformità alla privacy

Ognuna di queste fasi rappresenta una sfida sia dal punto di vista tecnologico che strategico-etico. Esploriamo insieme quelle che consideriamo più significative nel contesto di una soluzione che sfrutta la potenza del Cloud Data Warehouse invece di una tradizionale Customer Data Platform, ovvero:

CDI (Customer Data Infrastructure)
ETL (Extract, Transform, Load) e Data Ingestion
Identity Resolution
Segmentazione del pubblico
Reverse ETL

Customer Data Infrastructure (CDI)

Questa fase comprende tutte le attività di acquisizione dei dati degli utenti. All’interno della CDI (Customer Data Infrastructure), sono inclusi tutti gli strumenti e le strategie di raccolta, a partire dal tracciamento degli analytics e dei pixel pubblicitari, proseguendo con la convergenza dei dati all’interno dei sistemi CRM, fino ad arrivare a soluzioni di raccolta più avanzate come le carte fedeltà nei punti vendita, i dati geolocalizzati o i dati sintetici.

Questa fase è spesso sottovalutata e affrontata in modo inverso rispetto al flusso di lavoro ideale. L’approccio comune tende a essere “raccogli prima i dati, poi capisci come usarli”, e questo porta spesso a difficoltà nella successiva unione o all’assenza di dati fondamentali. Un esempio classico è non esporre nel tracciamento online i dati tipici del mondo fisico, come gli identificativi utente, il che rende poi impossibile correlare i due comportamenti.

Una solida Customer Data Infrastructure parte dalle esigenze e dagli obiettivi aziendali, copre l’intero customer journey e punta a una raccolta dati etica e robusta.

In questa fase, è spesso essenziale adottare un approccio lean, tracciando in modo esteso ma solo ciò che è necessario. Questo approccio aiuta a dissipare l’illusione di tracciare tutti i dati e garantisce che solo i dati con uno scopo chiaro confluiscano nei sistemi aziendali.

ETL (Extract, Transform, Load) e Data Ingestion

L’ETL è il secondo passo nel percorso dei dati utente e comprende tutti i processi che portano all’estrazione dei dati, alla trasformazione in un formato comune e al caricamento nel data warehouse.

Durante questa fase, le aziende incontrano spesso problemi con la trasformazione dei dati, la perdita di dati durante l’ingestion e la necessità di mantenere la coerenza dei dati. Questi problemi derivano frequentemente da approcci non ottimali nella fase iniziale, dove vengono raccolte grandi quantità di dati incoerenti e poco strutturati, lasciando la responsabilità dell’ingestion alla fase ETL, rendendo difficile la risoluzione dei problemi alla fonte.

Anche in questa fase, partire da obiettivi di business snelli permette di stabilire modelli e strutture di dati definiti, oltre a uno scopo chiaro. Ciò semplifica la comprensione di come le tabelle debbano essere correlate e il formato ottimale dei dati, rendendo il lavoro ETL semplice e robusto e garantendo la presenza di un Data Warehouse snello, efficiente e manutenibile.

Identity Resolution

In questa fase, l’identità di un utente viene tracciata attraverso varie piattaforme utilizzando identificatori unici. Questo processo è fondamentale per il concetto stesso di Customer Data Platform. Innanzitutto, sposta l’attenzione dai canali all’utente, rendendo ampiamente disponibili azioni mirate e di fidelizzazione. Inoltre, permette di abbattere i silos aziendali e di ottenere una visione reale e unificata del comportamento e dell’interazione dell’utente.

Ciò che rende complessa l’identity resolution è che un’entità può avere più identificatori associati. Questi identificatori possono variare in base alla fonte o al sistema da cui provengono. Ad esempio, una persona può avere un identificatore basato sul numero di telefono in un sistema, un altro basato sull’indirizzo email in un altro sistema, e così via. La gerarchia degli ID implica l’organizzazione di questi identificatori in una struttura o sequenza logica che determina quali siano più affidabili o prioritari rispetto ad altri.

La parte cruciale dell’identity resolution è il collegamento di questi identificatori tra loro. Questo può essere fatto attraverso varie tecniche, come l’analisi delle somiglianze tra gli identificatori, la verifica dell’uguaglianza tra di essi o l’uso di algoritmi di correlazione avanzati. L’obiettivo è connettere o mappare diversi identificatori a un identificatore primario o unico per l’entità in questione.

La Bytek Prediction Platform risolve questo problema assistendo nella configurazione di un identificatore unico fin dalla fase di raccolta dati, assicurando che l’intero processo rimanga coerente e razionale. Questo approccio aiuta a evitare complesse attività di modellazione e riconciliazione che possono essere costose e risultare in una bassa qualità dei dati.

Una volta completata la fase di identity resolution, puoi avere la certezza di avere una visione a 360 gradi dell’utente. Di conseguenza, tutti i modelli e i segmenti che applichi possono essere attribuiti al singolo utente, liberando tutto il potenziale dell’automazione e della personalizzazione nell’esperienza utente.

Segmentazione del pubblico

Gli utenti vengono divisi in gruppi omogenei in base a criteri quali interessi, comportamenti o dati demografici. Questo processo consente di personalizzare le strategie di marketing in base alle esigenze e alle preferenze di ciascun gruppo.

Iniziamo distinguendo due processi che a volte vengono confusi ma che sono piuttosto diversi: segmentazione e clustering.

Per segmentazione intendiamo la divisione della nostra base clienti in segmenti. Di solito, questa attività si basa su criteri qualitativi e decisioni aziendali. I segmenti di pubblico creati non considerano la “somiglianza” tra gli utenti, che può essere presa in considerazione utilizzando tecniche di clustering statistico. Il significato è indubbiamente forte, ma il valore statistico è basso, il che porta a una scarsa affidabilità dei dati e a difficoltà nell’utilizzare il segmento per il retargeting o l’analisi degli insight.

Il clustering, d’altra parte, è un’analisi statistica che permette di dividere un pubblico in gruppi di utenti “simili” in base ai parametri che stiamo utilizzando. Ad esempio, possiamo produrre un’analisi RFM con l’obiettivo di identificare clienti ad alto potenziale, clienti frequenti ma con bassa spesa e top customer. Utilizzando tecniche di clustering come K-Means, raggrupperemo gli utenti in segmenti efficaci e significativi, assegnando l’etichetta corretta e monitorando statisticamente quando il nostro clustering continua ad avere una buona coerenza.

Spesso, la segmentazione degli utenti soffre di problemi che ne compromettono completamente l’efficacia. Approfondiamo i più comuni:

Appartenenza errata al gruppo

Ciò accade tipicamente quando non utilizziamo metodologie di segmentazione statistica o quando i dati in entrata sono imprecisi. Nel primo caso, siamo stati troppo arbitrari nel creare il segmento di pubblico, includendo utenti che probabilmente non appartengono direttamente a quel gruppo. L’esempio classico è l’inclusione di utenti nella categoria “Top Clients” che non sono attualmente i migliori clienti dell’azienda, ma che riceveranno comunque messaggi e promozioni come se lo fossero.

Nel secondo caso, il problema non risiede nel sistema di segmentazione ma nella raccolta dei dati: potremmo aver perso alcune transazioni importanti a causa di problemi di tracciamento o dati gestiti male da una particolare fonte. Di conseguenza, un cliente molto importante potrebbe finire in un cluster di valore inferiore e non beneficiare appieno di tutte le strategie a lui dedicate.

Il problema di avere un gruppo di dimensioni troppo ridotte

Un altro errore comune nella segmentazione è la tendenza a creare gruppi troppo piccoli per essere statisticamente significativi e utilizzabili sulle piattaforme pubblicitarie.

Se vogliamo assicurarci che le nostre strategie di marketing sfruttino al meglio il potenziale della segmentazione, i nostri gruppi devono avere dimensioni tali da poter essere targettizzati sia nelle campagne sulle piattaforme pubblicitarie che all’interno dei nostri sistemi di marketing diretto.

Per quanto riguarda le piattaforme pubblicitarie, dobbiamo considerare i limiti della privacy e i limiti effettivi di erogazione. Il primo limite è un metodo di protezione delle piattaforme volto a impedire loro di identificare facilmente i singoli utenti caricati sulle loro piattaforme e quindi di avere accesso alle informazioni senza il loro consenso. La protezione è assolutamente necessaria, ma pone una sfida di targeting. Dobbiamo sempre essere in grado di creare audience di almeno 800/1000 utenti se vogliamo garantire l’attivazione tramite Meta o Google.

Dobbiamo anche ricordare che non tutti gli utenti saranno riconosciuti quando invieremo questi segmenti alle piattaforme. Le percentuali di corrispondenza variano significativamente da settore a settore e possiamo verificare solo a posteriori se le nostre strategie di segmentazione stiano effettivamente creando audience utilizzabili.

Anche nel caso di campagne di marketing diretto, avere la giusta dimensione del pubblico è importante. Avere segmenti con 1-2 utenti non è vantaggioso in termini di aggregazione e automazione e può impedirci di inviare messaggi efficaci.

La limitata rilevanza della segmentazione per le strategie di marketing

Spesso, le attività di segmentazione vengono svolte senza considerare la strategia di marketing e gli obiettivi di business. Tipicamente, le aziende sono divise in silos e la segmentazione viene eseguita dal team IT/Data Science o dal team Marketing.

Questa divisione dei ruoli porta spesso a segmenti che non sono perfettamente allineati con la strategia e, quindi, difficili da usare. Ad esempio, avere un segmento di clienti frequenti potrebbe non essere sempre strategico se il nostro obiettivo finale non è aumentare il numero di top client ma far crescere la base clienti.

Nel caso di segmenti basati su dati demografici o interessi, la questione diventa ancora più delicata. Fornire dati sul genere o sull’età è un’attività standard che spesso comporta complessità e sfide legate al GDPR, anche se potrebbe non esserci una campagna che consideri questa segmentazione.

Solo il coinvolgimento attivo dei professionisti del business nel progetto di Customer Data Enrichment garantisce che il pubblico sia in linea con le esigenze strategiche e sia immediatamente applicabile.

La bassa somiglianza tra gli individui all’interno del gruppo

Come abbiamo visto all’inizio, una segmentazione manuale che non considera un approccio statistico rischia di includere in certi cluster utenti che non sono effettivamente simili agli altri. Sebbene questa flessibilità possa essere molto apprezzata da un punto di vista strategico, non è raro vedere che l’uso di audience costruite in questo modo porti a scarse performance delle campagne a causa di un’errata segmentazione del pubblico.

Reverse ETL

Il processo di reverse ETL è una parte cruciale della capacità di una CDP di integrarsi in un ecosistema di marketing e di attivare efficacemente la segmentazione e l’arricchimento dei dati dei clienti.

Il processo inverso parte dalla single-source-of-truth, il data warehouse creato durante la fase ETL, ed estrae i dati per integrarli nelle piattaforme di attivazione come CRM, piattaforme di Marketing Automation e piattaforme PPC (Google, Meta, TikTok).

Il processo di reverse ETL è l’unico responsabile della creazione di query efficienti e integrazioni stabili per garantire che i dati fluiscano correttamente e permettano al team di marketing di ottenere i massimi risultati.

Tuttavia, spesso non basta avere query ben strutturate. Dobbiamo concentrarci sulle esigenze specifiche di una campagna o di un percorso di automazione per garantire che il flusso di dati possa essere attivato con una strategia chiara e d’impatto.

La Bytek Prediction Platform è costruita su questo presupposto, trasformando il paradigma dei dati non solo a livello tecnico ma, cosa più importante, a livello strategico.

Abbiamo già sviluppato strategie di attivazione e miglioramento delle performance come l’enriched bidding e, grazie alle nostre strategie, possiamo invertire il flusso dei dati ed esporre tutti i dati necessari affinché piattaforme come Google Ads possano sfruttare i dati di prima parte e migliorare significativamente le performance delle campagne.

Questo processo è reso possibile da una vasta esperienza nella raccolta e integrazione dei dati di marketing, oltre a una profonda comprensione delle dinamiche del marketing digitale.

In questo modo, il processo di Reverse ETL può essere descritto come veramente end-to-end.

Le fasi della gestione dei dati in una Headless CDP

Vuoi implementare questa strategia?

Customer Data Infrastructure (CDI)

ETL (Extract, Transform, Load) e Data Ingestion

Identity Resolution

Segmentazione del pubblico

Appartenenza errata al gruppo

Il problema di avere un gruppo di dimensioni troppo ridotte

La limitata rilevanza della segmentazione per le strategie di marketing

La bassa somiglianza tra gli individui all’interno del gruppo

Reverse ETL

Potrebbe interessarti anche

Progettare la raccolta first-party fin dal primo touchpoint: perché la qualità dei dati nasce dall’architettura e non dagli strumenti

Signal Engineering: la nuova infrastruttura delle performance pubblicitarie nell’era post-cookie

Smart Bidding: come ottimizzare le campagne pubblicitarie con modelli basati sui dati

Pronto a Trasformare i Tuoi Dati in Fatturato?

Pronto a discutere i tuoi obiettivi?