Archivio

09/10/2019 Severino Meregalli, Leonardo Maria De Rossi, Lorenzo Diaferia

Come valorizzare i dati nell’era post-digital?

Una proposta per parlare meno di dati e iniziare a utilizzarli

Il Word Economic Forum (WEF) ha recentemente stimato che entro il 2020, l’ammontare di dati memorizzati dovrebbe raggiungere il volume di 44 zettabyes, il che significa disporre di una quantità di bytes quaranta volte più grande del numero di stelle presenti nell’universo.

Nel mondo dei big data e della digitalizzazione, i riferimenti immaginifici come quello del WEF sul trend di crescita dei dati sono oramai diventati la norma. Centri di ricerca, vendor e la pubblicistica fanno a gara nel segnalare con similitudini e metriche esponenziali il tema della data explosion. Dato per assodato il fatto che ci troviamo di fronte a un trend inarrestabile e di dimensioni rilevanti, il tema fondamentale diventa sempre più quello di come iniziare a usare questi dati ed estrarre valore dagli stessi. Su questo tema il DEVO Lab della SDA Bocconi ha condotto una serie di ricerche, l’ultima delle quali su stimolo e supporto di Google Italia.

Fenomeni così pervasivi suggeriscono che le iniziative che ruotano intorno ai dati arrivano a coinvolgere molteplici fonti e attori che si combinano nei modi più disparati. In molti casi, la realizzazione di un’iniziativa di valorizzazione richiedere forme di cooperazione e partnership all’interno di un vero e proprio «ecosistema dei dati», dove attori privati (aziende), e pubblici (enti e organizzazioni), possono trovare reciproci vantaggi.

Da cosa scaturisce questa necessità di realizzare delle filiere che coinvolgano attori eterogenei? Ciò è spesso dovuto alla natura stessa dei dati necessari per ottenere risultati concreti; ossia di iniziative che non siano motivate dall’effetto moda, ma dalla reale tensione a ottenere valore tenendo conto di quanto serve per trarre un effettivo valore.

A questo proposito, una distinzione fondamentale è quella tra dati di fenomeno, ossia quei dati che descrivono un evento preciso (per esempio, il volume di vendite di gelati in un bar), e i relativi dati di contesto, fondamentali per un’interpretazione consapevole e non distorsiva (per esempio, la temperatura nella zona di vendita dei gelati). 

Matrice

A ciò si aggiunge un altro elemento: non tutti i dati sono fruibili allo stesso modo. Alcuni sono in formato open, ossia accessibili da fonti pubbliche, altri, la maggior parte, sono un patrimonio privato e custodito da aziende o altri enti.

Prendiamo per esempio un’azienda, che decida di avviare un progetto per generare valore dall’utilizzo di dati di fenomeno di cui dispone. In questo caso, a seconda dei fini del progetto, può rendersi necessario un arricchimento tramite dati che descrivano il contesto, e che sono complementari e fondamentali per generare risultati significativi. Le opzioni disponibili per questo arricchimento sono due: rivolgersi ad altre aziende che vendono tali informazioni, oppure utilizzare piattaforme, se presenti, che permettano l’accesso a dati di contesto in formato open. Dove esistono dati di contesto il valore ottenuto è più elevato rispetto a un utilizzo esclusivo di informazioni di fenomeno. Addirittura, in alcuni casi, senza dati di contesto non è possibile ottenere alcun valore (per esempio dati di vendita senza andamento dell’economia e azioni dei concorrenti).

Cosa significa tutto ciò per aziende e regolatore pubblico?

Per le aziende questa semplice constatazione vuol dire che quando si decide di affrontare un progetto di questo tipo bisogna dare il giusto peso a tutte le categorie di informazioni necessarie e instaurare un rapporto strutturato con tutti gli attori in gioco per creare una filiera di contenuti ben allineati all’obiettivo.

Per chi si occupa di policy-making, invece, significa che è necessario prestare particolare attenzione alla creazione di dati di contesto, stimolando l’emergere di soggetti, pubblici o privati, che favoriscano l’accessibilità in ottica open, promuovendo un quadro legislativo che incentivi anche il riutilizzo di open data pubblici.

Queste considerazioni sono supportate dallo studio di oltre 20 iniziative di valorizzazione dati condotte prevalentemente in Italia e in Europa. Tale analisi ha portato a individuare tre domande fondamentali per strutturare progetti meno basati sull’hype della crescita esponenziale dei dati e più focalizzati sulla generazione di ritorno economico misurabile.

Le domande chiave in questa prospettiva sono:

  1. Chi sono gli attori fondamentali per la buona riuscita del progetto?
  2. Quale deve essere la natura di questi attori? Si tratta esclusivamente di soggetti privati o è invece necessaria qualche forma di cooperazione pubblico-privato?
  3. Quali sono i passi da seguire nel processo per generare un tangibile valoreeconomico?

Attori

La cooperazione sinergica tra le cinque categorie di attori descritte nello schema precedente si rivela cruciale. Tra questi, va sottolineato il ruolo trasversale rispetto alle diverse fasi del processo dell’infrastruttura tecnologica, che abilita la gestione e le analisi dei dati. Se è vero che il processo di valorizzazione passa per un’attenta valutazione dei soggetti che dovranno presidiare queste cinque aree chiave, è altrettanto vero che spesso tali ruoli non possono essere ricoperti dalla stessa organizzazione, né da organizzazioni della medesima natura. Da qui nasce la necessità di prevedere e incentivare forme di cooperazione tra soggetti pubblici e privati per fornire, a seconda dei casi, i dati e le capacità necessari.

Esperienze italiane interessanti, come il Dynamic Maintenance Management System di Trenitalia, le iniziative di ACEA o il progetto Milano City Pulse, ci insegnano poi che, oltre a prevedere un’attenta assegnazione di tutti i ruoli necessari, sono fondamentali i passi giusti nel processo.

La rielaborazione DEVO Lab del tradizionale modello della Data Value Chain rende evidente la necessità di un approccio strutturato che è necessario seguire per passare da dati grezzi alla creazione di informazioni.

Catena di valore

Nei progetti di valorizzazione dei dati, a guidare la value chain deve essere l’obiettivo finale che determina cosa serve per la generazione di valore economico. È in funzione di questo obiettivo che la catena del valore e gli attori in campo si devono articolare e integrare in un progetto unitario. Il rapporto tra promotore di un’iniziativa, fonti dati, aggregatori, fruitori e infrastruttura a supporto necessita infatti di essere inserito in un quadro di cooperazione più ampio, che permetta una più facile integrazione tra dati di fenomeno e di contesto e che incoraggi, tramite adeguate politiche pubbliche, la creazione, il mantenimento e il riutilizzo di dati in formato open.

In questo contesto, un aiuto può poi giungere da quelle aziende che, per vocazione digitale e disponibilità di infrastrutture, si trovano a maneggiare grandi quantità di dati contestuali. Queste si possono candidare, o vanno comunque stimolate, a fungere da aggregatori o infrastrutture di base per progetti dati. Senza questa componente la trasformazione dei dati di fenomeno in valore risulterà spesso vana.

Una trattazione completa delle evidenze emerse e degli strumenti sviluppati durante le attività di ricerca DEVO Lab-Google citata in precedenza verranno presentati all’interno di un articolo di approfondimento nel primo numero di E&M del 2020.

Severino Meregalli è Associate Professor of Practice di Information Systems presso SDA Bocconi School of Management e Coordinatore Scientifico del laboratorio di ricerca “Digital Enterprise Value and Organization” (DEVO Lab). Lorenzo Diaferia è Trainee del Knowledge Group Information Systems-IT e fa parte del gruppo di lavoro del laboratorio di ricerca “Digital Enterprise Value and Organization” (DEVO Lab).

 

Dati