L’App immuni per spiegare tre tipi di dati: centralizzati, decentralizzati e condivisi

– Dalla rubrica di Nicola Mazzara, “Il dato è dato” –

Siamo nel mondo dell’informazione ormai da diversi anni, ma una cosa che ancora spaventa perché reputata (più o meno correttamente) complicata è l’analisi dei dati. Ma come i dati? Cosa c’entrano i dati con l’informazione?

Partendo dal presupposto che “una cosa è una cosa” possiamo definire il dato come l’elemento minimo per quella che è e sarà l’informazione che andremo ad utilizzare per le nostre necessità. Se siamo marketers useremo il dato per crearci il target o fare buone campagne paid. Se siamo biologi di laboratorio useremo il dato per studiare e raccogliere perlappunto informazioni da utilizzare a fini medici e così via. Se siamo scienziati sociali li useremo per studiare la società.

Quindi rispolverando quella che accademicamente viene chiamata piramide della conoscenza, il dato è alla base di quest’ultima.

Pertanto, non è più tempo di parlare di batabase, ma di veri e propri datasense, ovvero, insieme di dati che generano informazioni spendibili per una conoscenza che sta alla base di ogni settore della nostra vita. Dall’economia alla scuola, dall’industria intesa come luogo di produzione di beni, dalla politica intesa come vita all’interno della polis, dall’agricoltura alla finanza. Insomma, non c’è nel 2020 (ma in realtà da molto più tempo) singola attività umana che non generi dati utili a creare informazione e conoscenza.

Considerata pertanto, l’importanza del dato nella società di oggi, affronteremo con questo argomento con il nuovo format “Il dato è dato”. Così in maniera lenta e progressiva cercheremo di rendere il complesso mondo dei big data (ma anche small data) più “digeribile” e cercare di dare una visione dell’analisi dei dati più umanistica separandosi dal pregiudizio dell’analista di dati nerd con gli occhiali a fondo di bottiglia.

Per dare concretezza a quanto finora scritto analizzeremo un caso che in questo periodo fa tanto discutere (e polarizzare) l’opinione pubblica, ovvero, il caso dell’App Immuni. Qui non entrerò nel mero discorso politico, non è né il luogo adatto, né tantomeno l’obiettivo di questa rubrica, ma ci soffermeremo sulla differenza tra dati centralizzati, dati decentralizzati e dati distribuiti.

Nel caso di un dato centralizzato le informazioni saranno convogliate in un’unica grande macchina chiamata server che ci farà da database, il quale accoglierà i dati di tutti gli utenti. Questo genera però dei rischi sia tecnici di sicurezza informatica che etici di gestione del dato. I primi rischi sono dovuti alla bravura (può non piacere, ma è così) di cybercriminali i quali dovranno per accedere ai dati di mille se non milioni di utenti scovare le falle di un unico grande server. Il secondo problema quello etico si fonda sulla volontà dell’organizzazione pubblica o privata che sia di usufruire della conoscenza e delle informazioni che sono state raccolte, per scopi precedentemente non dichiarati.

Il dato decentralizzato si ha quando non interviene solo una singola macchina che immagazzina i dati, ma ne sono presenti diverse, attenuando così il problema del cybercrimine, ma lasciando invariato il tema etico.

Last, but not least il dato distribuito, ovvero quel dato che è diffuso nella rete in cui viene generato in cui ogni macchina ha un equo valore all’interno della rete e dove tutti sono democraticamente esposti a rischi di cybercrimine e le informazioni non essendo in mano ad un solo nodo della rete o a pochissimi nodi di questo ecosistema, garantiscono di essere utilizzate a discrezione di ogni singolo individuo.

E quindi la domanda sorge spontanea: “è meglio un dato centralizzata, decentralizzato o condiviso?”, ma la risposta sarà “dipende” e questo per non cadere nella trappola della polarizzazione come accaduto per l’App Immuni (privacy Vs salute pubblica). Quindi la scelta deve ricadere sull’organizzazione che “azionerà” il dato per farlo diventare informazione prima e conoscenza poi, ed i questo caso è una scelta che inevitabilmente spetta alla politica, la quale può non avere le competenze tecniche, ma dovrebbe quantomeno avviare un discorso e un dibattito d’interesse pubblico sul dato come elemento base della conoscenza e la sua relativa attivazione e archiviazione.

Collegati con Nicola Mazzara su LinkedIn.