Lo scandalo Facebook-Cambridge Analytica
A metà 2014 Cambridge Analytica (azienda che accumula dati personali per creare profili psicologici utili alla conduzione di campagne di comunicazione e che opera secondo un sistema di microtargeting (1) comportamentale) commissionò a Aleksander Kogan, docente di psicologia all’università di Cambridge, la raccolta di alcune informazioni relative a profili di utenti Facebook. Kogan creò l’app “This is your digital life”, essenzialmente un quiz sulla personalità, riuscendo a somministrarlo a una vasta platea di utenti della piattaforma anche attraverso l’utilizzo di Mechanical Turk di Amazon, uno dei servizi più controversi della gig economy (2) il cui motto recita “Intelligenza Umana tramite API – Accesso a una forza lavoro globale, su richiesta e 24×7”. Kogan riuscì a far eseguire il quiz a poco meno di 300.000 utenti Facebook (dietro pagamento di pochi centesimi a ciascuno di essi) e a raccogliere informazioni non solamente su di loro, ma anche sui loro amici, ampliando il perimetro di collezione dei dati ad un numero di utenti sconosciuto ma oscillante tra 50 e 90 milioni. Kogan, in realtà, prima di sviluppare la propria app cercò invano di convincere Michal Kosinski, uno dei principali studiosi dell’intersezione tra psicometria (3) e big data, a fargli utilizzare i dati raccolti tramite analoghe app che quest’ultimo aveva realizzato per scopi di ricerca. Kosinski aveva dimostrato nel 2013 la possibilità di predire tratti e attributi personali da una varietà di informazioni che generiamo quotidianamente durante l’utilizzo delle piattaforme di social network o di altri servizi Web: ad esempio, analizzando i Like su Facebook è possibile dedurre con buona accuratezza diverse informazioni personali (4). Kosinski si è sempre detto preoccupato per l’elevato rischio di perdita della privacy connaturato a pratiche sconsiderate di raccolta e analisi dei dati. Normalmente Facebook ha sempre consentito agli sviluppatori che realizzano app all’interno del proprio ecosistema questo genere di raccolta dei dati, ma solamente per scopi di ricerca accademica e non per utilizzo commerciale. Facebook accusa Kogan di aver venduto i dati ricavati tramite la propria app a Cambridge Analytica, violando le regole e le policy aziendali. Facebook ha anche sospeso improvvisamente Cambridge Analytica dalla propria piattaforma: a quanto pare sapeva del problema da un paio d’anni ma non era stato realizzato alcun intervento risolutivo, come sostenuto dall’immancabile whistleblower (ce n’è sempre uno in ogni scandalo che si rispetti) Christopher Wylie, ex dipendente di Cambridge Analytica.
Big Data
Google è, insieme a Facebook, Apple, Amazon e Microsoft una delle cosiddette stack (cataste): la definizione di “catasta” appartiene a Bruce Sterling (5) e indica la strategia di integrazione verticale con cui ognuna delle suddette aziende cerca di controllare la rete, nonché le piattaforme, le applicazioni, i dispositivi fisici e i contenuti presenti sulla rete stessa. Google e le altre stack sono in prima fila nella progettazione e realizzazione dei processi di Digital Transformation (6) in cui tutti, volenti o nolenti, siamo totalmente immersi.
Google è ampiamente considerato il pioniere dell’accumulazione originaria e spregiudicata dei big data. I big data non sono una tecnologia specifica o un effetto ineluttabile del progresso scientifico: non è nemmeno qualcosa generato tramite un processo autonomo. I big data hanno origine nel sociale e sono la componente fondamentale di una nuova logica denominata capitalismo della sorveglianza (7), che mira a prevedere e modificare il comportamento umano come mezzo per produrre reddito e controllo del mercato. I dati delle transazioni economiche mediate dal computer rappresentano una dimensione significativa dei big data. Vi sono anche altre fonti, ad esempio i dati provenienti da miliardi di sensori incorporati in una gamma ampliata di oggetti, corpi e luoghi (Internet of Things). I nuovi investimenti di Google in machine learning, droni, dispositivi indossabili, auto senza conducente, nano particelle che pattugliano il corpo alla ricerca di segni di malattia e dispositivi intelligenti per la casa sono tutti componenti essenziali di questa rete crescente di sensori intelligenti e iperconnessi. Un’altra fonte di dati deriva da banche dati aziendali e governative, comprese quelle associate a banche, intermediari dei pagamenti, agenzie di rating del credito, compagnie aeree, registri fiscali e censuari, operazioni sanitarie, carte di credito, assicurazioni, farmaceutiche e telefoniche e altro ancora. Una quarta fonte di big data scaturisce dai dispositivi di sorveglianza pubblici e privati: smartphone, telecamere, satelliti, Street View, Google Earth, etc.
In generale, i bisogni individuali e sociali di espressione, relazione, influenza, informazione, apprendimento, empowerment e connessione hanno spinto ogni sorta di nuove funzionalità tecniche in pochi anni: ricerche di Google, musica di iPod, pagine di Facebook, video di YouTube, foto e storie su Instagram, blog, reti, comunità di amici, estranei e colleghi tutti protesi oltre i vecchi confini istituzionali e geografici e impegnati senza sosta in una continua raccolta e condivisione di informazioni. Queste soggettività esprimono forme di autodeterminazione all’interno di una sfera individuale in rete, caratterizzata da forme non mercantili di produzione sociale (8). Tali attività non mercantili sono una delle fonti principali dei big data e la base della quotidianità. I big data sono costituiti dall’acquisizione di miriadi di frammenti di informazione prodotta nel semplice svolgimento quotidiano delle vite di miliardi di persone. Niente è troppo banale o effimero per questa raccolta: like di Facebook, ricerche di Google, e-mail, testi, foto, canzoni e video, posizioni geografiche, schemi di comunicazione, reti, acquisti, movimenti, ogni click, parola errata, pagina visitata e altro ancora. Tali dati sono acquisiti, astratti, aggregati, analizzati, confezionati, venduti, ulteriormente analizzati e venduti nuovamente: Google è diventata la più grande azienda di big data perché è il sito più visitato e dispone della maggior quantità di dati. Il modello di business di Google si è sempre fondato sull’acquisizione dei dati dell’utente come materia prima per analisi proprietarie e produzione di algoritmi che potevano vendere e indirizzare la pubblicità attraverso un modello di asta. Mentre le entrate di Google crescevano rapidamente, motivavano una raccolta di dati sempre più completa: la nuova scienza delle analisi dei big data è stata guidata in gran parte dallo spettacolare successo di Google.
Data Broker
La raccolta dei dati personali digitali avviene su scala globale: Facebook detiene i profili digitali di circa 2 miliardi di utenti della propria piattaforma, oltre a quelli di Whatsapp e Instagram. Google ha i profili di oltre 2 miliardi di utenti di dispositivi Android, oltre a quelli di Gmail e Youtube. Apple possiede i profili di circa 1 miliardo di proprietari di dispositivi con a bordo iOS. I profili digitali di Facebook usano circa 52.000 attributi per identificare l’identità dei propri utenti e categorizzarli: tutto ciò è possibile tramite l’analisi di post, Like, commenti, condivisioni, amici, foto, video, check-in di localizzazione geografica e così via. I broker di dati sono al centro dell’industria dei dati personali e si occupano di aggregare, combinare e scambiare commercialmente enormi quantità di informazioni, collezionate da sorgenti disparate sia online sia offline. Di solito i dati provengono da fonti diverse dagli individui e spesso, soprattutto nel cyberspazio, sono collezionati senza consenso. I broker analizzano i dati, fanno deduzioni e applicano inferenze, ordinano i profili in categorie e forniscono migliaia di attributi individuali ai propri clienti. I profili che i broker hanno sugli individui includono informazioni relative a educazione, lavoro, figli, religione, etnia, schieramento politico, attività, interessi, utilizzo dei media, ma anche comportamenti online quali, ad esempio, le ricerche effettuate sul web. I broker collezionano dati relativi agli acquisti, all’utilizzo delle carte di credito, al reddito e ai prestiti, alle posizioni bancarie e assicurative, alla proprietà di veicoli e immobili e a una varietà di altre tipologie di dati. I broker calcolano punteggi in grado di predire il possibile comportamento futuro di un individuo, con attenzione, ad esempio, alla stabilità economica o ai piani di fare un figlio o cambiare lavoro.
Metadati
Un metadato è un’informazione che descrive un insieme di dati (9) utile all’elaborazione di una macchina. I dati sono il contenuto, i metadati sono il contesto: possono rivelare molto più dei dati stessi, soprattutto se aggregati e proiettati su vasta scala. Come ha detto il General Counsel dell’NSA Stewart Baker, “i metadati ti dicono tutto sulla vita di una persona. Se hai abbastanza metadati, non hai proprio bisogno del contenuto dell’informazione”; il Generale Michael Hayden, ex direttore dell’NSA e della CIA, si è spinto oltre, asserendo che “uccidiamo le persone sulla base dei metadati (10)”. I tratti caratteristici della personalità possono essere dedotti dalle informazioni relative ai siti web acceduti, così come dall’analisi dei flussi delle chiamate telefoniche e dai dati relativi all’utilizzo delle applicazioni sugli smartphone: i metadati concorrono in maniera determinante alla sorveglianza e al monitoraggio dei comportamenti digitali su Internet.
Il Peccato Originale di Internet
In un famoso articolo pubblicato su Atlantic nel 2014 (11), Ethan Zuckerman, direttore del «Center for Civic Media» del MIT, fece pubblica ammenda per quello che chiamò il “Peccato Originale di Internet”. Tale peccato consiste nell’aver contribuito attivamente (Zuckerman è l’ideatore del pop up) (12) al fatto che l’unico modello di business sostenibile di Internet fosse, ed è ancora oggi, la pubblicità. Per poter usare gratis un servizio Internet (che implica costi notevoli per poter essere erogato) cediamo dati personali e forniamo informazioni di vario tipo. Siamo spesso ben disposti a cedere dati in cambio di servizi, anche se spesso non si tratta di un processo bilanciato e chiaro. Ne consegue che è materialmente impossibile immaginare un modello di pubblicità on-line che non comporti una forma di sorveglianza degli utenti: più ci apriamo alla sorveglianza, più gli strumenti e i contenuti che vogliamo rimarranno gratuiti.
Il capitalismo della sorveglianza è profondamente innestato nella nostra società sempre più computerizzata e il suo principale obiettivo, semplicemente, è monetizzare i dati acquisiti tramite la sorveglianza. Questo genere di capitalismo (13) porta lo scenario finora analizzato a un livello superiore avvalendosi della manipolazione psicologica nella forma di pubblicità personalizzate per persuaderci a comprare qualcosa o a fare qualcosa (nel caso di Cambridge Analytica, votare per un candidato). I servizi web che usiamo quotidianamente sono gratuiti perché in cambio cediamo i nostri dati e da questo modello di business ne consegue una proporzionalità diretta tra quantità di dati raccolti e qualità dei servizi erogati: tanto maggiore la pervasività della sorveglianza, tanto migliore l’efficacia dei servizi offerti e della pubblicità associata. In questo scenario lo smartphone è probabilmente il dispositivo tecnologico di sorveglianza più intimo mai realizzato: traccia costantemente la nostra posizione geografica, sa dove viviamo, dove lavoriamo e dove spendiamo il nostro tempo, è la prima e ultima cosa che controlliamo ogni giorno, sa quando ci svegliamo e quando andiamo a dormire. Tutti ne abbiamo almeno uno, quindi sa anche con chi dormiamo.
Conclusioni
Il carattere pervasivo e immersivo delle tecnologie dell’informazione induce nelle persone – utenti dei servizi e delle piattaforme digitali –comportamenti e interazioni incessanti: anche il mero attraversamento del cyberspazio genera impronte, segni del proprio passaggio, tracce preziose, in una parola dati. La produzione di dati è produzione di valore: Kaspersky, azienda russa di cybersecurity, ha aperto a Londra nel 2017 il Data Dollar Store, un negozio in cui pagare beni e servizi usando esclusivamente come moneta i propri dati personali (14). Spingendosi oltre, c’è chi si propone di redistribuire quota parte del valore economico dei big data ai produttori degli stessi: Datacoup (15) è una piattaforma (operativa solo negli Stati Uniti, in Europa vige il GDPR a tutela della privacy dei propri cittadini) (16) che raccoglie i dati dei propri utenti costruendo un profilo e assegnando un prezzo: l’obiettivo è liberare il valore dei propri dati vendendoli all’interno di un marketplace. ll divenire-software del mondo fisico e l’evoluzione delle tecnologie di comunicazione digitale promuovono forme di nomadismo che trovano il proprio climax nell’esaltazione acritica di concetti quali mobilità assoluta e innovazione, narrata come intrinsecamente positiva: everybody is everywhere anytime. Ogni istante di tempo che viviamo all’interno di questo flusso genera dati, catturati e valorizzati: le dinamiche del Digital Labour (17) finora descritte prosperano sullo sfruttamento dell’intersezione vita/lavoro (formale e informale) e sulle forme di captazione ed estrazione di valore dai big data. In generale, attualmente il conflitto tra Labour e Capitale sembra vedere quest’ultimo come vincitore, anche se il campo di battaglia pertiene in misura crescente al dominio degli intangible asset (proprietà intellettuale, brand, etc). Oggi il Capitale esprime il proprio valore e vive all’interno dei neuroni e del silicio e questa evoluzione modifica la relazione tra Labour e Capitale: i big data sono Labour e non Capitale.
Note
1 https://en.wikipedia.org/wiki/Microtargeting
2 https://www.mturk.com
3 https://en.wikipedia.org/wiki/Psychometrics
4 http://www.pnas.org/content/110/15/5802
5 https://it.wikipedia.org/wiki/Bruce_Sterling
6 https://it.wikipedia.org/wiki/Digital_transformation
7 https://en.wikipedia.org/wiki/Surveillance_capitalism
8 https://it.wikipedia.org/wiki/Produzione_paritaria
9 https://en.wikipedia.org/wiki/Metadata
10 http://www.nybooks.com/daily/2014/05/10/we-kill-people-based-metadata/
11 https://www.theatlantic.com/technology/archive/2014/08/advertising-is-the-internets-original-sin/376041/
12 https://en.wikipedia.org/wiki/Pop-up_ad
13 https://www.hbs.edu/faculty/Pages/item.aspx?num=49122
14 https://www.kaspersky.com/blog/data-dollar-store/19660/
15 http://datacoup.com/
16 https://www.garanteprivacy.it/web/guest/regolamentoue
17 https://en.wikipedia.org/wiki/Digital_labor