Close filters

Tipo di contenuto

Loading...

Ricerca in corso

Post

Tecnologia vocale e nuovi ascolti digitali

di Daniele Cassandro*

Nella pièce teatrale di Jean Cocteau del 1930 La voix humaine (La voce umana) vediamo in scena solo una donna con un telefono. Parla con l’amante che l’ha lasciata, la comunicazione s’interrompe spesso e il pubblico non sente mai la voce di lui. Lei è avvinghiata al mezzo che le può far sentire la voce dell’amato lontano; supplica, ride, piange… e arriva perfino a tentare il suicidio. Quel breve testo teatrale ebbe un enorme successo: è diventato un’opera lirica di Francis Poulenc, l’episodio di un film di Roberto Rossellini con Anna Magnani e più di recente un cortometraggio di Pedro Almodóvar con Tilda Swinton. Il rapporto tra la donna in carne e ossa e la voce smaterializzata che non sentiamo mai, mediata attraverso la tecnologia del telefono, doveva rappresentare l’alienazione dell’Uomo moderno, il suo disfacimento nella solitudine resa più acuta da una tecnologia pensata per annullare le distanze.

Se suona tutto molto familiare è perché lo è: Cocteau nel 1930 ha saputo descrivere l’Homo technologicus del 2021, iperstimolato da una onnipresente rete sociale virtuale e da un feedback loop di gratificazioni istantanee e di repentine punizioni. Come la protagonista de La Voix humaine si stringe al petto il suo telefono di bachelite, così noi siamo dipendenti dalle nostre connessioni che ci seguono ovunque, connessioni che ormai ci danno il senso della nostra esistenza, più che mai oggi, al secondo anno di una pandemia che ci vede sempre più lontani e sfilacciati nei nostri rapporti umani e familiari.

The twittering machine è un libro dell’attivista e giornalista britannico Richard Seymour uscito nel 2019 ed è una spietata analisi dei meccanismi psicologici “dopanti” dei social media che divorano il nostro tempo trasformandolo in forza lavoro per macchine che sempre di più ci governeranno. Seymour parla di come quella che lui chiama “social industry” ha trasformato l’atto antichissimo del leggere e dello scrivere da supremo atto di libertà a catena che ci lega sempre di più ai nostri nuovi padroni. Quando crediamo di scrivere per noi, di commentare e di interagire con altri esseri umani, scrive Seymour, «scriviamo a una macchina che raccoglie e aggrega i nostri desideri e le nostre fantasie, le segmenta in termini di mercato e di fasce d’età e ce le rivende sotto forma di merce».

Nel mondo un po’ apocalittico descritto da Seymour si parla solo di occhi che scorrono testi e video, con una soglia dell’attenzione sempre più frammentata e di dita che freneticamente scorrono su una tastiera. Sono gli occhi e solo gli occhi che ci tengono agganciati alla macchina. Seymour non fa i conti con la tecnologia vocale che sta prendendo piede sempre più rapidamente. Concentrandosi esclusivamente sulla scrittura e sugli occhi, non si rende conto che anche le orecchie e la voce, umana o sintetica, giocano un ruolo sempre più importante nel nostro ecosistema tecnologico e nel nostro modo di rapportarci alle macchine.

La tecnologia vocale ha avuto uno sviluppo lento ma costante negli ultimi decenni e sempre di più si è connessa allo sviluppo delle intelligenze artificiali. Se oggi troviamo normale interagire con Alexa o con Siri, comunicare al telefono il nostro codice fiscale a una voce sintetica o imparare a pronunciare parole straniere grazie all’interfaccia audio di Google Translate è perché, mentre noi utenti eravamo impegnati a cercare i nostri compagni di classe su Facebook o a scaricare illegalmente musica e film, le tecnologie vocali venivano implementate a velocità vertiginosa.
E proprio quando credevamo che non avremmo mai più usato il telefono per telefonare, “la voce umana” è tornata prepotentemente al centro della scena.

Le orecchie stanno cominciando a competere con gli occhi: podcast e audiolibri hanno piattaforme dedicate e milioni di ascoltatori. I messaggi vocali, ormai onnipresenti, sono considerati invasivi solo dagli utenti più anziani perché interrompono il flusso di informazioni che si sono abituati, non senza sforzo, ad assorbire con gli occhi. Gli assistenti vocali sono ormai diffusissimi, tanto che quasi non ci accorgiamo più di usarli e sempre più si parla di marketing vocale. Insomma, come la ricerca testuale tramite Google ha creato un modello pubblicitario, così la ricerca vocale sta creando una nuova sconfinata prateria di possibilità commerciali. Non saranno più solo i nostri testi o le nostre immagini a profilarci ma anche la nostra voce.

Nel bel mezzo della pandemia una nuova piattaforma è comparsa nell’ecosistema della “social industry”, Clubhouse una piattaforma basata sullo scambio di messaggi vocali. Fondamentalmente è una versione audio del vecchio Reddit, a sua volta un ricordo degli antichi forum della preistoria di internet. Gli utenti di Clubhouse interagiscono tra loro in “stanze” dove possono lasciare il proprio contributo vocale a una conversazione che viene regolata da un moderatore. Si alza la mano e si lascia il proprio messaggio, proprio come hanno rapidamente imparato a fare gli studenti su Meet o su Classroom in questo lungo anno di didattica a distanza.

Clubhouse è forse la più grossa offensiva sferrata dalle orecchie agli occhi nella spartizione del nostro “screen time”, ovvero del tempo che passiamo agganciati a uno schermo. C’è chi la trova intima e ospitale: un luogo in cui avere quelle famose conversazioni che ci erano state un tempo promesse da Facebook e da Twitter. Altri utenti criticano la sua natura esclusiva da club ancora ristretto. In generale quella di Clubhouse è un’esperienza interessante, perché facendo leva sul senso dell’udito, dà davvero la sensazione di essere trasportati altrove e permette una maggiore immersione nei contenuti e nelle discussioni.

Al di là di alcuni ovvi problemi di privacy  – Clubhouse chiede a ogni nuovo utente l’accesso alla propria lista di contatti e gestisce le registrazioni non criptate delle conversazioni in quella maniera opaca a cui, come utenti di piattaforme social, siamo ormai abituati – c’è un problema di fondo: Clubhouse è l’ennesima app che vuole un po’ del nostro tempo e della nostra attenzione. Quanto di questo tempo sarà in grado di prendersi è ancora presto per dirlo: per ora siamo ancora in luna di miele con questa app che, sicuramente, rende più umano e più immediato lo scambio di opinioni e di parole. Nelle stanze notturne in cui gli utenti si sussurrano a vicenda delle ninne nanne si ha davvero l’impressione di entrare in una nuova era dei social in cui “la voce umana” ci permette di riscoprire la nostra capacità di raccontare e di immaginare. Eppure, come scrive Adam Greenfield nel suo saggio Radical technologies (2017), quando entra in scena una nuova tecnologia che ci affascina o ci cattura con le sue promesse di un mondo migliore «la cosa più importante non è tanto quello che avevano in mente i visionari che l’hanno creata ma cosa succede alla gente quando la usa».


*Daniele Cassandro

Nato a Roma nel 1970, si è laureato in storia dell’arte alla Sapienza, ha cominciato a lavorare nei periodici alla fine degli anni novanta. È stato in redazione a GQ, Riders e Wired. Ora si occupa dei numeri speciali di Internazionale.

close-link
close-link