Blog

Dammi una foto e ti dirò dove sei

Un nuovo, sofisticato algoritmo promette di indovinare dove è stata scattata una foto in (quasi) ogni parte del mondo. Il suo segreto? La banalità di noi fotografi.

Che ci piaccia o meno il genere, è impossibile non aver mai visto un episodio di qualche telefilm americano stile police procedural; da anni invadono i palinsesti di ogni canale televisivo con nuove serie, ennesime repliche e ineluttabili spinoff. Che si chiamino CSI, Criminal Minds o NCIS, le premesse sono le stesse: un’affiatata squadra di brillanti detective è impegnata a risolvere il caso della settimana, e fin dall’inizio siamo sicuri che, non importa quanto il crimine sia misterioso e le indagini intricate, i nostri eroi riusciranno ad assicurare alla giustizia i cattivoni entro i 45 minuti canonici di durata dell’episodio. Una figura immancabile nel cast dei protagonisti è quella del mago dei computer (o la maga, poiché negli ultimi tempi questo personaggio è interpretato spesso e volentieri da un rappresentante del gentil sesso). Stravagante e un po’ hacker, seduta circondata dai monitor della sua futuristica workstation informatica, la nostra geniaccia riesce, con pochi colpi sulla tastiera, a scovare ogni genere di informazioni e connessioni su tutto e tutti, contribuendo quasi sempre in modo determinante a risolvere il caso. Volete sapere come andava in educazione artistica il vostro sospettato quando frequentava la scuola elementare di Tuscaloosa, Alabama, nell’anno scolastico 1984/85? Due click di mouse e la vostra esperta vi troverà non solo i voti ma le immagini scannerizzate dei disegni del precoce talento. Volete identificare un criminale ma come indizio avete solo una macchia sgranata nell’immagine di una telecamera di sorveglianza, magari ripresa di notte durante un nubifragio? Nessun problema, il vostro genio dei computer batte vorticosamente sulla tastiera e, in men che non si dica, riesce a zoomare l’immagine e ad aumentarne magicamente la risoluzione fino a che, sul polso sinistro dell’individuo, quello che prima era solo un pixel indistinto si rivela essere un tatuaggio che la nostra hacker, collegandosi al mega database mondiale dei tatuaggi (ma come, non sapevate che esisteva?), riesce a riconoscere come un disegno particolare eseguito solo in quel determinato studio di tatuaggi di Georgetown, Washington D.C. Un altro scenario classico è quello in cui una dolce fanciulla o una bambina è stata rapita e, analizzando minuziosamente la foto o il filmato in cui il criminale chiede il riscatto, i nostri riescono immancabilmente a trovare un indizio inequivocabile che indica il luogo in cui è stata scattata o girata l’immagine, tradendo così dove si trova la tana del cattivo. Il nostro mago dei computer batte ancora sulla tastiera e, con un sofisticato programma il cui funzionamento non è mai spiegato in dettaglio, analizza l’indistinto profilo degli edifici o delle montagne che si vedono oltre una finestra della stanza dove è segregata la vittima, ricavandone una localizzazione precisa.

Una foto come questa non vi farà certamente vincere un premio per l’originalità o il buon gusto, ma almeno sarete sicuri che il programma PlaNet riconoscerà al volo dove l’avete scattata. Fonte: www.breakawaybackpacker.com

Anche qui roba da fantascienza, quel genere di fuffa pseudotecnologica che i fan chiamano technobabble, vero? Forse non del tutto. Qualche giorno fa Tobias Weyand, che lavora presso Google nel settore del trattamento delle immagini, ha pubblicato insieme a due colleghi un articolo scientifico intitolato PlaNet - Photo Geolocation with Convolutional Neural Networks. La sostanza è che Weynand e soci hanno sviluppato un algoritmo, chiamato PlaNet, capace di riconoscere dove è stata scattata una foto analizzandone i vari elementi. Il sistema si basa sulle reti neurali, il genere di architettura informatica strutturata come il cervello umano, in cui una quantità potenzialmente illimitata di nodi, l’equivalente dei neuroni del cervello, si scambiano informazioni attraverso un numero altissimo di connessioni. Più alto il numero di connessioni, più il “cervello” elettronico è veloce e intelligente. Ma un cervello superveloce non basta; per sapere dove è stata scattata una foto occorre una miniera di informazioni su tutti i luoghi del mondo, e PlaNet le ricava da Internet, e precisamente da oltre 126 milioni di fotografie postate e condivise dagli utenti di siti e social network di tutto il mondo. Una buona parte di queste immagini sono geotaggate, hanno cioè inserite al loro interno le coordinate esatte del luogo dove sono state scattate; è un meccanismo automatico di molti smartphone e macchine fotografiche dotate di GPS. Il software di Weyand scompone queste milioni di immagini in elementi e li confronta con quelli della foto da localizzare cercando dei punti in comune: elementi naturali come il profilo di montagne e colline, la forma caratteristica di certe rocce, l’insieme dei colori di un paesaggio; ma anche e soprattutto elementi artificiali come un monumento o la forma tipica di un edificio, lo skyline di una città o, nel caso di foto di interni, oggetti specifici e la loro reciproca posizione. Così, per esempio, se avete pubblicato su Internet una foto geotaggata che riprende il vostro cane di razza Jack Russel vicino al vostro divano banco e azzurro, il computer può analizzare un’altra immagine con gli stessi elementi e indovinare che è stata scattata nel salotto di casa vostra.

Il planisfero diviso in aree di grandezza diversa usato da PlaNet per localizzare le foto che gli vengono sottoposte. Fonte: www.t3n.de

Per riconoscere il maggior numero possibile di luoghi PlaNet conta anche su un fattore statistico fondamentale. La maggior parte delle persone vuole essere originale, soprattutto quando posta foto su Internet, ma in realtà si è molto più prevedibili di quanto si vorrebbe, e alla fine tutti fotografano le stesse cose. In Rete ci sono centinaia di migliaia di foto degli stessi tramonti a New York, degli stessi “pittoreschi” scorci di Venezia e di altre città, delle stesse cascate del Niagara, delle stesse piramidi. Chi segue un social network basato sulle immagini, come Instagram, sa bene di rischiare di imbattersi nello stesso soggetto immortalato in tutte le salse. Il problema dell’originalità delle immagini ai tempi della fotografia digitale e degli smartphone è talmente diffuso che un programmatore ha creato una app, a metà strada tra l’esperimento e la provocazione, che si collega ai principali social network ogni volta che inquadriamo un soggetto e ci impedisce materialmente di scattare la fotografia se vede che in rete ci sono troppi soggetti simili. Riconoscere queste immagini abusate è un gioco da ragazzi per PlaNet. La ricerca di Weyand ci permette anche di vedere quali sono le aree più fotografate del mondo (almeno quelle le cui immagini si trovano su Internet). Il meccanismo di riconoscimento di PlaNet divide la superficie terrestre in sezioni la cui dimensione dipende dal numero di foto geotaggate che vi sono state scattate: più l’area è fotografata, più ci sono elementi per localizzare una foto con precisione e più l’area è piccola. Dunque le aree meno fotografate e quelle con meno punti di riferimento, per esempio i deserti o le porzioni di oceano, sono più grandi e la localizzazione di una loro foto al loro interno sarà solitamente molto generica; le aree molto più popolate, e fotografate, come le grandi città europee e nardamericane offrono invece molti più elementi per un confronto e spesso PlaNet riesce a riconoscere le fotografie scattate al loro interno con una precisone assoluta, indicando strada e numero civico. Se uniamo queste straordinarie capacità alle tecnologie di riconoscimento facciale usate da molti social network per taggare i volti nostri e dei nostri conoscenti nelle fotografie che postiamo su Internet, cominciamo a sospettare che le magie dei geni del computer in molte serie televisive non siano così inverosimili come avevamo sospettato, e che anche noi con un po’ di pratica potremmo diventare dei formidabili detective.