Google Cloud Vision

Nel campo dei servizi gli investimenti e l’esperienza di Google, nel mondo informatico, sono senza pari.
La potenza tecnologica di Mountain View viene utilizzata attraverso alcuni prodotti e servizi celebri divenuti simboli e riferimenti nella società e nella vita di tutti i giorni dei propri utenti. Un nuovo capitolo sta per essere scritto nella storia di questo gigante dell’IT, nuove funzionalità che saranno ben presto utilizzate da gran parte degli sviluppatori.

Google ha annunciato il rilascio della versione beta pubblica del suo Cloud Vision API con funzionalità qual:i il riconoscimento di immagini e classificazione funzionale per applicazioni.
Le funzionalità spaziano dal semplice riconoscimento testuale OCR, al riconoscimento di oggetti all’interno di un’immagine come Google Photos.

In Google Photos gli utenti possono trovare le loro foto organizzate e categorizzate in base a ciò che hanno rivelato gli algoritmi di Google, come ad esempio persone, animali, fiori e punti di riferimento.

Questi automatismi aiutano a rimuovere alcune imperfezioni consentendo maggiore controllo sui contenuti visualizzati. Ad esempio si possono selezionare e mostrare solo le foto di persone felici o tristi all’interno della vostra app per aiutare ad evocare la stessa sensazione nei vostri utenti che possono essere raggiunti attraverso la funzionalità “sentiment analysis” prensente nelle API di Google Cloud Vision.

Qui elencate alcune delle funzionalità supportate dalle API:

Analisi delle immagini: ha la stessa base tecnologica di Google Photos, Cloud Vision API rileva ampi insiemi di oggetti nelle immagini, dai fiori a famosi luoghi di interesse.
Rilevamento contenuto inappropriato: sviluppato da Google SafeSearch, Cloud Vision API modera i contenuti rilevando le tipologie inappropriate.
Sentiment Analysis: Cloud Vision API è in grado di analizzare le emozioni di persone nelle immagini, come la gioia, il dolore e la rabbia, rilevando loghi di prodotti popolari.
Estrazione testo: riconoscimento ottico dei caratteri, comunemente chiamato OCR, consente di individuare il testo all’interno delle immagini ed estrarlo correttamente anche in base alla lingua.

 

Questa funzionalità tuttavia non è free anche se Google ha annunciato diverse fasce di prezzo.
La funzionalità di base OCR avrà un costo di soli 0,60$ ogni 1000 immagini, mentre il riconoscimento di etichette costerà 2$ ogni 1000 immagini.
Nessuna opzione particolarmente costosa considerando il servizio ricevuto, una valida alternativa meno costosa è il progetto Microsoft Oxford.

Google durante la fase beta di questa piattaforma limita gli utenti a 20 milioni di immagini al mese; quantitativo che sarà più che sufficiente per la maggior parte degli sviluppatori. alcune realtà sono già utilizzando questa piattaforma come ad esempio Yik Yak implementato funzionalità distrazione testuale.

Ulteriori informazioni riguardo il Cloud Vision Google sono qui.