Компания Google выпустила API сервиса компьютерного зрения Vision Cloud. Использование API позволит реализовать распознавание различных объектов. Об этом сообщается в официальном блозі Google.
С помощью Vision Cloud API разработчики могут реализовать в своих проектах чтения письменного текста, распознавания предметов, логотипов, человеческих лиц и достопримечательностей. Кроме того, облачный сервис помогает распознать опасные изображения и некоторые базовые эмоции человека: гнев, радость, удивление.
Watching this work is like magic! @googlecloud limited preview of the Vision Cloud API - https://t.co/KoB8El505O pic.twitter.com/rzJXY2ROCi
— Mandel Mark (@Neurotic) 2 декабря 2015
Для демонстрации возможностей API представители компании показали несколько примеров на простом колесном работе на базе Raspberry Pi. В частности, робот показал способность распознавать различные объекты и называть их вслух. Кроме того, в опубликованном ролике робот подъезжает ближе к человеку, если видит улыбающееся лицо.
google's new Vision Cloud API helps teach machines to better understand images https://t.co/CtpfJQ75RR pic.twitter.com/bklyTAOd8K
— The Next Web (@TheNextWeb) 3 декабря 2015
Aww yeah. Google's new Vision API, aka "pass a photo and understand what's in it". https://t.co/t3zA1Ro0nq pic.twitter.com/uS3BYjK2O5
— Joe Walnes (@joewalnes) 3 декабря 2015
Сообщается, API позволяет распознавать объекты и читать надписи на разных языках.
Напомним, в ноябре доступ к своему сервису распознавания эмоций открыла Microsoft.
Комментарии