Компания Google уже долгое время работает над системой искусственного интеллекта, способной распознавать объекты на фотографиях. В сервисе Google Фото применена достаточно примитивная версия этой системы, позволяющая находить среди всех пользовательских снимков те, на которых изображены коты, собаки, вода, горы, цветы, люди, еда и прочее. Но в лабораториях поискового гиганта разрабатывается куда более продвинутая версия этого искусственного интеллекта. На днях в блоге Google Research появилась новость о том, что команде Google Brain удалось достичь 93,9%-й точности при распознании фотографий. Для сравнения, в 2014 году этот показатель составлял 89,6%.

Может показаться, что увеличение точности на 4,3% за два года - это не слишком большой прирост, но в действительности система стала куда более точно описывать происходящее на снимке и более человечным языком. Инженерам Google удалось научить систему не только распознавать объекты на фотографиях, но и указывать взаимосвязь между ними.

"Например, модель классификации изображений скажет вам, что на изображении есть собака, трава и фрисби, а естественное описание будет включать цвет травы и то, какое взаимодействие происходит между собакой и фрисби", - рассказал Крис Шелью, инженер по программному обеспечению Google Brain.

Чтобы добиться такого результата, были использованы описания сотен тысяч, сделанные самими пользователями. Эти данные были занесены в базу TensorFlow и при обработке похожего изображения алгоритм повторно использует известные ему описания. В случае какого-то неизвестного действия на снимке система генерирует свои собственные описания.

Сторонние разработчики уже могут использовать обновлённую базу данных TensorFlow в своих приложения и сервисах.

Источник: androidauthority.com