«Яндекс» научился искать текст на фото

Если Вы не нашли подходящего раздела, для вопроса связанного с web строительством, то Вам сюда.
Аватара пользователя
Slash
Администратор
Сообщения: 2029
Поблагодарили: 62 раза

«Яндекс» научился искать текст на фото

Сообщение Slash » Сб май 16, 2015 9:35 pm

«Яндекс» анонсировал новый функционал в «Яндекс.Диске». Инструмент позволяет пользователям искать текст на изображениях, загруженных в сетевой каталог. Для этого используется технология распознавания текста.

Как отметили в компании, сегодня пользователи хранят огромное количество изображений: сканы документов, фотографии объявлений и визиток, личные фото. Чаще всего такие файлы хранятся с малоинформативными названиями («scan», «img1» и т.п.). Найти определенный файл при помощи стандартных инструментов ОС в этом случае невозможно. После запуска новой функции можно осуществлять поиск по словам на картинках.

Новый инструмент способен распознавать английские, русские, турецкие и украинские слова, работая с файлами в форматах GIF, JPEG и PNG.
Для запуска функции компания предварительно проиндексировала все картинки, загруженные пользователями на сервис. Анализ показал, что 22% изображений содержит текст. В настоящее время все загружаемые фотографии автоматически сканируются на присутствие текста.
В основе нового поиска используется технология оптического распознавания текстовых символов. Специалисты «Яндекса» создали собственную универсальную систему распознавания символов на изображениях, которые имеют различное качество, содержимое и формат. Используются две подсистемы – классификатор изображений и блок распознавания.

Первоначально классификатор отбирает из изображений те, которые содержат текст. На отобранных картинках алгоритм находит линии, которые содержат текст. Затем оставляются только те текстовые линии, в которых система уверена. Далее модуль распознавания разбивает найденный текст на отдельные символы. Далее для символов выбираются наиболее вероятные варианты. К примеру, это могут быть цифра «0» и буквы «о», «О», которые внешне очень похожи. После этого применяется языковая модель – принимается решение, какой символ подходит лучше.

Точность распознавания зависит от четкости и типа изображения, а также других факторов. Для отсканированных документов параметр точности распознавания составляет почти 80% (для русского языка), для скриншотов – около 100%, для фото с надписями – 63,2%.
Реклама

Вернуться в «Прочее»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя