Главные темы. Последние записи с тегом «диск». Страница 102

Сегодня 3 марта, понедельник

Какой рейтинг вас больше интересует?

получить код

Главная /

Главные темы

Тэг «диск»

Avi в mp 4

2015-03-25 23:00:31

+ развернуть текст сохранённая копия

Тэги: диски, файлы

Яндекс.Диск научился распознавать текст на изображениях

2015-03-25 15:09:05
... >В Яндекс.Диске появилась возможность ... >Когда на Диске тысячи фотографий, разложенных ...
+ развернуть текст сохранённая копия

В Яндекс.Диске появилась возможность искать изображения форматов JPEG, GIF и PNG, содержащие текст поискового запроса. Достаточно ввести в поисковую строку нужное слово, и система найдёт на Диске картинки, на которых оно встретится. В результатах поиска пользователи также увидят файлы и папки, в названиях и описаниях которых есть это слово, и документы, в тексте которых оно содержится.

Когда на Диске тысячи фотографий, разложенных по разным папкам, поиск по текстам позволит быстро найти среди них нужную. Например, скан договора с названием вроде scan723.JPG или фотографию визитки человека, с которым понадобилось связаться. Искать можно не только документы, но и любые фотографии, которые сделаны для того, чтобы сохранить текст, будь то объявление на двери подъезда или любопытный рекламный плакат в метро.

В основе поиска текстов на изображениях лежит технология оптического распознавания символов. Систем распознавания, опирающихся на эту технологию, много, и все они разные. Какие-то решают определённую задачу, например распознают партитуры, какие-то работают только с чистым текстом. Яндекс разработал свою универсальную систему распознавания текста, успешно работающую на самых разных по содержанию и качеству картинках. Подробности о том, как она работает, читайте в блоге Яндекса.

APPS-Блог http://apps.plushev.com/2015/03/25/3422/

Тэги: сервис, яндекс.диск

Что вы видите на этой картинке?

2015-03-25 13:11:19
... />
Когда на Диске тысячи фотографий, разложенных ... текстом. Для Яндекс.Диска мы разработали свою ...
+ развернуть текст сохранённая копия

Распознавание изображений — одна из самых сложных задач для компьютера. Мы уже рассказывали о том, как устроено компьютерное зрение и как оно применяется в наших сервисах — например, при поиске похожих изображений в Яндекс.Картинках. Теперь технология компьютерного зрения работает и в Яндекс.Диске — благодаря ей вы можете найти изображения форматов JPEG, GIF и PNG, содержащие текст поискового запроса. Достаточно ввести в поисковую строку нужное слово, и система найдёт на Диске картинки, на которых оно встретится. В результатах поиска вы увидите изображения с этим словом, документы, в тексте которых оно содержится, а также файлы и папки, в названиях и описаниях которых есть это слово.

Когда на Диске тысячи фотографий, разложенных по разным папкам, поиск по текстам позволит быстро найти среди них нужную. Например, скан договора с названием вроде scan723.JPG или фотографию визитки человека, с которым понадобилось связаться. Искать можно не только документы, но и любые фотографии, которые сделаны для того, чтобы сохранить текст, будь то объявление на двери подъезда или любопытный рекламный плакат в метро.

В основе поиска текстов на изображениях лежит технология оптического распознавания символов. Систем распознавания, опирающихся на эту технологию, много, и все они разные. Какие-то решают определённую задачу, например распознают партитуры, какие-то работают только с чистым текстом. Для Яндекс.Диска мы разработали свою универсальную систему, способную распознавать текст на картинках разных по виду, содержанию и, главное, качеству.

Система состоит из двух частей — классификатора картинок и модуля распознавания. Сначала классификатор, глубокая нейронная сеть, отбирает из всех картинок те, на которых изображён текст. Он учится отличать их от прочих на огромной базе изображений. Использование машинного обучения позволяет добиться высокого качества распознавания — ведь алгоритм опирается не на какие-то вручную заданные правила, а на опыт анализа миллионов разных картинок. Когда изображения с текстом отобраны, алгоритм находит на них линии, предположительно содержащие текст, — различать их помогает ещё одна нейронная сеть. На следующем этапе алгоритм оставляет только те линии текста, в которых он уверен.

Затем модуль распознавания разбивает линии текста на отдельные символы. Для каждого символа алгоритм выбирает несколько наиболее вероятных варинтов распознавания среди известных ему. Например, это могут быть буквы «О», «о» и цифра «0», очень похожие друг на друга. После этого в дело вступает языковая модель — алгоритм принимает решение, какой из символов-кандидатов подходит лучше всего. Языковая модель опирается на словари и учитывает не только сходство символов с теми, что знает система, но и контекст, то есть соседние символы. Если из нескольких вероятных символов складывается известное системе слово, то она может принять решение, что на картинке написано именно оно. Даже если некоторые символы-кандидаты в этом слове менее вероятны, чем другие.

Конечно, точность распознавания текста (а значит, и успех поиска) зависит от типа изображения, его чёткости, фона, на котором находится текст, и многих других факторов. Поэтому для разных видов изображений она разная. Например, для отсканированных документов точность распознавания текстов на русском языке составляет около 80%, для фотографий с надписями — 63,2%, а для скриншотов приближается к 100%. Помимо русского языка, система также распознаёт английский, украинский и турецкий. Точность распознавания текстов всего потока изображений более 70%. Это неплохой результат, но мы будем работать над его улучшением.

Тэги: ya.ru:author:5105614, ya.ru:text, диск, технологии, яндекса

Autocad2012 ключ

2015-03-24 23:00:31

+ развернуть текст сохранённая копия

Тэги: диски, файлы

Autocad 2011 key серийный номер

2015-03-24 21:00:31

+ развернуть текст сохранённая копия

Тэги: cd/dvd, диски

Страницы: ... 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 ...

Главная / Главные темы / Тэг «диск»

Блограйдеров
14507

Блогов
219941
(+0 сегодня)

Сообществ
1311
(+0 сегодня)

Рыбалка
по среднему баллу (5.00) в категории «Спорт»

Категория «Политика»

Взлеты Топ 5


+256	270	CAPTAIN
+215	287	badvista.org
+189	218	www.blogpr.ru - Лента постов
+184	235	СМИ 2.5
+177	215	Ksanexx

Падения Топ 5


-1	7	Equillibrium
-4	4	ЖЖ Марины Литвинович
-5	71	emil_savelev
-8	5	lqp
-11	129	Новости Инета

Загрузка...