Во многих фантастических фильмах и книгах один из главных героев — это компьютер. Он, как правило, не просто выполняет вычисления — скажем, прокладывает маршрут для космического корабля, — но и общается с героями-людьми как живой собеседник.
В основе такого общения лежит голосовой интерфейс — концепция, которая, в отличие от машины времени и других фантастических вещей, уже стала реальностью. Голосом, например, можно вводить запросы в поисковик или адреса в навигатор — это удобно, когда заняты руки.
Ядро любого голосового интерфейса — это технология распознавания речи. Однако для полноценного «общения» с человеком машине мало уметь правильно распознавать сказанные вслух слова. Чтобы походить на живого собеседника, компьютер должен понимать, что к нему обращаются, уметь улавливать суть сказанного и озвучивать ответы.
У Яндекса есть собственная система распознавания речи — Yandex SpeechKit. Она используется как в сервисах Яндекса — например, Навигаторе, — так и в продуктах сторонних разработчиков.
Сегодня мы дополнили SpeechKit тремя новыми технологиями, которые делают общение человека с компьютером более полноценным. Теперь наша система умеет включаться по голосовой команде, понимает смысл слов, а также не только слушает пользователя, но и отвечает ему — с помощью технологии синтеза речи.
Голосовая активация Когда вы хотите что-то сказать конкретному человеку, вы называете его по имени. Это своего рода условный сигнал: «Эй! То, что я сейчас скажу, адресовано тебе и только тебе». В Yandex SpeechKit таким сигналом выступает команда голосовой активации. Командой может служить любое слово или фраза — всё зависит от фантазии разработчика.
Когда пользователь произносит команду, компьютер переходит в режим распознавания — так как понимает: всё, что будет сказано в дальнейшем, предназначено ему. Нажимать кнопки не нужно, достаточно сказать кодовую фразу.
Голосовая активация в Yandex SpeechKit, по сути, представляет собой систему распознавания речи в миниатюре. Система запускается прямо на устройстве и не требует доступа в интернет. Она анализирует весь входящий звуковой поток на предмет наличия речи, и, если речь обнаружена, начинает искать в ней кодовую фразу. Такой подход позволяет сэкономить заряд батареи в смартфоне или планшете.
Выделение смысловых объектов Представьте, что вы услышали фразу «В Москве сегодня семь градусов тепла». Вам без дополнительных объяснений понятно, что «Москва» — это город, «сегодня» — это 30 октября, а «семь градусов» — это температура воздуха. Иначе говоря, вы умеете извлекать из слов смысл.
В этом умении человек оставляет компьютер далеко позади, но кое-чему научить машину всё же можно. Мы добавили в Yandex SpeechKit технологию выделения в распознанном тексте смысловых объектов. Такими объектами могут быть дата и время, имена и фамилии или адреса.
Технология позволяет управлять компьютером или смартфоном простыми фразами, которые не нужно запоминать специально. Например, «Поставь будильник на семь утра» или «Поехали на улицу Льва Толстого, дом 16». Фраза может звучать по-разному — система поймёт, что «Набери номер Ивана Ивановича» и «Позвони Ивану Ивановичу» — это одно и то же. Yandex SpeechKit умеет анализировать контекст и поэтому уяснит, что во фразе «Позвони Владимиру» имеется в виду человек, а во фразе «Поехали во Владимир» — город.
Синтез речи Хороший собеседник умеет не только слушать, но и отвечать. Поэтому в Yandex SpeechKit теперь есть технология синтеза речи — она позволяет компьютеру проговаривать текст вслух. Например, может рассказать про себя сама:
Синтез речи — это задача, обратная распознаванию речи. В случае с распознаванием система получает звук, который надо преобразовать в текст, а в случае с синтезом — текст, который надо озвучить.
К синтезу речи существуют разные подходы. Один из них предполагает запись диктором отдельных фрагментов (сэмплов), из которых впоследствии «склеивается» речь. Такой подход трудоёмок, а кроме того, синтезированная таким способом речь звучит неестественно: обрывисто и с паузами в самых неожиданных местах.
В Yandex SpeechKit для синтеза речи мы используем систему на базе скрытых марковских моделей. Акустическая модель принимает на вход последовательность фонем и выдаёт на выходе соответствующий им звук. Это позволяет добиться более плавных интонаций, гибко управлять скоростью речи и даже придавать ей те или иные эмоции.
*** Все технологии, о которых мы рассказали, с сегодняшнего дня входят в библиотеку SpeechKit Mobile SDK и облачный сервис SpeechKit Cloud и доступны сторонним разработчикам. Они могут встраивать их в свои продукты: мобильные приложения, игры, компьютерные программы, корпоративные сервисы. О том, как это сделать, можно узнать на сайте речевых технологий Яндекса.
Чтобы показать новые возможности SpeechKit, мы выпустили демонстрационное приложение Яндекс.Диктовка. Оно предназначено для набора текста голосом. Чтобы начать набор, достаточно произнести фразу «Яндекс, записывай». Приложение начнёт слушать пользователя и преобразовывать его речь в текст в режиме реального времени.
Редактировать текст тоже можно голосом. Вы можете сказать, например, «Удали последнее слово», «Начни с новой строки», «Выдели весь текст», «Добавь весёлый смайлик» — и Яндекс.Диктовка выполнит ваше пожелание. По команде «Прочитай всё» приложение озвучит текст, который вы надиктовали. Готовый текст можно сохранить как заметку, отправить в виде письма или смс. Это тоже можно сделать голосом.
Чтобы Диктовка лучше понимала вас, советуем говорить чётко и в микрофон. Если приложение неверно распознало то или иное слово, нажмите на кнопку «Корректор» и произнесите его ещё раз. Так вы поможете сделать речевые технологии Яндекса ещё лучше.
Диктовка уже доступна в магазине приложений Яндекса, а позже появится и в магазинах Google Play и App Store.
Как увеличить конверсию Вашего сайта (бесплатная книга)
Как увеличить конверсию Вашего сайта (бесплатная книга) Про поведенческие факторы уже сказано столько, что, пожалуй, сложно найти человека, их не попробовавшего применить для улучшения позиций своего сайта. Одни свято верят в то, что поведенческие факторы работают, и вообще они являются определяющим элементов стратегии поискового продвижения. Есть и другие, кто считает попытки влияния на поведенческие метрики [...]
Предоставляемая информация верна для любой платежной системы. В том числе для систем DSS PCI, простого эквайринга (прием платежей банковскими картами), виртуальных платежных систем (яндекс.деньги, вебмани, робокасса и др).
Обсуждение статьи «Скомпрометированы транзакции плательщиков RBK Money» показало критичную безграмотность некоторых комментирующих. Обычно свет знаний у невежества вызывает страх и раздражение, что интересно отследить по комментариям. Я попытался дать разъяснения там в обсуждениях, за что и поплатился.
Как программировать безопасный прием платежей? Поделюсь опытом, расскажу и покажу. Для нуждающихся ссылки на прувы (доказательства) приведены в конце статьи.
Читать дальше →
2014-10-22 14:31:18
... критериям. Новая платформа Яндекс.Денег призвана сделать ... читайте в блоге Яндекс.Денег.+ развернуть текстсохранённая копия
Яндекс.Деньги запустили платформу vmeste.yandex.ru для сбора средств в интернете. Эта платформа позволит сделать краудфандинг проще благодаря трём новым платёжным инструментам, которыми могут пользоваться люди или организации — например, благотворительные фонды.
Приём пожертвований в интернете должен быть организован одновременно просто — чтобы людям было удобно переводить средства — и технологично, так как речь всё-таки идёт о деньгах. Сейчас на рынке существует не так много решений, которые соответствуют обоим критериям. Новая платформа Яндекс.Денег призвана сделать сбор денег через интернет доступным и удобным — и для тех, кто хочет помочь, и для организаций, занимающихся сбором пожертвований.
Страница для приёма платежей поможет любому человеку собрать средства на разные цели: от записи музыкального альбома до подарка на день рождения коллеги. Форма для сбора средств позволит благотворительным организациям быстро организовать приём пожертвований, собрав нужную форму в конструкторе и вставив её на сайт. Третий инструмент — Касса для благотворительности — это полноценное решение для приёма интернет-платежей, адаптированное для благотворительных фондов. Касса позволяет принимать платежи всеми популярными способами и не беспокоиться о технической стороне дела.
Подробности о новых инструментах читайте в блоге Яндекс.Денег.
2014-10-22 12:40:26
... из альбома Яндекс. Яндекс несколько месяцев ... управление сайтом в Яндекс Вебмастере. Подтверждение ...
+ развернуть текстсохранённая копия
В предыдущем посте с красивыми осенними картинками (а здесь – осенние цветы) предлагалось при желании бесплатно скачать большие изображения-фотки из альбома Яндекс. Яндекс несколько месяцев назад изменил очень свои альбомы, поэтому кто-то не понимает, как теперь сохранить на компьютер или […]
Связанные статьи и новости:
Зеленые и серые стрелочки на гифках Яндекс.Фоток
Видеоурок. Загрузка сразу всего альбома Яндекс.Фотки с помощью программы Orbit Downloader
Как дать ссылку. Копирование ссылки на запись, страницу, комментарий
Права на управление сайтом в Яндекс Вебмастере. Подтверждение мета-тэга для дневника ЛиРу
Права на управление сайтом в Яндекс Вебмастере. Подтверждение мета-тэга для дневника ЛиРу