Во многих фантастических фильмах и книгах один из главных героев — это компьютер. Он, как правило, не просто выполняет вычисления — скажем, прокладывает маршрут для космического корабля, — но и общается с героями-людьми как живой собеседник.
В основе такого общения лежит голосовой интерфейс — концепция, которая, в отличие от машины времени и других фантастических вещей, уже стала реальностью. Голосом, например, можно вводить запросы в поисковик или адреса в навигатор — это удобно, когда заняты руки.
Ядро любого голосового интерфейса — это технология распознавания речи. Однако для полноценного «общения» с человеком машине мало уметь правильно распознавать сказанные вслух слова. Чтобы походить на живого собеседника, компьютер должен понимать, что к нему обращаются, уметь улавливать суть сказанного и озвучивать ответы.
У Яндекса есть собственная система распознавания речи — Yandex SpeechKit. Она используется как в сервисах Яндекса — например, Навигаторе, — так и в продуктах сторонних разработчиков.
Сегодня мы дополнили SpeechKit тремя новыми технологиями, которые делают общение человека с компьютером более полноценным. Теперь наша система умеет включаться по голосовой команде, понимает смысл слов, а также не только слушает пользователя, но и отвечает ему — с помощью технологии синтеза речи.
Голосовая активация Когда вы хотите что-то сказать конкретному человеку, вы называете его по имени. Это своего рода условный сигнал: «Эй! То, что я сейчас скажу, адресовано тебе и только тебе». В Yandex SpeechKit таким сигналом выступает команда голосовой активации. Командой может служить любое слово или фраза — всё зависит от фантазии разработчика.
Когда пользователь произносит команду, компьютер переходит в режим распознавания — так как понимает: всё, что будет сказано в дальнейшем, предназначено ему. Нажимать кнопки не нужно, достаточно сказать кодовую фразу.
Голосовая активация в Yandex SpeechKit, по сути, представляет собой систему распознавания речи в миниатюре. Система запускается прямо на устройстве и не требует доступа в интернет. Она анализирует весь входящий звуковой поток на предмет наличия речи, и, если речь обнаружена, начинает искать в ней кодовую фразу. Такой подход позволяет сэкономить заряд батареи в смартфоне или планшете.
Выделение смысловых объектов Представьте, что вы услышали фразу «В Москве сегодня семь градусов тепла». Вам без дополнительных объяснений понятно, что «Москва» — это город, «сегодня» — это 30 октября, а «семь градусов» — это температура воздуха. Иначе говоря, вы умеете извлекать из слов смысл.
В этом умении человек оставляет компьютер далеко позади, но кое-чему научить машину всё же можно. Мы добавили в Yandex SpeechKit технологию выделения в распознанном тексте смысловых объектов. Такими объектами могут быть дата и время, имена и фамилии или адреса.
Технология позволяет управлять компьютером или смартфоном простыми фразами, которые не нужно запоминать специально. Например, «Поставь будильник на семь утра» или «Поехали на улицу Льва Толстого, дом 16». Фраза может звучать по-разному — система поймёт, что «Набери номер Ивана Ивановича» и «Позвони Ивану Ивановичу» — это одно и то же. Yandex SpeechKit умеет анализировать контекст и поэтому уяснит, что во фразе «Позвони Владимиру» имеется в виду человек, а во фразе «Поехали во Владимир» — город.
Синтез речи Хороший собеседник умеет не только слушать, но и отвечать. Поэтому в Yandex SpeechKit теперь есть технология синтеза речи — она позволяет компьютеру проговаривать текст вслух. Например, может рассказать про себя сама:
Синтез речи — это задача, обратная распознаванию речи. В случае с распознаванием система получает звук, который надо преобразовать в текст, а в случае с синтезом — текст, который надо озвучить.
К синтезу речи существуют разные подходы. Один из них предполагает запись диктором отдельных фрагментов (сэмплов), из которых впоследствии «склеивается» речь. Такой подход трудоёмок, а кроме того, синтезированная таким способом речь звучит неестественно: обрывисто и с паузами в самых неожиданных местах.
В Yandex SpeechKit для синтеза речи мы используем систему на базе скрытых марковских моделей. Акустическая модель принимает на вход последовательность фонем и выдаёт на выходе соответствующий им звук. Это позволяет добиться более плавных интонаций, гибко управлять скоростью речи и даже придавать ей те или иные эмоции.
*** Все технологии, о которых мы рассказали, с сегодняшнего дня входят в библиотеку SpeechKit Mobile SDK и облачный сервис SpeechKit Cloud и доступны сторонним разработчикам. Они могут встраивать их в свои продукты: мобильные приложения, игры, компьютерные программы, корпоративные сервисы. О том, как это сделать, можно узнать на сайте речевых технологий Яндекса.
Чтобы показать новые возможности SpeechKit, мы выпустили демонстрационное приложение Яндекс.Диктовка. Оно предназначено для набора текста голосом. Чтобы начать набор, достаточно произнести фразу «Яндекс, записывай». Приложение начнёт слушать пользователя и преобразовывать его речь в текст в режиме реального времени.
Редактировать текст тоже можно голосом. Вы можете сказать, например, «Удали последнее слово», «Начни с новой строки», «Выдели весь текст», «Добавь весёлый смайлик» — и Яндекс.Диктовка выполнит ваше пожелание. По команде «Прочитай всё» приложение озвучит текст, который вы надиктовали. Готовый текст можно сохранить как заметку, отправить в виде письма или смс. Это тоже можно сделать голосом.
Чтобы Диктовка лучше понимала вас, советуем говорить чётко и в микрофон. Если приложение неверно распознало то или иное слово, нажмите на кнопку «Корректор» и произнесите его ещё раз. Так вы поможете сделать речевые технологии Яндекса ещё лучше.
Диктовка уже доступна в магазине приложений Яндекса, а позже появится и в магазинах Google Play и App Store.
В интернете часто можно встретить рекламу, которая изо всех сил пытается заставить вас кликнуть по ней. Строго говоря, это и есть задача рекламы, но иногда её решают не самым честным способом. Бывает, что рекламные блоки содержат шокирующие или неприличные изображения, агрессивную анимацию и прочие элементы, вынуждающие невольно обратить на них внимание. Шокирующая реклама неприятна сама по себе, а особенно — для детей и впечатлительных людей. Кроме того, иногда её используют мошенники: баннер с такой рекламой вполне может вести на фишинговый или заражённый сайт.
Сегодня мы выпустили новую версию Яндекс.Браузера со встроенной защитой от шокирующей и мошеннической рекламы. Новое дополнение называется Антишок. Оно защищает вас и ваших близких от рекламы, которую вы предпочли бы не видеть. Достаточно включить Антишок в разделе «Дополнения», и опасная или неприятная реклама исчезнет. При желании вы можете добавить любой сайт в исключения, чтобы реклама на нём не блокировалась, или пожаловаться на рекламный блок вручную, и больше вы его не увидите.
Другое обновление в этой версии Яндекс.Браузера ускоряет просмотр видеороликов даже при медленном интернете. Когда скорость соединения недостаточна, ролики загружаются слишком медленно, и смотреть их не очень комфортно. Благодаря обновлённому режиму Турбо браузер сжимает потоковое видео на своей стороне, уменьшая объём потребляемого трафика и ускоряя воспроизведение ролика.
Турбо с поддержкой ускорения загрузки видео доступен в том числе и в мобильной версии Яндекс.Браузера.
Кроме того, теперь в Яндекс.Браузер можно устанавливать дополнения из каталога Opera Addons.
Скачать новую версию Яндекс.Браузера можно на browser.yandex.ru. Оставляйте ваши отзывы и делитесь впечатлениями в комментариях к этой записи или в клубе Яндекс.Браузера.
Один из важнейших показателей качества карты — это её читаемость. Чем выше читаемость, тем проще человеку сориентироваться по карте, то есть соотнести её с незнакомой местностью. Для этого на карте должны быть ориентиры — такие же, как и в реальности. Согласно нашим исследованиям в разных городах России, 43% пользователей геосервисов как минимум раз в месяц ищут на карте какие-либо ориентиры. Обычно это здания, причём чаще всего люди обращают внимание на их назначение (школа, торговый центр, храм и так далее) и высоту.
Значки объектов и подписи к ним появились на Яндекс.Картах несколько месяцев назад. Сегодня мы сделали ещё один большой шаг в сторону повышения читаемости карты — все здания на Яндекс.Картах стали объёмными. Теперь, находясь на улице рядом с высоким зданием, можно быстро найти его на карте и правильно сориентироваться. Или, наоборот, сидя дома и планируя маршрут, запомнить, что направо стоит повернуть после высотки.
Для того чтобы показать высоту большинства зданий, достаточно просто «приподнять» контур дома. Однако во многих городах есть особенные сооружения, которые служат отличными ориентирами. Рисовать их «коробкой» было бы неправильно. Поэтому такие здания мы отображаем в виде простых 3D-моделей. Они выделяются на фоне остальных домов и позволяют легче воспринимать карту. Сейчас на картах более 1000 таких моделей в разных городах, со временем их станет больше.
Если вам хочется построить объёмный город самостоятельно, приглашаем на Народную карту. С сегодняшнего дня там появилась возможность указывать высоту зданий. Города и посёлки будут расти прямо у вас на глазах: сразу после ввода цифры домик поднимется на нужную высоту на слое «Cхема». Попробуйте сами.
Для этого проекта мы обработали огромный объём данных и уточнили высоту множества зданий в разных городах. Заодно нарисовали специальные тепловые карты — чтобы можно было лучше почувствовать разношёрстность или, наоборот, однообразность застройки того или иного города. Вот, например, Казань (тепловые карты других российских городов-миллионников можно найти здесь):
Новые карты доступны для России, Беларуси и Казахстана на maps.yandex.ru, в мобильных приложениях Яндекс.Карт, а также через API. Если вы видите, что тот или иной дом отображается на карте неточно — пожалуйста, сообщите нам об этом, и мы всё поправим.
Мы будем и дальше повышать читаемость Яндекс.Карт — так, чтобы для понимания ситуации и ориентирования на местности хватало одного взгляда на экран. Следите за новостями в блоге Яндекса по метке «Карты» и в блоге карт.
Люди пользуются интернетом всегда приблизительно в одно и то же время. Различия есть только между разными днями недели, а все понедельники выглядят примерно так:
Активность пользователей интернета по времени суток (понедельник)
Одно из немногих событий, которое влияет на время активности людей в интернете, — это перевод часов. Перед переходом на постоянное зимнее время, который состоится уже в эти выходные, мы посмотрели, как менялась активность людей в интернете в прошлые разы. После 31 октября 2010 года и после 27 марта 2011 года.
Сразу после перевода часов, в воскресенье, люди продолжают жить по старому времени. Весной день у пользователей интернета начинается на час позже, а осенью — на час раньше. К понедельнику эта разница сокращается примерно до 10-20 минут, а к пятнице исчезает совсем.
Весенний перевод часов (2011 год)
К осеннему переводу часов, когда ко сну добавляется дополнительный час, люди приспосабливаются значительно проще и быстрее.
Великое дело искусство. В магазинах очереди давно исчезли, а в кинотеатрах остались. Не спасает даже электронный билет. Все равно приходится стоять в очереди в кассу, чтобы обменять его на обычный. Мы придумали технологию Smartpass, которая решает эту проблему и позволяет проходить в зал по электронному билету. Подносишь QR-код к сканеру на входе — и вперёд. Сегодня новую технологию начал использовать кинотеатр «Формула Кино Горизонт».
В качестве сканера мы используем iPad mini, на который устанавливаем свою программу. Она работает со всеми электронными билетами в кино. Неважно, где вы их купили — на сайте кинотеатра, на Яндекс.Билетах или другом сервисе. Сохраните полученный QR-код в смартфоне — это и будет вашим пропуском в кинозал. Если ваш мобильный не умеет сохранять QR-код, можно просто ввести номер билета. Или заранее распечатать электронный билет: Smartpass распознаёт QR-код и в таком виде.
Светлана Перловская, руководитель проекта:
Сейчас ситуация с электронными билетами в кино довольно странная. Человек вроде бы купил билет, но не может пройти по нему в зал. Ему нужно идти в кассу и получать обычный билет, чтобы показать его билетёру. Кинотеатру это нужно ещё и для того, чтобы отметить в своей системе продаж, сколько людей пришли по электронному билету. Наши сканеры решают и ту, и другую задачу.
Программа, установленная на iPad, связана по локальной сети с системой продажи билетов «UCS-Премьера». Этой системой пользуется большинство кинотеатров. Когда вы подносите к сканеру QR-код, программа считывает его, переводит в числовой код (тот же самый, что и на билете) и отправляет в систему продажи. Та сверяет данные и отвечает, всё ли в порядке. Если да, можно проходить в зал.
Технология, которую мы предлагаем, хороша тем, что не требует от кинотеатров серьёзных финансовых вложений. Считывающие устройства на основе iPad стоят в разы дешевле, чем промышленные сканеры, которые используются, например, в спортивной индустрии. Кроме того, Smartpass — гибкая система, которую легко адаптировать под нужды кинотеатра. Важно также, что для обслуживания Smartpass не нужны дополнительные люди: мы сами следим за тем, чтобы всё работало как надо.
Пока новая технология запущена в экспериментальном режиме. До конца года сканеры Smartpass появятся в 20 кинотеатрах «Формулы Кино» — в Москве, Новосибирске, Краснодаре и Рязани.