Поиск Яндекса автоматически распознаёт ошибки в запросах. Для определения ошибок используются данные о частоте и сочетаемости слов в запросах, история исправлений и уточнений запросов, которые делают сами пользователи, а также статистика употребления слов на крупных сайтах, таких как Википедия.
Основная задача исправления ошибок — восстановить правильное написание запроса, чтобы поиск находил именно то, что нужно пользователю, несмотря на ошибки при вводе. Ошибки или опечатки поиск определяет примерно в каждом десятом запросе.
Иногда правила автоматического исправления могут противоречить словарным нормам. Например, «Таиланд» в 85 случаях из ста пишут в поиске через «й», и с недавних пор поиск Яндекса перестал исправлять эту ошибку — по запросу «Тайланд» он просто ищет оба варианта написания.
Самые частые и самые сложные
Самые часто встречающиеся ошибки — это неправильные написания наиболее используемых в поиске слов. Например, «одноклассники» с одной буквой «с» или через букву «а», «онлайн» с «и» вместо «й» или «скачать» через «я». Таких ошибок много, но сами слова не вызывают большой сложности у пользователей — в августе 2013 года пользователи из России спросили слово «одноклассники» более 70 млн раз, при этом разные ошибки допускали менее чем в 3% случаев.
Есть часто употребляемые слова, которые вызывают у пользователей заметно больше затруднений. Из десяти тысяч самых часто используемых в поиске слов в августе 2013 года чаще всего ошибались в словах «комментарий», «девчонка» и «жесткий».
Наибольшие сложности у пользователей вызывают русские слова с двойными и непроизносимыми согласными, а также слова, заимствованные из других языков.
Новые слова
Для относительно новых слов часто существует несколько вариантов написания — одно и то же слово в разных словарях может писаться по-разному. Поиск Яндекса, руководствуясь статистикой запросов, автоматически определяет вариант, которого придерживается больше всего пользователей, и предлагает исправления для менее распространенных вариантов.
Сегодня на Яндекс.Картах появились панорамы Владимира, Осташкова, Смоленска, Суздаля, Твери, Торжка, Уфы и Юрьева-Польского, снятые с воздуха. Чтобы снять местные красоты с наиболее удачных ракурсов, маршрут облёта городов составляли наши краеведы.
Фотографы летали на высоте 150-200 метров — на вертолёте, к которому подвешен специальный съёмочный комплекс. Он состоит из пяти фотоаппаратов, смотрящих по сторонам и вниз, а также устройства подавления вибрации. Благодаря такому устройству получаются чёткие сферические панорамы, на них можно рассмотреть окрестности вплоть до 10 километров вокруг точки съёмки.
Например, Морозовский городок в Твери:
Успенский собор в Смоленске:
Нилова пустынь в Осташкове:
Кремль, Георгиевский собор в Юрьеве-Польском:
Церковь Покрова на Нерли во Владимире:
Торговая площадь в Суздале:
Борисоглебский монастырь в Торжке:
Все панорамы с воздуха можно увидеть на Яндекс.Картах этих городов, нажав одноимённую кнопку и выбрав наиболее понравившийся воздушный шар.
Сегодня мы открываем новый набор на Курсы информационных технологий Яндекса (КИТ). Эти курсы предназначены для студентов и молодых специалистов, которым интересны системное администрирование и информационная безопасность. Чтобы попасть на курсы, необходимо зарегистрироваться и выполнить несколько заданий в системе Яндекс.Contest. Запись открыта до 9 октября.
В этом году курсы состоят из семи лекций: «Построение виртуальных стендов», «Запускаем Linux: как изучать системы», IPv6, «Python для системного администратора»,PKI, «Информационная безопасность» и CGroups. Они будут проходить в московском офисе Яндекса с 14 октября до 27 ноября. Время вечернее — с 19:00 до 21:00. Для тех, кто не сможет посещать лекции, будет организована онлайн-трансляция.
На каждой лекции будет дано домашнее задание. По результатам его выполнения лучшим слушателям предложат пройти собеседование и попробовать себя в решении практических задач по системному и сетевому администрированию в департаменте эксплуатации Яндекса. Если практика будет успешной, мы можем пригласить вас остаться в Яндексе на постоянную работу.
Курсы информационных технологий проводятся уже в четвёртый раз. Посмотреть видеозаписи лекций прошлых лет можно на сайте КИТ.
Марина Максимова, менеджер по организационным вопросам
С сегодняшнего дня Яндекс и LinguaLeo помогают узнавать новое вместе. Теперь пользователи Яндекс.Перевода могут сохранять незнакомые английские слова на сервисе LinguaLeo для изучения, а пользователи LinguaLeo при изучении английского смогут переводить слова, фразы и целые тексты с помощью сервиса Яндекс.Перевод.
Машинный перевод Яндекса основан на статистике — система выбирает наиболее подходящие варианты перевода на основе сравнения тысяч параллельных текстов. Вот как это работает:
Мы продолжаем серию публикаций о безопасности в интернете, начатую рассказом о фишинге. Сегодня — об устройстве антивирусной системы Яндекса и способах обезопасить себя от вирусов в интернете.
Яндекс обрабатывает миллионы поисковых запросов. Ежедневно пользователи совершают около 50 миллионов переходов с поиска Яндекса на сторонние ресурсы — веб-страницы, которых к настоящему моменту насчитывается более 700 миллионов.
К сожалению, кроме полезных сайтов встречаются и те, которые: • пытаются при просмотре заразить компьютер пользователя вирусами; • предлагают пользователям загрузить и запустить заражённые файлы; • обманывают пользователя, чтобы получить его учётную запись или подписать на платные услуги с помощью SMS.
По оценкам Яндекса, доля таких сайтов в интернете не превышает одного процента, однако порой злоумышленники взламывают и заражают очень популярные сайты, которые посещают десятки и сотни тысяч пользователей в день.
Чтобы защитить пользователей от случайного перехода на такие страницы, Яндекс предупреждает о них в Поиске, Почте, Яндекс.Браузере, Элементах для Firefox, Яндекс.DNS, а также других сервисах и приложениях.
Существует несколько простых правил, которые помогут вам избежать заражения:
1. Следите за обновлениями операционной системы и браузера и используйте их последние версии. 2. Установите антивирус. Существует достаточно много бесплатных антивирусов, их список можно найти, например, в разделе «Помощь» на Яндексе. 3. Включите и настройте файрволл. 4. Используйте легальные копии программного обеспечения и скачивайте их только с официальных сайтов. 5. Используйте сложные пароли.
Для проверки сайтов Яндекс использует две антивирусные технологии: одна принадлежит компании Sophos, другая — собственная разработка Яндекса.
Технология Sophos построена на сигнатурном методе. Она проверяет код страницы на наличие определенных фрагментов (они называются сигнатурами), которые содержатся в базе вредоносных кодов. Это очень похоже на анализ текста на присутствие «плохих» слов или словосочетаний. Основное преимущество этого метода — скорость, а главный недостаток — невозможность поиска новых, ещё неизвестных вирусов.
Собственный антивирусный комплекс Яндекса использует анализ поведения и направлен как раз на выявление новых типов угроз. Антивирусная программа открывает исследуемый сайт и анализирует его поведение. Она проверяет, запрашивает ли браузер при просмотре сайта какие-нибудь дополнительные файлы, перенаправляет ли на другие страницы и так далее. Если при просмотре сайта какая-то программа начинает работать без ведома пользователя, то, скорее всего, сайт заражён. Он объявляется опасным для посещения, а код, который отвечает за такое поведение, добавляется в базу вирусных сигнатур. Теперь этими результатами может воспользоваться первый, более быстрый, метод анализа, а также чёрный список. Работая в паре, оба метода дополняют друг друга и позволяют быстро и надежно анализировать сайты в интернете.
Яндекс предупреждает не только пользователей, но и владельцев заражённых сайтов. Они могут следить за состоянием своего ресурса с помощью сервиса Яндекс.Вебмастер. В случае обнаружения вируса вебмастеру будет выслано письмо с предупреждением. Сайт, на котором Яндекс нашел вредоносное содержимое, обязательно будет перепроверен через какое-то время. Если в ходе повторной проверки окажется, что сайт всё ещё заражен, интервалы между перепроверками начнут увеличиваться. Чем раньше сайт будет обеззаражен, тем быстрее Яндекс узнает об этом и снимет пометку об опасности для пользователей.