Главные темы. Последние записи с тегом «нкря»

Сегодня 9 января, пятница

Какой рейтинг вас больше интересует?

получить код

Главная /

Главные темы

Тэг «нкря»

Национальный корпус русского языка

2013-04-22 13:35:05
... разрабатывал адаптированную для НКРЯ версию поисковой машины ...
+ развернуть текст сохранённая копия

Национальный корпус русского языка — крупнейшее электронное собрание текстов, включающее более 500 млн словоупотреблений. Это один из основных источников, к которому обращаются лингвисты, исследующие русский язык. Проект был запущен 9 лет назад, в апреле 2004 года. Корпус пополняется и поддерживается силами многих организаций, среди которых Институт русского языка имени В. В. Виноградова РАН, Институт проблем передачи информации РАН, МГУ и многие другие. С самого начала Яндекс разрабатывал адаптированную для НКРЯ версию поисковой машины для поиска текстов с разного рода разметкой.

Морфологическая разметка текстов корпуса осуществляется автоматически с помощью разработанной в Яндексе программы mystem. Однако у ряда текстов вручную «снята омонимия», то есть для каждого слова указаны его правильная словарная форма и грамматические характеристики. Для многих компьютерных лингвистов эта часть корпуса представляет особый интерес, так как её можно использовать при разработке морфологических анализаторов и для разных вычислительных экспериментов. Мы рады сообщить, что теперь часть текстов со снятой омонимией размером 1 млн словоупотреблений стала доступна для скачивания. Чтобы получить к ней доступ, необходимо зарегистрироваться и подписать лицензионное соглашение.

Команда Национального корпуса русского языка

Тэги: mystem, ya.ru:author:64682324, ya.ru:text, нкря, русский, язык

Главная / Главные темы / Тэг «нкря»

Блограйдеров
14520

Блогов
219970
(+0 сегодня)

Сообществ
1312
(+0 сегодня)

ЖЖ все стерпит
по сумме баллов (758) в категории «Истории»

Категория «Фотографы»

Взлеты Топ 5


+192	206	МАЛЕНЬКАЯ_ПОНИ
+153	207	Velimira
+153	213	Little Showroom
+152	209	Свадебный фотограф Петербург, Тайланд, Куба, острова
+149	208	ROMAHA.SU

Падения Топ 5


-1	18	Журнал Интервальщика
-1	74	Фотоблог на ТеМу...
-1	25	White trash beautiful.
-1	5	Blue_cat
-2	28	MODRA_NEST

Загрузка...