Национальный корпус русского языка — крупнейшее электронное собрание текстов, включающее более 500 млн словоупотреблений. Это один из основных источников, к которому обращаются лингвисты, исследующие русский язык. Проект был запущен 9 лет назад, в апреле 2004 года. Корпус пополняется и поддерживается силами многих организаций, среди которых Институт русского языка имени В. В. Виноградова РАН, Институт проблем передачи информации РАН, МГУ и многие другие. С самого начала Яндекс разрабатывал адаптированную для НКРЯ версию поисковой машины для поиска текстов с разного рода разметкой.
Морфологическая разметка текстов корпуса осуществляется автоматически с помощью разработанной в Яндексе программы mystem. Однако у ряда текстов вручную «снята омонимия», то есть для каждого слова указаны его правильная словарная форма и грамматические характеристики. Для многих компьютерных лингвистов эта часть корпуса представляет особый интерес, так как её можно использовать при разработке морфологических анализаторов и для разных вычислительных экспериментов. Мы рады сообщить, что теперь часть текстов со снятой омонимией размером 1 млн словоупотреблений стала доступна для скачивания. Чтобы получить к ней доступ, необходимо зарегистрироваться и подписать лицензионное соглашение.
Maxthon Portable переносная версия шустрого, удобного веб-обозревателя для Windows, портативная версия браузера не требует установки. Maxthon Cloud Browser — этоДалее...
Любящая бабушка с удовольствием печет внукам пироги, лепит вареники с вишнями, угощает их конфетами и пряниками. Заботливая бабушка непременно свяжет им носочки, шарфы и варежки... А современная "бабушка", дизайнер по текстилю Toshiko Horiuchi Macadam, одарила своим вязанием не только собственных внуков, но и всех японских детей без исключения. Ее гигантская инсталляция Woods of Net, связанная из толстой и прочной разноцветной пряжи, это не просто творческий проект, но и действующий аттракцион, уникальная детская площадка, расположенная в музее под открытым небом Hakone Open Air Museum.