Алгоритмы. Теория и практическое применение
2017-02-01 12:24:05
Алгоритмы – это рецепты, которые ...
+ развернуть текст сохранённая копия
Алгоритмы – это рецепты, которые делают возможным эффективное программирование. Их изучение позволяет усвоить общие подходы к решению задач и накапливать полезные методики для их решения.
Тэги:
алгоритмах,
книги,
математике
Разделение текста на предложения с помощью Томита-парсера
2017-01-11 08:26:39
Чтобы подготовить русскоязычные тексты для дальнейшего анализа, мне однажды понадобилось разбить их ...
+ развернуть текст сохранённая копия
Чтобы подготовить русскоязычные тексты для дальнейшего анализа, мне однажды понадобилось разбить их на предложения. Разумеется, автоматически. Что приходит на ум в первую очередь, если нужно разделить текст на предложения? Разбить по точкам — угадал?
Если вы начнете это делать, то довольно быстро столкнетесь с тем, что точка — это не всегда разделитель предложений (“т.к.”, “т.д.”, “т.п.”, “пр.”, “S.T.A.L.K.E.R.”). Причем эти токены не всегда будут исключениями при разбивке текста на предложения. Например, “т.п.” может быть в середине предложения, а может и в конце.
Вопросительный и восклицательный знак тоже не всегда разделяют текст на предложения. Например, “Yachoo!”. Предложения могут разделять и другие знаки, например, двоеточие (когда следует список из отдельных утверждений).
Поэтому я долго не думая поискал готовый инструмент и остановился на Томита-парсере от Яндекса. О нем и расскажу.
Читать дальше →
Тэги:
language,
natural,
nlp,
php,
processing,
segmentator,
алгоритмы,
машинное,
обучение,
программирование,
томита-парсер
Синтаксический анализ текстов с помощью SyntaxNet
2016-12-14 14:50:30
Для одной из задач мне понадобился синтаксический анализатор русскоязычных текстов. Что это такое. ...
+ развернуть текст сохранённая копия
Для одной из задач мне понадобился синтаксический анализатор русскоязычных текстов. Что это такое. Например, у нас есть предложение «Мама мыла раму». Нам нужно получить связи слов в этом предложении в виде дерева:
Из этого дерева понятно, что связаны слова «мама» и «мыла», а также «мыла» и «раму», а слова «мама» и «раму» напрямую не связаны.
Статья будет полезна тем, кому понадобился синтаксический анализатор, но не понятно, с чего начать.
Я занимался этой темой несколько месяцев назад, и на тот момент нашел не много информации по поводу того, где бы взять готовый и желательно свободный анализатор.
Читать дальше →
Тэги:
maltparser,
nlp,
php,
python,
syntaxnet,
tensorflow,
алгоритмы,
анализ,
машинное,
обучение,
программирование,
синтаксический
Российские учёные написали софт для поиска лекарства против старения
2016-12-07 19:30:16
Тайна вечной жизни и отыскание рецепта лекарства против старения столетиями не давали покоя ...
+ развернуть текст сохранённая копия
Тайна вечной жизни и отыскание рецепта лекарства против старения столетиями не давали покоя многочисленным учёным умам. Исследователи изучали строение человеческого организма, ставили бесчисленные эксперименты на насекомых, грызунах и животных, в попытке выяснить: как можно замедлить процесс старения? Но, несмотря на ряд громких заявлений от различных научных команд из разных стран, воз и ныне там. Российские […]
Тэги:
алгоритмы,
бессмертие,
исследования,
медицина,
россия,
старение
Базовый алгоритм в наших мозгах активирует интеллект
2016-11-24 13:30:02
... мозгах содержится базовый
алгоритм, который позволяет нам ...
+ развернуть текст сохранённая копия
В наших мозгах содержится базовый алгоритм, который позволяет нам не только узнавать котиков на любых изображениях в Интернете, но и запускает интеллект, которые делает нас теми, кем мы являемся: разумными существами, людьми. «В основе наших сложных вычислений в мозге лежит относительно простая математическая логика», говорит доктор Джо Тсьен, нейробиолог из медицинского колледжа Джорджии при Augusta […]
Тэги:
алгоритмы,
интеллект,
мозг,
наука