Какой рейтинг вас больше интересует?
|
Главная / Главные темы / Тэг «lucene»
Основы Elasticsearch 2016-03-30 08:08:12
... rest api, использующий Lucene и написанный на ...
+ развернуть текст сохранённая копия
Elasticsearch — поисковый движок с json rest api, использующий Lucene и написанный на Java. Описание всех преимуществ этого движка доступно на официальном сайте. Далее по тексту будем называть Elasticsearch как ES.
Подобные движки используются при сложном поиске по базе документов. Например, поиск с учетом морфологии языка или поиск по geo координатам.
В этой статье я расскажу про основы ES на примере индексации постов блога. Покажу как фильтровать, сортировать и искать документы. Читать дальше →
Тэги: curl, elasticsearch, engine, java, json, lucene, rest, search, веб-разработка, поисковые, технологии
Как это сделано: префиксный поиск 2013-12-03 13:48:07
Мы живем во времена, когда кажется, что все просто и все есть. Нужно сделать масштабируемый ...
+ развернуть текст сохранённая копия
Мы живем во времена, когда кажется, что все просто и все есть. Нужно сделать масштабируемый проект — используем MongoDB, нужна очередь — вот RabbitMQ, нужно поднять функционал поиска — раз плюнуть: ставим Sphinx, Solr, ElasticSearch (нужное подчеркнуть).
Но здесь лишь доля правды: — при определенном везении можно поставить нужный сервер и все зашевелится. Загвоздка с поиском состоит в том, что пользователи уже порядком привыкли к высокой планке, которую задают «большие ребята», а тот поиск, что поднимется у вас «из коробки», будет явно недотягивать. И если очередь или базу данных вы можете добить железом прежде, чем будете оптимизировать, то поиск железом не добьешь.
Существую толстые книжки про настройки полнотекстового поиска, однако их мало кто читает. Сегодня я хотел бы на пальцах поговорить о том, что нужно учесть, когда вы делаете префиксный поиск с выводом результатов по мере набора слова или фразы.
Мы посмотрим, как с помощью нашего проекта http://indexisto.com сделан поиск на сайте http://maximonline.ru и сравним его с тем, что есть на других сайтах.
Для начала несколько примеров. Возьмем запрос «Битва за Лос Анджелес» и представим, что его напишут неправильно «Лос Анжелес биттва». Как видно, пользователь не знает точно, как пишется имя города, и забыл, как звучит название фильма, а также у него дрогнула рука в конце на слове «битва».
Выберем достойные проекты рунета, в которых есть префиксный поиск, и попробуем поискать там наш запрос:
Проект |
Правильный запрос |
Неправильный запрос |
afisha.ru
|
все ОК
|
Не найдено
|
ivi.ru
|
все ОК
|
Не найдено
|
vk.com
|
все ОК
|
Не найдено
|
maximonline.ru
|
все ОК
|
все ОК
|
Читать дальше →
Тэги: elasticsearch, group, lucene, mail.ru, блог, веб-разработка, компании, машины, поиск, поисковые, сайту, системы, технологии
Кардинальный переворот в архитектуре поиска Twitter 2011-04-15 23:03:13
... , а посредством версии Lucene, [...]
+ развернуть текст сохранённая копия
Не успел я опубликовать обновление об архитектуре Twitter, как они снова перекроили половину проекта =) На этот раз к паре Ruby+Scala активно вплелись технологии из мира Java. Наибольшим изменениям подверглась подсистема поиска твитов , о которой сегодня и пойдет речь. Новая архитектура поиска твитов Backend Поиск осуществляется теперь не с помощью MySQL-кластера, а посредством версии Lucene, [...]
Тэги: blende, lucene, netty, twitter
Кардинальный переворот в архитектуре поиска Twitter 2011-04-15 23:03:13
... , а посредством версии Lucene, [...]
+ развернуть текст сохранённая копия
Не успел я опубликовать обновление об архитектуре Twitter, как они снова перекроили половину проекта =) На этот раз к паре Ruby+Scala активно вплелись технологии из мира Java. Наибольшим изменениям подверглась подсистема поиска твитов , о которой сегодня и пойдет речь. Новая архитектура поиска твитов Backend Поиск осуществляется теперь не с помощью MySQL-кластера, а посредством версии Lucene, [...]
Тэги: blende, lucene, netty, twitter, масштабируемость
Архитектура Stack Exchange Network 2011-03-31 16:05:57
Stack Exchange Network представляет собой сеть из 46 сайтов вопросов-ответов на совершенно разные ...
+ развернуть текст сохранённая копия
Stack Exchange Network представляет собой сеть из 46 сайтов вопросов-ответов на совершенно разные темы от программирования до кулинарии. Проект вырос из известной в узких кругах тусовки программистов Stack Overflow, об архитектуре которой я уже рассказывал чуть больше года назад. Проект активно развивается и уже появилось приличное количество новой информации, которой я и спешу с Вами [...]
Тэги: 2008, analytic, asp, bacula, beyond, bind, centos, compare, cruisecontrol, dotnetopenid, flot, google, haproxy, iis, jquery, kiln, linq, lucene, markdownsharp, mercurial, monitor, mvc, nagios, net, pingdom, prettify, razor, recaptcha, redis, server, splunk, sql, studio, ubuntu, visual, window, wmd
Главная / Главные темы / Тэг «lucene»
|
Взлеты Топ 5
Падения Топ 5
|