Скрипты для полнотекстового поиска, какие знаете?

Язык не особо важный. Наличие индексации, словарей обязательно.

Связанное: ASPSeek поисковая машина

6 симпатий

Nutch - это хорошо созревший, готовый к производству веб-паук. Nutch обеспечивает мелкозернистую конфигурацию, опираясь на структуры данных Apache Hadoop™, которые отлично подходят для пакетной обработки.

http://nutch.apache.org/

Мы работали с ним в 2006 году, т.е. уже более 10 лет не занимались ею. Java.

И второй движок

DataparkSearch

DataparkSearch Engine - это полнофункциональная поисковая система с открытым исходным кодом, предназначенная для организации поиска по веб-сайту, группе веб-сайтов, интрасети или локальной системе.

  1. C 63.1%
  2. xBase 11.7%
  3. Makefile 7.2%
  4. Shell 5.8%

http://www.dataparksearch.org/

7 симпатий

ASPseek - это полнофункциональная средне- и крупномасштабная поисковая система на основе SQLL.

https://github.com/Toxu-ru/aspseek

Он состоит из робота индексирования, поискового демона и поискового интерфейса (программа CGI). Эти программы написаны на C ++ с использованием библиотеки STL.

P.S. спасибо за предоставленный дистрибутив evg. Но он ругается.

configure:3882: gcc -V >&5
gcc: error: unrecognized command line option '-V'
8 симпатий

Вам надо будет подправить чуток сборщик там. Посмотрю.

3 симпатии

YaCy - бесплатное программное обеспечение для вашей собственной поисковой системы.

Может работать и в режиме децентрализации. При таком подходе поиск не использует центральный сервер. Вместо этого его результаты поиска поступают из сети независимых коллег. В такой распределенной сети ни один объект не решает, что будет указано в списке или в каком порядке появятся результаты.

7 симпатий

Еще три скрипта:

MeiliSearch - это мощная, быстрая, открытая, простая в использовании и развертывании поисковая система. Как поиск, так и индексация очень легко настраиваются. Такие функции, как допуск опечаток, фильтры и синонимы, предоставляются из коробки.

Быстрый, легкий поисковый сервер. Альтернатива Elasticsearch, которая работает на нескольких Мб оперативной памяти

И Manticore Search

Открытая текстовая поисковая система для больших данных и потоковой фильтрации фильтрация многоязычных пользовательских потоков данных в режиме реального времени индексирование и поиск по сотням терабайт…

Пример реализации:

5 симпатий

Sphider - PHP-паук и поисковая система

Простенькая поисковая система на php.

Поддержка базы данных

  • MySQL (MySQLi / MySQLnd или PDO)
  • MariaDB (MySQLi / MySQLnd или PDO)
  • Редакция PDO может быть перенесена в другие форматы баз данных

https://www.sphider.worldspaceflight.com/about.php

5 симпатий

Open Search Server - это современный сканер и поисковая система, а также набор мощных алгоритмов полнотекстового поиска. Создан с использованием лучших технологий с открытым исходным кодом, таких как lucene, zkoss, tomcat, poi, tagsoup. Open Search Server - это стабильное, высокопроизводительное программное обеспечение.

5 симпатий

Этот репозиторий содержит исходный код проекта Decillion³³, прототипа некоммерческой поисковой системы. В настоящее время он состоит из трех модулей: многопоточного краулера, ориентированного на бразильскую сеть, индексатора, основанного на перевернутых списках, и поисковой системы.

2 симпатии