FLUIdS
Замечания общего свойства


Немного истории

FLUIdS начала отсчет своего существования с середины 1997 года и первоначально базировалась на руссифицированных кодах SWISH, "простой индексной системы", которую разработал Kevin Hughes. Однако SWISH оказался слишком простой системой, содержал множество ошибок и неэффективного кода, и в нем отсутствовал специализированный CGI модуль. Кроме того, автор SWISH'а пожелал сохранить на этот продукт авторские права, не переведя его в разряд "public domain". Поэтому было решено создать свой, независимый продукт, максимально приспособленный для использования в русско-язычном Internet. Исходный код поисковой системы переписывался трижды и теперь в нем практически нет оригинального кода SWISH. С версии 3.5 система стала называться FLUIdS, a c версии 3.9 была спозиционирована в Internet для всеобщего использования.

FLUIdS, как и SWISH, - акроним. Он раскрывается как For Local Use Indexing System, что вполне соответствует названию. Строго говоря, буква d - лишняя, но тогда не получилось бы красивого названия.


Недостатки и преимущества FLUIdS

FLUIdS (оправдывая свое название) способена индексировать документы только с диска, в отличии от больнишства современных поисковых систем, работающих с протоколами доступа HTTP и FTP. Такой подход имеет свои преимущества и недостатки. К основным недостаткам относятся:

К преимуществам же можно отнести:

Если "локальный" подход FLUIdS Вас не устраевает, то всегда можно воспользоваться замечательной свободно распространяемой программой Wget, специально созданной для зеркалирования Web и Ftp серверов.

Недостатки FLUIdS, которые скорее можно отнести в разряд недоделок:

Некоторые достоинства FLUIdS:


Общие принципы работы FLUIdS

Сейчас FLUIdS представляет собой набор из пяти исполняемых модулей, четыре из которых выполняются в режиме командной строки, и один - CGI модуль - используется совместно с Web сервером.

flindex
презназначен для индексирования файлового дерева документов (или нескольких файловых деревьв). Конечным результатом выполнения программы является индексный файл, который затем используется в процедуре поиска.

flsearch
осуществляет поиск по одному или нескольким индексным файлам. Язык запросов поддерживает булевы операции OR, AND и NOT. Для каждого найденного документа сообщается его размер в байтах, ссылка (URL документа или соответствующее ему имя файла) и заголовок, если документ находится в формате HTML. Возможен расширенный формат представления результатов поиска. Найденые ссылки выдаются в отсортированном порядке, правда, отдельно для каждого индекса.

flmerge
позволяет объединить несколько индексных файлов в один, при этом они могут перекрываться, т.е. содержать ссылки на одни и те же документы. Все объединяемые индексы должны быть в одной кодировке.

fldump
позволяет вывести на экран информацию, хранящуюся в индексном файле, в удобочитаемом виде.

fluids.cgi (или fluids.exe)
основной поисковый модуль, применяемый совместно с Web сервером. Самостоятельно генерирует HTML форму запроса и обеспечивает разбивку результатов поиска на страницы с фиксированным числом найденных ссылок на каждой. В отличии от flsearch найденые ссылки сортируются без учета принадлежности тому или иному индексу.

Таким образом, с помощью программы flindex формируются индексные файлы, необходимые модулям flsearch и fluids.cgi для организации процедуры поиска. Модули flmerge и fldump могут рассматриваться как дополнительные полезные утилиты.


Конфигурационные файлы FLUIdS

В системе FLUIdS использование конфигурационных файлов предусмотрено в двух ситуациях: при индексации и при поиске с помощью CGI модуля.

При индексации задание конфигурационного файла хоть и необязательно, но существенно для организации средства поиска через Всемирную Паутину. В нем прописываются правила перевода реальных имен индексируемых файлов, находящихся на локальном диске, в полноценные URL, используемые в WWW. Имя конфигурационного файла индексации задается в командной строке при вызове программы flindex.

Для поискового CGI модуля конфигурационный файл необходим, без него fluids.cgi не будет работать, т.к. там указываются индексные файлы, участвующие в поиске. Имя конфигурационного файла CGI модуля формируется достаточно сложно, их может быть несколько для каждого модуля, но по умолчанию используется имя, задаваемое специальным параметром компиляции в исходных текстах FLUIdS. В начальных установках он прописан так, что должен располагаться в одной директории с CGI модулем и иметь имя fluids.cfg.

Оба типа конфигурационных файлов имеют сходную организацию, хотя, конечно, различаются наборами директив. В дистрибутивную поставку FLUIdS входят примеры написания конфигурационных файлов, которые можно найти в директории ./examples.


Поддержка русского языка в FLUIdS

FLUIdS изначально разрабатывался с целью поддержки национального алфавита. Эта поддержка выражается во множестве функций, реализованных в системе, а именно:

Впрочем, можно сделать и большее:


Ограничения, заложенные в FLUIdS

Поисковой системе FLUIdS присущь ряд ограничений, о которых необходимо знать перед тем, как ее использовать.

Большинство ограничений можно снять тем или иным способом, описанным в соответствующем разделе документации.


На главную страницу valera@sbnet.ru