FLUIdS
Программа flindex
Программа flindex служит для создания индексного файла, который затем
может быть использован в процедуре поиска.
Общий формат вызова flindex следующий:
flindex [-c file] [-d] [-f file] [-l yes|no] [-o] [-p charset] [-r] [-u] [-v num] [-w] [-z | dir file ...] |
Простой вызов flindex без аргументов не создает индексного файла,
а приводит лишь к печати версии программы и синтаксиса вызова.
Имена файлов и директорий, подлежащих индексации, Вы можете задать в
конфигурационном файле с помощью директив
IndexObject, но можете и перечислить их
в командной строке (или даже со стандартного ввода).
В последнем случае директивы IndexObject в конфигурационном файле
игнорируются (если, конечно, он был указан при вызове flindex).
- -c file
- Задает имя конфигурационного файла индексации,
в котором Вы можете определить многочисленные параметры, влияющие на режим
работы программы.
- Использование конфигурационного файла - наиболее реальный
способ получения адекватного индексного файла, пригодного для процедуры
поиска через Всемирную Паутину. Некоторые опции вызова, описанные ниже,
лишь переопределяют соответствующие установки конфигурационного файла.
- -d
- Указывает на то, что объекты индексации должны быть считаны со
стандартного ввода, по одному каждую строчку. Эта опция может быть
использована следующим образом:
flindex -d <list
Здесь в файле list содержится список имен файлов и директорий,
подлежащих индексации.
- -f file
- Задает имя результирующего индексного файла.
- По умолчанию используется имя, определяемое параметром компиляции
DEFAULT_INDEX_FILE_NAME
(в начальных установках - это index.flu). Оно может быть переопределено
директивой IndexFile
конфигурационного файла индексации, но в любом случае
используется имя, указываемое при этой опции в качестве параметра.
- -l yes|no
- Определяет, нужно ли индексировать файлы и директории, являющиеся
символьными связями (symbolic links).
- Если в командной строке задано -l yes, то
подобные объекты файловой системы будут индексироваться, если же
-l no - то не будут.
- По умолчанию индексация символьных связей запрещена. В настоящее
время не делается попытки определить, был ли объект, на который указывает
символьная связь, проиндексирован или нет. Это означает, что если разрешить
индексацию символьных связей, то можно один и тот же файл (и даже директрию
со всеми своим файлами и поддиректориями) проиндексировать дважды.
- Разрешить или запретить индексацию символьных связей можно и с
помощью директивы FollowLinks
конфигурационного файла, но указание в командной строке имеет более высокий
приоритет.
- -o
- В процессе индексации программа flindex создает временный
индексный файл (в директории "основного" индексного файла, задаваемого
опцией -f или директивой
IndexFile конфигурационного файла
индексации). По окончании индексации вызывается системный метод rename,
замещающий "старый" индексный файл на "новый". Таким образом сохраняется
валидность индексного файла в течении всего времени проведения индексации.
Тем не менее, такое поведение flindex может оказаться нежелательным по
ряду причин:
- если на диске осталось мало места (второй индексный файл может не
поместиться);
- если в директории индексного файла нет прав создания других файлов или
их переименования;
- если на индексный файл установлены жесткие связи (тогда переименование
их разрушит).
Тогда на помощь придет опция -o, запрещающая создание временного
файла.
- -p charset
- Задает кодировку, в которой будут выдаваться все сообщения,
производимые программой.
- -r
- Указывает на то, что должна быть произведена реальная
переиндексация существующего контента. При реальной переиндексации
отсутствующие документы будут удалены из индексного файла.
- При указании данной опции индексный файл уже должен существовать.
- -u
- Указывает на то, что должна быть произведена частичная
переиндексация существующего контента. Индексации подвергаются только
изменившиеся документы, остальные удерживаются в индексном файле.
- При указании данной опции индексный файл уже должен существовать.
- -v num
- Задает уровень детальности сообщаемой
информации о процессе индексации. Возможные на данный момент значения
num - 0, 1, 2 и 3 - определяют четыре различных уровня
детальности, от нулевого, полностью "безмолвного", до третьего, наиболее
подробного.
- -w
- Указывает на то, что должено быть выдано на экран содержимое
конфигурационного файла, а саму индексацию не проводить. Эта опция может быть
использована в тестовых целях, а так же для просмотра значений, принимаемых
по умолчанию, например, следующая команда:
flindex -w
может выдать на экран следующее:
[main]
MaxMemoryVolum = 5000000
MaxSwapFiles = 10
Verbose = 2
FollowLinks = False
[defaults]
ctype = plain/html "*.htm" "*.html" "*.shtml"
ctype = plain/text "*.txt"
ctype = */* "*.jpg" "*.jpeg" "*.gif"
[words]
CommonWords = "a" "all" "an" "and" "are" "can" "could" "did" "do" "for" "from" "had" "have" "it" "may" "not" "of" "that" "the" "this" "was" "will" "with" "you" "your" "в" "на" "не" "но" "по" "при"
ValidWords = "95" "98" "ar" "bg" "c" "cc" "cd" "cp" "dd" "ed" "fg" "h1" "h2" "h3" "h4" "h5" "h6" "id" "im" "ip" "ln" "ls" "mc" "mv" "nc" "ng" "nt" "od" "os" "pr" "re" "rm" "sh" "tr" "vi" "vm" "wc" "ад" "ом" "си" "уж" "ус" "чп" "юг" "яndex" "яд"
IgnoreFilesLimit = 512
IgnorePercentLimit = 101
MaxWordLength = 32
MinWordLength = 1
- -z
- Указывает, что должен быть создан пустой индексный файл. Никакие
файлы или директории при этом не индексируются.