FLUIdS
Программа flindex

Программа flindex служит для создания индексного файла, который затем может быть использован в процедуре поиска.

Общий формат вызова flindex следующий:

flindex [-c file] [-d] [-f file] [-l yes|no] [-o] [-p charset] [-r] [-u] [-v num] [-w] [-z | dir file ...]

Простой вызов flindex без аргументов не создает индексного файла, а приводит лишь к печати версии программы и синтаксиса вызова.

Имена файлов и директорий, подлежащих индексации, Вы можете задать в конфигурационном файле с помощью директив IndexObject, но можете и перечислить их в командной строке (или даже со стандартного ввода). В последнем случае директивы IndexObject в конфигурационном файле игнорируются (если, конечно, он был указан при вызове flindex).


Опции вызова

-c file
  • Задает имя конфигурационного файла индексации, в котором Вы можете определить многочисленные параметры, влияющие на режим работы программы.
  • Использование конфигурационного файла - наиболее реальный способ получения адекватного индексного файла, пригодного для процедуры поиска через Всемирную Паутину. Некоторые опции вызова, описанные ниже, лишь переопределяют соответствующие установки конфигурационного файла.

    -d
  • Указывает на то, что объекты индексации должны быть считаны со стандартного ввода, по одному каждую строчку. Эта опция может быть использована следующим образом:

    flindex -d <list

    Здесь в файле list содержится список имен файлов и директорий, подлежащих индексации.

    -f file
  • Задает имя результирующего индексного файла.
  • По умолчанию используется имя, определяемое параметром компиляции DEFAULT_INDEX_FILE_NAME (в начальных установках - это index.flu). Оно может быть переопределено директивой IndexFile конфигурационного файла индексации, но в любом случае используется имя, указываемое при этой опции в качестве параметра.

    -l yes|no
  • Определяет, нужно ли индексировать файлы и директории, являющиеся символьными связями (symbolic links).
  • Если в командной строке задано -l yes, то подобные объекты файловой системы будут индексироваться, если же -l no - то не будут.
  • По умолчанию индексация символьных связей запрещена. В настоящее время не делается попытки определить, был ли объект, на который указывает символьная связь, проиндексирован или нет. Это означает, что если разрешить индексацию символьных связей, то можно один и тот же файл (и даже директрию со всеми своим файлами и поддиректориями) проиндексировать дважды.
  • Разрешить или запретить индексацию символьных связей можно и с помощью директивы FollowLinks конфигурационного файла, но указание в командной строке имеет более высокий приоритет.

    -o
  • В процессе индексации программа flindex создает временный индексный файл (в директории "основного" индексного файла, задаваемого опцией -f или директивой IndexFile конфигурационного файла индексации). По окончании индексации вызывается системный метод rename, замещающий "старый" индексный файл на "новый". Таким образом сохраняется валидность индексного файла в течении всего времени проведения индексации. Тем не менее, такое поведение flindex может оказаться нежелательным по ряду причин:

    • если на диске осталось мало места (второй индексный файл может не поместиться);
    • если в директории индексного файла нет прав создания других файлов или их переименования;
    • если на индексный файл установлены жесткие связи (тогда переименование их разрушит).

    Тогда на помощь придет опция -o, запрещающая создание временного файла.

    -p charset
  • Задает кодировку, в которой будут выдаваться все сообщения, производимые программой.

    -r
  • Указывает на то, что должна быть произведена реальная переиндексация существующего контента. При реальной переиндексации отсутствующие документы будут удалены из индексного файла.
  • При указании данной опции индексный файл уже должен существовать.

    -u
  • Указывает на то, что должна быть произведена частичная переиндексация существующего контента. Индексации подвергаются только изменившиеся документы, остальные удерживаются в индексном файле.
  • При указании данной опции индексный файл уже должен существовать.

    -v num
  • Задает уровень детальности сообщаемой информации о процессе индексации. Возможные на данный момент значения num - 0, 1, 2 и 3 - определяют четыре различных уровня детальности, от нулевого, полностью "безмолвного", до третьего, наиболее подробного.

    -w
  • Указывает на то, что должено быть выдано на экран содержимое конфигурационного файла, а саму индексацию не проводить. Эта опция может быть использована в тестовых целях, а так же для просмотра значений, принимаемых по умолчанию, например, следующая команда:

    flindex -w

    может выдать на экран следующее:

    [main]
    MaxMemoryVolum = 5000000
    MaxSwapFiles = 10
    Verbose = 2
    FollowLinks = False
    
    [defaults]
    ctype = plain/html "*.htm" "*.html" "*.shtml"
    ctype = plain/text "*.txt"
    ctype = */* "*.jpg" "*.jpeg" "*.gif"
    
    [words]
    CommonWords =  "a" "all" "an" "and" "are" "can" "could" "did" "do" "for" "from" "had" "have" "it" "may" "not" "of" "that" "the" "this" "was" "will" "with" "you" "your" "в" "на" "не" "но" "по" "при"
    ValidWords =  "95" "98" "ar" "bg" "c" "cc" "cd" "cp" "dd" "ed" "fg" "h1" "h2" "h3" "h4" "h5" "h6" "id" "im" "ip" "ln" "ls" "mc" "mv" "nc" "ng" "nt" "od" "os" "pr" "re" "rm" "sh" "tr" "vi" "vm" "wc" "ад" "ом" "си" "уж" "ус" "чп" "юг" "яndex" "яд"
    IgnoreFilesLimit = 512
    IgnorePercentLimit = 101
    MaxWordLength = 32
    MinWordLength = 1

    -z
  • Указывает, что должен быть создан пустой индексный файл. Никакие файлы или директории при этом не индексируются.

  • На предыдущую страницу valera@sbnet.ru