FLUIdS
Индексация и индексный файл

  • Индексация
  • Программа flindex
    Индексация с конфигурационным файлом
    Мониторинг процесса индексации
  • Структура индексного файла

  • Индексация

    В системе FLUIdS основным и единственным средством индексации является программа flindex. Она запускается на выполнение в режиме командной строки. В качестве аргументов flindex может принимать определенные опции вызова, а также имена файлов и директорий, подлежащих индексации (объектов индексации).

    В действительности же Вам скорее всего придется столкнуться только с одним форматом вызова flindex, а именно

    flindex -c config

    где config - имя специализированного конфигурационного файла, в котором прописываются всевозможные параметры индексации (имена файлов и директорий, подлежащих индексации, правила отбора индексируемых файлов, правила преобразования имен и многое другое). Использование конфигурационного файла значительно расширяет возможности по управлению и контролю за процессом индексации.

    По умолчанию имя создаваемого индексного файла определяется значением параметра компиляции DEFAULT_INDEX_FILE_NAME. Явно задать это имя можно с помощью директивы IndexFile конфигурационного файла или опцией -f в командной строке. Проверки на то, существует ли уже файл с таким именем или нет, не производится.


    Мониторинг процесса индексации

    Программа flindex в ходе своего выполнения может достаточно подробно информировать о совершаемых ею действиях (какой файл в данный момент индексируется, какой элемент индексного файла создается и т.д.) Иными словами, Вы можете осуществлять мониторинг процесса индексации и, если что пойдет не так, прервать выполнение программы.

    В настоящее время определено четыре различных уровня детальности сообщаемой информации о ходе процесса индексации. Нулевой уровень означает, что никаких сообщений (кроме как об ошибках) выводиться не будет. Каждый последующий уровень добавляет к сообщениям предыдущего свои собственные, и на третьем уровне достигается максимум выводимой информации.

    Уровень 1
    При этом уровне сообщаются только имена объектов индексации (т.е. имен тех директорий и файлов, которые были заданы в конфигурационном файле или в командной строке), к обработке которых приступила программа flindex. Кроме того, сообщается о свопинге, если он разрешен. Под конец процесса фиксируется момент создания индексного файла, а после его формирования выводится информация о числе проиндексированных файлов и числе слов, его образующих. Также сообщается время, затраченное на индексацию.

    На экране все это будет выглядеть примерно так:

    Indexing directory "../docs"
    
    Writing main index... 2636 unique words indexed.
    Stop words: none.
    Writing file index... 10 files indexed.
    Running time: 1 second.
    Done.

    Уровень 2
    Единственное существенное отличие этого уровня от предыдущего - выдача имен всех промежуточных директорий, затрагиваемых процессом индексации:

    Indexing the directory ../docs ...
    Indexing the directory ../docs/compile ...
    Indexing the directory ../docs/general ...
    Indexing the directory ../docs/index ...
    
    Writing main index... 2636 unique words indexed.
    Stop words: none.
    Writing file index... 10 files indexed.
    Running time: 1 second.
    Done.

    Уровень 3
    Здесь дополнительно для каждого индексируемого файла выводится его имя и число проиндексированных в нем слов:

    Processing the directory ../docs:
        index.htm (224 words)
    
    Processing the directory ../docs/compile:
        cfg.htm (2004 words)
        cfgrus.htm (462 words)
        defs.htm (218 words)
        index.htm (952 words)
    
    Processing the directory ../docs/general:
        conffile.htm (703 words)
        index.htm (1014 words)
    
    Processing the directory ../docs/index:
        conf.htm (2647 words)
        flindex.htm (301 words)
        index.htm (334 words)
    
    Writing main index... 2636 unique words indexed.
    Stop words: none.
    Writing file index... 10 files indexed.
    Running time: 1 second.
    Done.

    По умолчанию, уровень детальности сообщаемой информации задается с помощью параметра компиляции DEFAULT_VERBOSE_LEVEL. Это значение можно изменить в конфигурационном файле директивой Verbose или же указать в командной строке опцией вызова -v.


    На главную страницу valera@sbnet.ru