Date: Tue, 5 Feb 2002 22:37:25 +0300 (MSK)
From: Victor Wagner <vitus@ice.ru>
To: apache-talk@lists.lexa.ru
Subject: Re: [apache-talk] Re: [apache-talk] Re: [apache-talk] правильное поведение поисковика по сайту
On Tue, 5 Feb 2002, Alex Tutubalin wrote:
> >
>
> Посмотрел на документацию.
> - Способ хранения данных в SQL (а другое мне на данном этапе не интересно)
> - безумный. В этом смысле Postgres-овские GiST-индексы большое подспорье.
Безумный. Он под mySQL сделан, а не под нормальную базу, Но зато крайне
простой. Поэтому очень
удобно искать по этому индексу не штатными средствами, а своими
запросами, подцепляя по необходимости информацию о рубрикации и типах,
живущую в той же базе.
> - судя по отсутствию соответствующей главы в документации, о морфологии
> и формах слов эта штука ничего не знает, что печально.
Знает. Испелловские словари она умеет.
Причем задачу нормализации слова она по этим словарям решает в разы
лучше чем сам ispell
ispell -c как правило выдает на любое слово три-четыре ложных
"нормальных" формы,
а многосерчевский spelld этим, как правило, не страдает.
Опять же наличие нормализатора в качестве отдельного демона, очень
удобно когда разбираешь поисковые запросы сам.
> Соответственно, желания смотреть на сам софт не возникло.
Вот в код туда местами лучше не глядеть. Это точно.
--
Victor Wagner vitus@ice.ru
Chief Technical Officer Office:7-(095)-748-53-88
Communiware.Net Home: 7-(095)-135-46-61
http://www.communiware.nethttp://www.ice.ru/~vitus
= Apache-Talk@lists.lexa.ru mailing list =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
= Archive avaliable at http://www.lexa.ru/apache-talk =