От авторов
Несколько замечаний и советов,
которые могут упростить
работу с данным скриптом...
1. Поиск примитивен, используется стандартная
функция, аналог strstr в
C. Строгий
поиск (точное вхождение)
не найдет больше половины.
Пример: слово
Штирлиц на будет найдено в предложении
"Вызывает Мюллер Штирлица..."
С другой стороны, много нервов стоило
найти связь темы Винни-Пуха с анекдотом о
Михаиле Ботвиннике.
В любом случае, авторы рекомендуют
максимально нестрогий поиск, с дальнейшей
проверкой вручную.
2. Прочитайте
раздел,
посвященный дублям.
В случае составления тематических
подборок это сильно облегчает жизнь.
Подборка о студентах и ВУЗах,
составленная по просьбе
Паши Бернштама,
потянула на 370K, из которых 180K
ушли в небытие после автоматического
отлова дублей.
3. К сведению любителей соблюдения
формальностей: копирайты соблюдены.
Ничего в текстах не менялось,
в фидошные эхи не кидалось,
за Урал не продавалось ит.д.
Все авторы, оказавшиеся в пределах
досягаемости, дали согласие на
использование их сборников.
4. В ближайшем будущем планируется
добавление других кодировок и возможности
ввода латиницы для тех, у кого клавиатура
не русифицирована. Сие займет
некоторое время, так как у
тигры-побольше аврал, а
тигра-поменьше
лишь недавно начала работать.
5. Предупреждение:
работая в кодировке, отличной от KOI-8,
используйте case-sensitive
поиск: как несложно догадаться,
функция tolower для кириллицы в разных
кодировках выглядит по-разному.
Помечайте case-sensitive и набирайте
ключевое слово строчными буквами.
6. У кого совсем плохо работает связь,
пишите мылом,
мылом же накидаем, что попросите.
На главную страницу