От авторов



Несколько замечаний и советов, которые могут упростить работу с данным скриптом...

1. Поиск примитивен, используется стандартная функция, аналог strstr в C. Строгий поиск (точное вхождение) не найдет больше половины. Пример: слово Штирлиц на будет найдено в предложении "Вызывает Мюллер Штирлица..."
С другой стороны, много нервов стоило найти связь темы Винни-Пуха с анекдотом о Михаиле Ботвиннике. В любом случае, авторы рекомендуют максимально нестрогий поиск, с дальнейшей проверкой вручную.

2. Прочитайте раздел, посвященный дублям. В случае составления тематических подборок это сильно облегчает жизнь. Подборка о студентах и ВУЗах, составленная по просьбе Паши Бернштама, потянула на 370K, из которых 180K ушли в небытие после автоматического отлова дублей.

3. К сведению любителей соблюдения формальностей: копирайты соблюдены. Ничего в текстах не менялось, в фидошные эхи не кидалось, за Урал не продавалось ит.д. Все авторы, оказавшиеся в пределах досягаемости, дали согласие на использование их сборников.

4. В ближайшем будущем планируется добавление других кодировок и возможности ввода латиницы для тех, у кого клавиатура не русифицирована. Сие займет некоторое время, так как у тигры-побольше аврал, а тигра-поменьше лишь недавно начала работать.

5. Предупреждение: работая в кодировке, отличной от KOI-8, используйте case-sensitive поиск: как несложно догадаться, функция tolower для кириллицы в разных кодировках выглядит по-разному. Помечайте case-sensitive и набирайте ключевое слово строчными буквами.

6. У кого совсем плохо работает связь, пишите мылом, мылом же накидаем, что попросите.

На главную страницу