Sadda.ru Ironetcart Андроид Ассемблер MASM32 Linux Все статьи Table of Contents


 

Зачем тупому форуму поиск?

  Макс Петров июнь 2015

      На первой странице вашего рассказа вши ползают в большом количестве:
прибывшую, проработавший, говоривших. Вполне можно обойтись и без насекомых.

Из ответа М.Горького рабочему корреспонденту

      Мною было взято 500 килобайт сообщений с одного из форумов (форум как бы умный, потому что юридический). Для сравнения, вес "Мертвых душ" Гоголя - без оформления, чисто текст - составляет, как раз, 500 килобайт. Проанализировав такой объем форумных высказываний, я обнаружил, что там использовано всего-навсего около тысячи слов. Если быть строгим, один алгоритм дал результат ~ 800 слов, другой ~ 1200 слов. Но точность уже и не важна, поскольку 1200 слов в качестве показателя богатства лексикона не менее страшны, чем 800.

      На рисунке показана зависимость числа используемых во всех сообщениях форума слов от объема содержащегося на форуме текста. Как видим, начиная с 200 килобайт текста (200 сообщений по одному килобайту) имеет место, практически, плато, то есть лексикон форума перестает существенно расширяться при добавлении новых сообщений.

      Форумы, как правило, имеют узкую тематическую направленность, а пишущие на них не озабочены поиском вшей (по примеру Максима Горького) в тексте, и складывают слова, как придется – кухонным слогом общаются о самом возвышенном и сложном. Русскоязычный хомо сапиенс, при этом, знает около 150 тысяч слов, а иногда и более.

      И вот, представьте, тысяча слов только используется на форуме, но там, на форуме, есть окошечко с названием «Поиск», куда предлагается пользователю ввести что угодно (ведь ограничений-то нет?) из имеющегося в его распоряжении языкового запаса. Математически, вероятность удачи 1000/150 000 = 1/150, то есть, на каждые 150 попыток будет одно попадание.

      Мне возразят: «Посетитель видит, на какой форум он пришел, поэтому слова в поиск посетитель обязан вводить правильные».

      Конечно же. Но для получения полного представления о лексике и тематике любого сайта, этот сайт надо сначала прочитать. Получается, чтобы уверенно пользоваться поиском, необходимо заранее знать содержание. Но тогда и поиск будет не нужен. А если содержание и лексикон, с помощью которого оно изложено, неизвестны, то пользоваться поиском трудно – набор правильных слов, годных для ввода в окошечко, на два порядка уже, чем то, что хранит в своей памяти средний человек.

      Я думаю, поиск на сайте или форуме, тем более на небольшом сайте или форуме – это недоразумение. В математическом смысле.

      Поисковый индекс - структура, где установлены связи между ключевыми словами и конкретными фрагментами текста. Показан индекс, по большому счету, может быть двояко: в виде поисковой панели или в виде меню (облако тегов, раскрывающийся список и т.п.). Принципиальное отличие меню (во всех его видах) от панели поиска в том состоит, что меню требует места для своего размещения, но оно зримо дает информацию о всем содержании сразу; панель поиска - она компактна, но это совершенный черный ящик, мы не знаем, что внутри. Как средство навигации по контенту в своей эффективности меню и поиск несопоставимы. Представьте, если бы в книге обычное оглавление превратилось вдруг в окошечко для поиска. Такое "оглавление" было бы неинформативно, едва ли было бы удобно читателю.

      Одно дело Яндекс или Google. Ключевых слов сотни тысяч или даже миллионы (ведь Гугл - многоязычен). Отобразить и передать пользователю интерактивным списком такой объем - весь и сразу - сложно даже технически. Иное дело небольшой форум, где лексикон - тысяча слов, из них ключевых (несущих хоть какую-то тематическую смысловую нагрузку) - того менее.

      Таким образом, меню из ключевых слов, вместо панели поиска, на форуме или сайте возможно - вследствие заведомой узости лексикона форума или сайта; по сравнению с поисковой панелью, меню следует отдавать предпочтение по причине его большей информативности и юзабильности.



Ironetcart

      Техническая поддержка: http://ironburattin.ru
      Взять движок: Форум на файлах «Ironetcart» (скачать)

      Разработка форумного движка
      Форум «Железный Бураттин» (название и концепция)
      Статическая защита форм
      Идеальная капча
      Как я победил магические кавычки
      Внеклавиатурные символы HTML
      Хранимые XSS-атаки и защита от них (удаляем javascript из html в браузере)
      Защита визуального html-редактора (фильтрация HTML на стороне сервера)
      Скорость движка форума: файлы или база данных
      Прогресс-бар на PHP
      Зачем тупому форуму поиск?

     


© Max Petrov При использовании материалов ссылка на sadda.ru обязательна