Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Интернет » В помощь вебмастеру » Скрипты поиска (site search)

Модерирует : Cheery

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10

Открыть новую тему     Написать ответ в эту тему

Erick Flatcher



Full Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
нужен скрипт CGI поиска для индексации паги с ~500 htm документов
есть возможность поставить хороший aka платный скрипт  
что посоветуете? какой получше?

Скрипты поиска

Для тех, у кого нет возможности установить скрипты на сайте - Службы для поиска по сайту (не скрипты)
 
В этой теме будут собраны скрипты и ссылки на коллекции скриптов поиска. Остальные темы по поиску скриптов подобного рода будут закрыты.
Разрешается:
- постить ссылки на фриварные (свободные к распространению, бесплатные) скрипты поиска или их коллекции, на платные скрипты и сервисы поиска только легальных версий. Напоминаю, что форум Варезник тут. Постить обязательно с описанием!
- оставлять мнения по личному опыту работы с тем или иным скриптом.
- редактировать первый пост полезной информацией по сабжу (участникам со статусом мембер и выше).

 
Файловый архив форума содержит полезные скрипты. Можете принять участие в его пополнении.

Начинаем.



  • RiSearchPro [Perl]
    http://risearch.org/rus/index.html
    установка и настройка скрипта RiSearchPro

    Цитата:
    Поисковый скрипт, написанный на Перле и не требующий внешней базы данных.
    Нa странице производителя есть всевозможные разновидности скрипта - с базой данных, на PHP и т.д.

     
  • RiSearch PHP - не требует MySQL
    http://risearch.org/rus/risearch_php/index.html

    Цитата:
    RiSearch PHP - бесплатный поисковый скрипт, предназначенный для небольших сайтов. Данный скрипт является клоном скрипта RiSearch, хотя пока еще не полностью дублирует его.  

     
  • siteIndexer [PHP и MySQL]
    http://carline.ru/programm/index.php?action=viewlink&id=16
    http://sourceforge.net/projects/siteindexer/files/
    Цитата:
    Неплохой скрипт системы индексации и поиска для сайтов. Этот скрипт позволяет индексировать страницы вашего сайта и помещать их в базу данных. Для работы Морд - английский.

     
  • K.I.S.S. Site Search Engine [Perl]
    Сайт разработчика: http://moskalyuk.com/software/perl/search/kissru.htm

    Цитата:
    Небольшой по размеру и легкий в настройке поисковик для сайта обслужаивает до 300 HTML-документов. Возможность настройки страницы результатов, также возможно исключение отдельных папок или файлов из индекса.
    Лицензия: Бесплатный
    Автор: Александр Москалюк
     

     
  • Fluid Dynamics Search Engine [Perl]
    http://www.xav.com/scripts/search/

    Цитата:
    Вот это поисковик!!! В этой программе есть ф-ции админа, ищет быстро, не пожалеете, это я вам обещаю, есть раздел на категории, то есть, например, искать отдельно в категории ДОКУМЕНТАЦИЯ, СКРИПТЫ, ну в общем всё что надо для поиска по серверу...

     
  • dummySearch [Perl]
    http://easyip.ru/free/
    Простой и неоптимальный скртипт поиска по сайту. Впрочем каждый может доработать под себя...
    Лицензия: GPL
     
  • mnoGoSearch (бывший UdmSearch) [С]
    http://search.mnogo.ru/
    обсуждение mnoGoSearch: установка, проблемы...
    юниксовая версия бесплатна, для виндовз-- русская версия бесплатна для некомерческого использования
    Цитата:
     универсальная поисковая система для Intranet и Internet серверов. Пригодна для индексации как небольших сайтов, так и крупных порталов. Документы можно индексировать по протоколам HTTP, FTP, NNTP и на локальных дисках. Индексирует документы в формате HTML, plain text, а так же pdf, doc и другие при помощи внешних парсеров. Настраиваемая важность (вес) для заголовков, ключевых слов, тела документа. Форму отображения результатов поиска можно настраивать с помощью шаблонов.  

     
  • FTPSearch/Agent [Java/PHP]
    http://sourceforge.net/projects/ftpsearchagent/
    FTPSearch/Agent — полнофункциональный скрипт для индексации ftp и поиска по средним локальным сетям(20-200 серверов)
     
  • FTP SEARCH [PHP]
    http://codewalkers.com/seecode/157.html
    Система для индексации FTP сервера и поиска по нему
     
  • Manlix Search [PHP]
    http://manlix.ru/zipped/manlix_search_v1_3.zip
     
  • iSearch [PHP]
    http://www.isearchthenet.com/isearch/download.php
     
    шаблон:
    [*][b][/b] [PHP]
     
    [s][/s]

     



В розыске:
бесплатные морфологические модули/библиотеки русского и украинского языков.
 

<!-- Коллекции скриптов поиска: -->
http://pro.lookanswer.com/scripts/search.html
http://ancient.dax.ru/scripts.php?lang=php&group=search  
http://webscript.ru/scripts/index.php?sid=620531966&t=sub_pages&cat=21  
http://www.cgi-resources.com/Programs_and_Scripts/Perl/Searching/
http://www.allscripts.bip.ru/pcgi/search.htm  
http://cgid.al.ru/cgi-bin/news/list.cgi?show=group&l=search  
http://webportal.fud.ru/scripts/cgi/search/search2.htm


 
Другие темы по скриптам на руборде:
 
Клиентские скрипты
Серверные скрипты

 
Скрипты счетчиков посещений
Скрипты обмена файлами
Скрипты чатов
Скрипты фотогалерей
Скрипты новостей
Скрипты подписки/рассылки
Интернет-магазины
Дневники (блоги)
Гостевые книги
Скрипты голосований
Редактирование в браузере HTML-кода и веб-страниц
Скрипты служб знакомств
Баннерообменные скрипты
Whois-скрипты
Доски объявлений
Создание карты сайта

Всего записей: 581 | Зарегистр. 12-10-2001 | Отправлено: 19:33 11-12-2001 | Исправлено: loosingar, 12:20 01-08-2009
Svarga

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Terabyte

Цитата:
А как сделать такой же поиск через гугл на своем сайте? - http://forum.ru-board.com/topic.cgi?forum=24&topic=2835  

)
Смотри код поста:
http://forum.ru-board.com/postings.cgi?action=edit&forum=24&topic=2835&postno=1
там всё просто...
 
Если конкретные вопросы по тому скрипту-- спрашивай

----------
away.

Всего записей: 4161 | Зарегистр. 25-06-2002 | Отправлено: 02:14 12-10-2003
Terabyte



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Svarga
Ну это я понимаю. Меня интересует документация с самого гула или переведенная на рус. , ведь модераторы которые сделали данные поиск не из неба взяли эти формы... Вот меня интересует где об этом почитать можно.

Всего записей: 1325 | Зарегистр. 09-09-2002 | Отправлено: 10:49 12-10-2003
Svarga

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Terabyte

Цитата:
ведь модераторы которые сделали данные поиск не из неба взяли эти формы


Данные там из формы расширенного поиска:
http://www.google.com/advanced_search?hl=ru&ie=windows-1251&oe=windows-1251&inlang=ru
+ вручную подправлены данные по кодировкам и языку интерфейса.
 
Вообщем, получай свеженаписанный tutorial :
Поля, которые можно использовать в форме для поиска Google*
(в паре вещей сомневаюсь):
name поля value *
  q любое текст, который ищется-- все слова на странице: практически то же, что и + перед каждым словом в запросе
  as_q любое аналогично предыдущему, используется в форме для расширенного поиска
  as_epq любое поиск точной фразы: присвоение значения этому полю равносильно добавлению того же самого значения в двойных кавычках в основное поле поиска
  as_oq любое поиск любого из перечисленных слов, то же, что OR между словами с основном поле поиска
  as_eq любое поиск страниц, не содержащих перечисленных слов: добавление значения в это поле эквивалентно добавлению тех же слов со знаком "-" перед каждым из них в основное поле поиска
  num число количество результатов поиска на странице
  btnG что угодно кнопка отправки, соответственно, значение value-- текст на кнопке
  lr отсутствует-- любой язык, lang_ru-- русский, lang_ar-- арабский и т.д. указывает, на каком языке искать страницы: обычно лучше на всех сразу , т.е. не использовать это поле вообще
  cr отсутствует-- любая страна, countryRU-- Россия, countryUA-- Украина и т.д. поиск по ресурсам отдельных стран
  as_ft i=только, e=не определяет условие поиска для типа файлов, указанного в поле as_filetype: поиск среди файлов указанного в as_filetype типа или же поиск среди файлов всех типов, кроме типа указанного в поле as_filetype
  as_filetype отсутствует-- все типы файлов; pdf, ps, doc, xls, ppt, rtf-- соответствующие типы файлов указывает, среди файлов какого типа необходимо осуществлять поиск, идентично filetype:тип_файла в основном поле поиска при as_ft=i и -filetype:тип_файла при as_ft=e
  as_qdr all-- любая дата, m3-- 3 прошедших месяца, m6-- в течении полугода, y-- в течении года поиск среди страниц, обновлённых в течении указанного периода
  as_dt i=только, e=не определяет условие для поля as_sitesearch: искать среди страниц указанного сайта или исключить страницы с сайта, указанного в поле as_sitesearch
  as_sitesearch адрес сайта, напр. forum.ru-board.com, www.google.com и т.п. в этом поле определяется адрес сайта, среди страниц которого искать или же, который исключить из результатов поиска (в зависимости от условия, определённого в поле as_dt), использование поля идентично использованию site:адрес_сайта (или -site:адрес_сайта) в основном поле
  safe images-- отключить, active-- включить т.н. "безопастный поиск"-- исключение из результатов страниц, содержащих adult content
  hl en-- английский, ru-- русский и т.д. язык интерфейса страницы с результатами
  inlang en-- английский, ru-- русский и т.д. язык интерфейса текущей страницы (?)
  oe windows-1251, utf-8 и т.д. кодировка текущего документа (?)
  ie windows-1251, utf-8 и т.д. кодировка страницы с результатами
  filter 1 - включён, 0 - отключён исключение из результатов похожих страниц

* Типы полей не даю, т.к. они могут быть любые-- text, hidden, select и т.д.
 
Выбирай из этого всего, что тебе нужно (рекомендую оставить as_q текстовым полем и btnG submit-кнопкой, а все кодировки, фильтры, указание сайта для поиска и т.п. поделать полями типа hidden) и помещай всё сие в такую форму:

Код:
<form method=GET action=http://google.com/search></form>

 
К сожалению, текстовые поля, являющиеся аналогами операторов расширенного поиска, есть только для site: и filetype:, а все остальные (allinurl:, intitle:, link: и т.д.) можно использовать только вручную или же добавлять скриптом.
 
Всё
 
PS. перечитал сие-- так всё замороченно стало выглядеть -- по мне, чем такую ерунду читать, проще готовую форму вручную порасковыривать...
 
Добавлено
<!-- offtopic
мне в Гугле кулькулятор нравится

-->

----------
away.

Всего записей: 4161 | Зарегистр. 25-06-2002 | Отправлено: 04:25 13-10-2003 | Исправлено: Svarga, 04:40 13-10-2003
baraka



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Hitman2004

Цитата:
HypeerSeek - Хороший скрипт поиска, мне очень понравился, написан на Perl

он стоит $499.00
где взять бесплатный ?

Всего записей: 313 | Зарегистр. 29-01-2003 | Отправлено: 18:30 20-10-2003
ViKor



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ищу скрипт для поиска файлов в локальной сети через сайт который висит на сервере!
 
хелп!!!

----------
теХком

Всего записей: 503 | Зарегистр. 16-03-2003 | Отправлено: 22:11 30-10-2003
Svarga

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ViKor

Цитата:
ищу скрипт для поиска файлов в локальной сети через сайт который висит на сервере!  

Смотри что-то вроде Яndex.Server...

----------
away.

Всего записей: 4161 | Зарегистр. 25-06-2002 | Отправлено: 23:12 30-10-2003
ViKor



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Svarga
не подходит
 
 
нужен скрипт такого плана:
 
есть локальная сеть
 
\\vova\films
\\petya\mp3
\\olya\books
\\server\soft
...
 
 
нужно сканировать сеть и искать файлы на компах и выводить результаты на веб-интерфейс с сылкой на файл (\\vova\films\dark.avi)
 
такая штука очень нужна и полезна для любой сети!!!!
 


----------
теХком

Всего записей: 503 | Зарегистр. 16-03-2003 | Отправлено: 00:31 31-10-2003
melt



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите скрипт на ПХП и с возможностью полной настроики дизана.

Всего записей: 54 | Зарегистр. 07-09-2003 | Отправлено: 19:05 31-10-2003
Tikhonov



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот выпустили новинку, может кому и сгодится. Тем более, это актуально в свете данного обсуждения.
 
 Поисковый механизм компании Adelite myWEBsearch v.2.
 Сайт разработчика: http://adelite.com/solutions/ls
 
 Особенности:
 1. Позволяет индексировать как данные на диске, так и web-страницы по протоколам HTTP и ftp;
 2. Свободно подключается к большинству СУБД, таким, как mysql и postgresql.
 3. Без проблем работает с текстами объемом до 500Мб.
 4. Высокая скорость поиска - не более секунды на поисковой базе в 100 Мб на среднем сервере.
 5. Высокое качество поиска за счет хранения координат индексируемых слов.
 6. Возможность поиска по различным полям (например, базы).
 
 Условия распространения:
 1. Стоимость системы 150$ без установки, 200$ с установкой.
 2. Аренда - 10$ для сайтов объемом до 10Мб, для бОльших - по договоренности.  
 
 Внедрения:
 - Форум о поисковых системах http://searchengines.ru/cgi-bin/search/find.pl - поисковая база около 60 Мб.
 - Новостной сайт "Подробности" http://search.podrobnosti.ua - поисковая база более 200Мб
 и т.д.
 
 Подробную информацию смотрите на сайте разработчика - http://adelite.com/solutions/ls.
 
 Отзывы и комментарии приветствуются

Всего записей: 9 | Зарегистр. 11-11-2003 | Отправлено: 23:10 11-11-2003 | Исправлено: Tikhonov, 23:14 11-11-2003
Kexit



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кто тут спрашивал скрипт поиска на PHP ?
Есть такой - Manlix Search 1.2 - _http://manlix.ru/?section=scripts
Правда у меня сразу вопрос - может кто его уже устанавливал ?
Дело в том, что у меня он русский язык не видит На английском ищет - все ок, а вот русский язык отбраковывает как хлам. Где я чего упустил ?
А, вообще то, скрипты Manlix`а частенько сами хостеры рекомендуют как базовые.
 
 
 

Всего записей: 968 | Зарегистр. 16-02-2003 | Отправлено: 23:16 13-11-2003
Terabyte



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Народ, я перепробывал много скрптов поиска и все по моему мнениую откровенное Г. Поэтому я советую переводить сайт в MySQL базу и организовать поиск по ней. Это сделать очень легко и эффективно. Лично я так и поступил и сейчас делаю для каждого раздела сайта свой поиск, а потом их все обеъдиню в один большой.  Кому нужны исходники могу поделиться:
 
http://www.web-hack.ru/articles/search.php
http://www.web-hack.ru/exploit/search.php

Всего записей: 1325 | Зарегистр. 09-09-2002 | Отправлено: 11:10 15-11-2003
Tikhonov



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Дело в том, что у меня он русский язык не видит  На английском ищет - все ок, а вот русский язык отбраковывает как хлам. Где я чего упустил ?  

 Русскую локаль в скрипте настраивать не пробовал?
 setlocale(LC_CTYPE,'ru_RU.CP1251');
 

Цитата:
Поэтому я советую переводить сайт в MySQL базу и организовать поиск по ней. Это сделать очень легко и эффективно.

 Умрет на нескольких тысячах документов - в зависимости от производительности машины. На большее select * like просто не рассчитан.  
 Да и какова релевантность такого поиска? Весьма слабое, хоть и доступное поисковое решение.

Всего записей: 9 | Зарегистр. 11-11-2003 | Отправлено: 14:05 15-11-2003
Terabyte



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 Умрет на нескольких тысячах документов - в зависимости от производительности машины. На большее select * like просто не рассчитан.  

Я не согласен. На чем основывается твое мнение? И сколько это несколько тысяч (3000,30000,300000,3000000 или сколько?).
Вообще на серварах хостеров как правило хорошие машины стоят.
 

Цитата:
Да и какова релевантность такого поиска? Весьма слабое, хоть и доступное поисковое решение.

Не опнял, что такое релевантность?

Всего записей: 1325 | Зарегистр. 09-09-2002 | Отправлено: 14:31 15-11-2003
Tikhonov



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я не согласен. На чем основывается твое мнение? И сколько это несколько тысяч (3000,30000,300000,3000000 или сколько?).  
Вообще на серварах хостеров как правило хорошие машины стоят.  

 Любая СУБД, будь то mysql или postgres, или даже Oracle работает быстро за счет использования индексов, как правило на Б-деревьях, но есть и исключения.
 Индексы создаются по одному или нескольким полям и позволяют очень быстро получить из базы нужную информацию, конечно, если запрос составлен соответствующим образом.  
 При поиске с помощью like индексы не могут быть использованы, так как нужно ПОСЛЕДОВАТЕЛЬНО просмотреть все документы на предмет наличия шаблона, указанного в like. А если таких документов, скажем, 10000? Что будет с машиной хостера, если поиском одновременно воспрользуется даже 10 человек?
 

Цитата:
Не опнял, что такое релевантность?

 М-да, приехали... Это тебе прямой путь на Форум:
http://www.searchengines.ru/cgi-bin/search/find.pl?type=1&day1=15&month1=9&year1=2000&day2=15&month2=10&year2=2003&search=%CD%C5%D4%CF%C4%C9%CB%C1+%CF%C3%C5%CE%CB%C9+%D2%C5%CC%C5%D7%C1%CE%D4%CE%CF%D3%D4%C9
 
 Вообще, по-простому - ты передал запрос базе, она отработала и вернула те же 10000 документов. Информация, которую ты ищещь, находится в документах номер 7866 и 9112, остальные неинтересны. Как определить порядок вывода документов с помощью like, чтобы нужные документы шли первыми?  
 Иначе тебе придется по одной просматривать 100 страниц (по 10 документов в каждой), причем каждый из этих документов нужно открывать и читать.

Всего записей: 9 | Зарегистр. 11-11-2003 | Отправлено: 15:20 15-11-2003 | Исправлено: Tikhonov, 15:22 15-11-2003
Terabyte



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
1) Ну вообщем что будет там с хостером меня мало волнует на самом деле =)
2) У меня вбазе в общей солжности максимум ща 300 строк и до 10к нам еще очень далеко.
3) Имхо это все же будет быстрее, чем скрипт будет бегать по файловой системе и открывать каждый файл.
 
А как в форумах на мускуле работающих (например InvisionBoard) поиск организован, так с помощью like как и у меня?

Всего записей: 1325 | Зарегистр. 09-09-2002 | Отправлено: 16:51 15-11-2003
Tikhonov



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А как в форумах на мускуле работающих (например InvisionBoard) поиск организован, так с помощью like как и у меня?

 Нет, конечно. В основном для таких "поисковиков" каждый документ в базе разбивается по отдельным словам - термам и создается еще один индекс, где на каждое слово в документе сохраняются его частотные параметры.  
 Это, конечно, будет получше, чем like, но все равно не рассчитано на большие объемы данных - в среднем, мегабайтах на 50 чистого текста уже будет притормаживать. Релевантность такого поиска не бог весть какая, но если ничего другого нет, то вполне сойдет.

Всего записей: 9 | Зарегистр. 11-11-2003 | Отправлено: 17:20 15-11-2003
Terabyte



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tikhonov
Ea? почти ничего не понял =) может показать на практике (коде) как это все сделано?

Всего записей: 1325 | Зарегистр. 09-09-2002 | Отправлено: 18:08 15-11-2003
Tikhonov



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Алгоритм для простейшей поисковой системы, без координатных индексов, сниппетов и с простым подсчетом ранков документов.
 
 Индексация:
1. Берем строку:
почти ничего не понял =) может показать на практике (коде) как это все сделано?
Это документ N1
 
2. Выбрасываем все лишнее и оставляем только слова:
почти ничего не понял может показать на практике коде как это все сделано
 
3. Создаем список слов и их частоту в документе:
почти 1
ничего 1
не 1
понял 1
может 1
показать 1
на 1
практике 1
коде 1
как 1
это 1
все 1
сделано 1
 
4. Создаем таблицу (wordid, docid, word, frequency) в mysql, куда вставляем список:
1 1 почти 1
1 1 ничего 1
...
 
 Поиск:
 Запрос к поиску: "ничего не понял"
 Из таблицы вытаскиваем:  
1 1 ничего 1
1 1 не 1
1 1 понял 1  
 Найдено 3 слова в документе N1. Выводим заголовок этого документа.
 
 Понятно?

Всего записей: 9 | Зарегистр. 11-11-2003 | Отправлено: 18:27 15-11-2003
Terabyte



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tikhonov
Понял =)
А у тебя нет реализации этого алгоритма в код на ПХП? если есть кинь в ПМ или мыло.

Всего записей: 1325 | Зарегистр. 09-09-2002 | Отправлено: 13:55 12-12-2003
angxx

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как на РХП сделать подсчет количества скачивания файла-архива?

Всего записей: 3 | Зарегистр. 11-12-2003 | Отправлено: 12:21 17-12-2003
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10

Компьютерный форум Ru.Board » Интернет » В помощь вебмастеру » Скрипты поиска (site search)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru