Поисковые системы интернета
Заказать уникальную курсовую работу- 29 29 страниц
- 17 + 17 источников
- Добавлена 05.03.2007
- Содержание
- Часть работы
- Список литературы
- Вопросы/Ответы
1. Web-каталоги
1.1 Каталог Yahoo!
1.1.1 Как работает Yahoo!
1.1.2 Поиск в Yahoo!
1.2 Каталог компании McKinley - Magellan
1.2.1 Обзор каталога Magellan
1.2.2 Поиск в директории Magellan
1.3 Point
1.4 Другие системы поиска
1.4.1 World Wide Arts Resourses
1.4.2 World Wide Web Servers
1.4.3 Virtual Tourist
2. Web-индексы
2.1 Как работают поисковые системы
2.2 Infoseek
2.3 Lycos
2.4 WebCrawler
2.5 Другие системы поиска
2.5.1 Deja News Research Service
2.5.2 Excite
2.5.3 Система поиска W3
2.5.4 Alta Vista
Заключение
Список литературы
Приложение 1. Поисковые сервера Internet
Все это дает возможность составлять поисковое предписание с большой степенью точности, что конечно же повышает релевантность получаемых результатов.
Немаловажное значение имеет также ясно проявляющаяся тенденция совершенствования интерфейса. Графические браузеры типа Netscape Navigator, Internet Explorer и им подобные практически полностью вытеснили текстовой Lynx, что само по себе позволило в значительной степени повысить дружественность интерфейса, сделать его намного более сенсетивным чем 2-3 года назад. Разработчики первых поисковых систем не слишком заботились о комфорте пользователей. В тот период гораздо важнее было просто заставить систему работать. Поэтому желающих воспользоваться услугами поисковых серверов встречали зачастую лишь строки для ввода запроса, без каких-либо экранов помощи или примеров употребления булевых операторов. По этой причине пользователи часто испытывали затруднения, пытаясь точно выразить свой запрос. Системы последнего поколения во многих случаях имеют детализированное многоуровневое меню, которое делает составление запроса максимально простым. За счет его применения пользователи освобождается от необходимости знать принципы работы булевой логики - они просто комбинируют искомые термины с имеющимися условиями поиска. Меню Power search (углубленного поиска) в OpenText и Modified search (модифицированного поиска) в HotBot яркие примеры прогресса в этой сфере.
Нынешние поисковые средства предоставляют также детализированную "помощь", примеры составления запросов, файлы "часто задаваемых вопросов". В зависимости от полученных результатов генерируются подсказки и рекомендации, направленные на устранение типичных ошибок, допускаемых при составлении запроса. Таким образом сегодняшний пользователь уже не должен обладать какими-либо специальными знаниями и опытом для обращения к поисковым средствам.
Еще одной немаловажной тенденцией является оптимизация выдачи результатов поиска. В данном случае можно с уверенностью утверждать, что поисковые средства становятся более интеллектуальными. Ныне их блок искусственного интеллекта способен ранжировать результаты в зависимости от соответствия конкретному запросу. Программа анализирует расположение слов в документе, их повторяемость и общее количество. На этой основе перечень ссылок выдается в порядке соответствия запросу, причем ссылки на наиболее ценные источники, выдаются в начале списка.
В перспективе работа над тем, как сделать поисковые средства еще более интеллектуальными будет продолжаться, поскольку только системы с мощной интеллектуальной базой будут способны переработать стремительно расширяющийся океан полнотекстовых данных. В частности, именно системам искусственного интеллекта предстоит решить проблему информационного шума или "мусорных данных", которая становится все острей в связи с ростом в Интернет материалов низкой содержательной ценности.
Последняя тенденция - появление дополнительных сервисных функций, которые делают пользование поисковыми системами более привлекательным. Некоторые из навигационных средств формируют добавочные базы данных по определенным направлениям (электронные адреса частных лиц, справочники компаний, перечни последних новостей и т.д.). Другие размещает на своих страницах ссылки на наиболее популярные справочные ресурсы Интернет, как например электронные словари, тезаурусы, энциклопедии, интерактивные карты и т.п. источники, что превращает интерфейс поисковых систем в хорошую отправную точку для любого, работающего с Интернет. В последние месяцы наиболее продвинутые системы предлагают даже воспользоваться услугами персонального сетевого информатора, который обеспечивает текущий поиск новых материалов по заявленной тематике.
Помимо технологических перемен, стратегические изменения в сфере поискового сервиса также очевидны. Среди них наиболее заметным является дробление поисковых средств, выделение поисковых инструментов региональной или отраслевой направленности, учитывающих материалы по отдельным странам или на определенном языке (только чисто русскоязычных систем насчитывается не менее десятка) или по определенной тематике (пока это в основном юриспруденция). Эти локальные поисковые средства призваны решить задачу исчерпывающего учета информации по отдельным странам и наиболее актуальным темам. Возможно в скором времени мы будем располагать столькими поисковыми системами, сколько сегодня существует печатных справочников и указателей.
Наряду с образованием местных поисковых серверов, ясно обозначилось также стремление распространения вширь гигантов поискового бизнеса. Широко известные Yahoo!, Alta Vista, InfoSeek форсируют создание как "зеркальных", так и специальных профильных серверов в европейском и азиатском регионах, стремясь захватить там рынок сетевой рекламы. Само по себе это еще более ожесточает конкурентную борьбу в области поискового бизнеса.
Нет сомнений, что все перечисленные тенденции эволюции поисковых средств найдут свое продолжение в ближайшем будущем. С ростом ресурсов Интернет их потенциал будет также расширяться. Продолжится совершенствование уже существующих механизмов (примерами постоянного обновления являются WebCrawler, Lycos и Alta Vista), а также вытеснение старых систем новыми под иными именами (типичный пример HotBot вытеснивший Inktomi). С уверенностью можно прогнозировать и появление совершенно новых средств, созданных на базе последних технологических достижений.
Реальной базой для дальнейшего усовершенствования поисковых орудий является расширение деловой активности в Интернет. Предприимчивые компании уже осознали, что создание и поддержка поисковых серверов является доходным бизнесом. Так как к их услугам прибегает огромное число пользователей, интерфейсы систем становятся наиболее выгодным местом для размещения рекламы. Поэтому разработчики поисковых орудий постоянно заботятся о том, чтобы сделать свой продукт максимально привлекательным. Добиться же этого можно только путем неуклонного повышения качества работы систем по всем рассмотренным показателям.
Список литературы
Богданов-Катьков Н.В., Орлов А.А. «Интернет. Новейший справочник», С-Пб, «Эксмо», 2003 г.
Гудилина С. «Интернет на уроках искусства.», М., «Перспектива», 2004 г.
Гультяев А. «Самое главное о... Поиск в Интернете», С-Пб, «Питер», 2004 г.
Киппелиа П. «Тюнинг веб-сервера.», С-Пб, «Питер», 2003 г.
Клименко С., Уразметов В. «Internet. Среда обитания информационного общества», РЦФТИ, Протвино, 2000г.
Козлова Т.В. «Как найти любую информацию в Internet», М., «НТ Пресс», 2005 г.
Крол Эд «Всё об Internet.» Киев, «Торгово-издательское бюро BHV», 2000г.
Кузнецов С. «Методы поиска информации внутри Internet», М., «Познавательная книга плюс», 2001 г.
Лэдд Э., О’Доннел Д. «Microsoft Internet Explorer в подлиннике», «BHV-Санкт-Петербург», 2000 г.
Маргарет Левин Янг «Internet. Полное руководство», С-Пб, «BHV», 2001 г.
Маркус Браун «Методы поиска информации в Интернет», М., «Новый издательский дом», 2005 г.
Пасько В.П. «Эффективная работа в Интернете», С-Пб, «Питер», 2004 г.
Романенко В.Н. «Сетевой информационный поиск. Практическое пособие», С-Пб, «Питер», 2003 г.
Силва Стив, «Администрирование веб-серверов», М., «Кудиц-образ», 2004 г.
Солоницын Ю.А. «Интернет. Энциклопедия.», С-Пб, «Питер», 2003 г.
Шапошников И. «Интернет - программирование», С-Пб, «BHV», 2004 г.
Шрайберг Я.Л. «Интернет-ресурсы и услуги для библиотек.», М., «Либерея», 2001 г.
Также при подготовке работы были использованы материалы следующих сайтов:
Поисковые сервера Интернет:
http://www.nsc.ru/win/inter/search/
Поисковые системы Internet: эволюция и перспективы:
http://www.gpntb.ru/win/inter-events/crimea97/doc/sem4/s4doc3.html
Приложение 1. Поисковые сервера Internet
Alta Vista -- http://www.altavista.digital.com
Indexed Pages: Approx. 30 Million
Frame Support: Alta Vista does NOT support Frame style pages
Meta Tag Support: YES -- and it is important that you use a Meta Description tag for Alta Vista to accurately summarize your page
Database Refresh: Monthly
Average Submission Time: 1 to 3 days Excite - http://www.excite.com
Indexed Pages: Approx. 55 Million
Frame Support: Excite DOES support Frame style pages
Meta Tag Support: NO
Accepts multiple
Database Refresh: Weekly (so they say but evidence indicates otherwise)
Average Submission Time: 6 weeks HotBot -- http://www.hotbot.com
Indexed Pages: Approx. 55 million
Frame Support: Hot Bot does NOT support Frame style pages
Meta Tag Support: YES
Database Refresh:
Average Submission Time: 1-2 Days Infoseek - http://www.infoseek.com
Indexed Pages: Approx. 30 MillionFrame
Support: Infoseek DOES support Frame style pages
Meta Tag Support: YES... be sure to use 's for your summary
Database Refresh: every 3 weeks, (so they say)Last known update: N/A – instant submitAverage
Submission Time: Usually 2 - 10 minutes, but can take up to 3 days. Lycos -- http://www.lycos.com
Indexed Pages: Approx. 30 Million
Frame Support: Lycos DOES support Frame style pages
Meta Tag Support: No -
Accepts multiple
Database Refresh: 2 weeks
Submission Time: 1 - 5 weeks Their index and submissions are maintained by excite. Northern Light – http://www.nlsearch.com
Indexed Pages: Approx. 50 Million
Frame Support: Northern Light does not appear to support Frame style pages
Meta Tag Support: NO
Accepts multiple
Database Refresh: Monthly
Case Sensitive: Yes
Average Submission Time: In the past, 3 weeks. Planet Search- http://www.planetsearch.com
Indexed Pages: Approx. 50 Million
Frame Support: Northern Light does not appear to support Frame style pages
Meta Tag Support: NO
Accepts multiple
Database Refresh: Monthly
Case Sensitive: Yes
Average Submission Time: In the past, 3 weeks. WebCrawler - http://www.webcrawler.com
Indexed Pages: Approx. 2 Million
Frame Support: WebCrawler does NOT support Frame style pages
Meta Tag Support: None at this time
Database Refresh: Monthly (so they say)
Average Submission Time: 6-12 weeks Yahoo -- http://www.yahoo.com
Indexed Pages: Millions
Meta Tag Support: N/A
Accepts multiple
Database Refresh: constant
Average Submission Time: 2-6 weeks SNAP -- http://www.snap.com
Новая поисковая машина Yandex -- http://yandex.ru/
Русская поисковая машина Яndex
Полнотекстовая поисковая система с учетом морфологии русского языка, разработка фирмы CompTek. All Stars -- http://www.stars.ru/
Созвездие Интернет (All Stars Ru)
Справочно-поисковая система по российским информационным ресурсам. Russia on the Net -- http://www.ru/
Справочно-поисковая система по информационным ресурсам. List_ru -- http://www.list.ru/
Справочно-поисковая система по информационным ресурсам. RAMBLER -- http://www.rambler.ru/
Информационно-поисковая система.
В литературе по Internet такие поисковые системы называются Web-индексами.
Spiders – это программы, построенные на основе алгоритмов искусственного интеллекта, которые могут самостоятельно исследовать Internet в поисках узлов и документов.
26
2.Гудилина С. «Интернет на уроках искусства.», М., «Перспектива», 2004 г.
3.Гультяев А. «Самое главное о... Поиск в Интернете», С-Пб, «Питер», 2004 г.
4.Киппелиа П. «Тюнинг веб-сервера.», С-Пб, «Питер», 2003 г.
5.Клименко С., Уразметов В. «Internet. Среда обитания информационного общества», РЦФТИ, Протвино, 2000г.
6.Козлова Т.В. «Как найти любую информацию в Internet», М., «НТ Пресс», 2005 г.
7.Крол Эд «Всё об Internet.» Киев, «Торгово-издательское бюро BHV», 2000г.
8.Кузнецов С. «Методы поиска информации внутри Internet», М., «Познавательная книга плюс», 2001 г.
9.Лэдд Э., О’Доннел Д. «Microsoft Internet Explorer в подлиннике», «BHV-Санкт-Петербург», 2000 г.
10. Маргарет Левин Янг «Internet. Полное руководство», С-Пб, «BHV», 2001 г.
11. Маркус Браун «Методы поиска информации в Интернет», М., «Новый издательский дом», 2005 г.
12. Пасько В.П. «Эффективная работа в Интернете», С-Пб, «Питер», 2004 г.
13. Романенко В.Н. «Сетевой информационный поиск. Практическое пособие», С-Пб, «Питер», 2003 г.
14. Силва Стив, «Администрирование веб-серверов», М., «Кудиц-образ», 2004 г.
15. Солоницын Ю.А. «Интернет. Энциклопедия.», С-Пб, «Питер», 2003 г.
16. Шапошников И. «Интернет - программирование», С-Пб, «BHV», 2004 г.
17. Шрайберг Я.Л. «Интернет-ресурсы и услуги для библиотек.», М., «Либерея», 2001 г.
Также при подготовке работы были использованы материалы следующих сайтов:
Поисковые сервера Интернет:
http://www.nsc.ru/win/inter/search/
Поисковые системы Internet: эволюция и перспективы:
http://www.gpntb.ru/win/inter-events/crimea97/doc/sem4/s4doc3.html
Вопрос-ответ:
Как работает Yahoo!?
Yahoo! - это web-каталог, который включает различные разделы, такие как новости, спорт, финансы и т. д. Он создается командой редакторов, которые добавляют исследуют и добавляют ссылки на сайты в базу данных Yahoo!. Пользователи могут просматривать каталог по различным категориям или использовать поисковую строку, чтобы найти нужную информацию.
Как осуществляется поиск в Yahoo!?
Для поиска в Yahoo! пользователь должен ввести ключевые слова или фразы в поисковую строку, расположенную на главной странице. Затем Yahoo! производит поиск в своей базе данных и отображает результаты поиска, которые можно отсортировать по релевантности или другим параметрам.
Как работает каталог Magellan?
Magellan - это каталог, разработанный компанией McKinley. Он состоит из рубрикатора и подрубрикатора, в которых пользователи могут найти интересующие их категории. Каждая категория содержит ссылки на сайты с информацией, отобранной редакторами Magellan. Поисковый запрос пользователя сравнивается с базой данных Magellan, и выводятся результаты, соответствующие запросу.
Как осуществляется поиск в директории Magellan?
Для поиска в директории Magellan пользователи могут выбрать соответствующую категорию, а затем просматривать ссылки на сайты, связанные с выбранной темой. Также можно использовать поисковую строку, чтобы найти конкретные ключевые слова или фразы внутри директории.
Как работает Infoseek?
Infoseek - это web-индекс, который использует автоматизированную систему для поиска и индексации интернет-страниц. Он проходит по всем доступным страницам в Интернете и индексирует их содержимое. При поиске пользователи вводят ключевые слова или фразы, и Infoseek выводит результаты поиска, основанные на релевантности и других факторах.
Как работает поисковая система Yahoo!?
Поисковая система Yahoo! - это web-каталог, который содержит огромное количество ссылок на различные веб-сайты. Для включения сайта в каталог Yahoo! владельцы сайтов сабмитят их через специальную форму. Каталог Яху использует команду редакторов, чтобы проверить и классифицировать веб-сайты и добавить их в соответствующие категории в каталоге. Когда пользователь вводит запрос в поисковую строку Yahoo!, система отображает веб-сайты, которые соответствуют этому запросу, из каталога Yahoo! и других баз данных поисковики Yahoo!.
Как выполняется поиск в каталоге Yahoo!?
Для выполнения поиска в каталоге Yahoo! пользователь вводит ключевые слова или фразы в поисковую строку. Затем система обрабатывает этот запрос и отображает список веб-сайтов, которые соответствуют запросу пользователя. Пользователь может также использовать фильтры и уточнения, чтобы сузить результаты поиска и найти более релевантные веб-сайты.
Что такое каталог Magellan компании McKinley?
Каталог Magellan компании McKinley - это еще один web-каталог, который содержит ссылки на различные веб-сайты. Он был создан с целью предоставить полезные и релевантные результаты поиска пользователям интернета. Веб-сайты включаются в каталог Magellan после проверки и оценки командой редакторов, а затем классифицируются по категориям для удобства пользователей. Поиск в каталоге Magellan позволяет пользователям находить интересующую их информацию на основе их запросов.