Способы поиска информации в интернете

Поиск по ключевым словам. Язык запросов поисковой системы

Поисковая система обычно имеет поле для ввода ключевых слов, по которым она находит документы, содержащие эти ключевые слова. Чем лучше (качественнее) составлен запрос к поисковой машине, тем меньше общее количество найденных документов, и больше из них документов, соответствующих тому, что Вам требуется. Если запрос очень простой или составлен неграмотно, то поисковая машина может Вам выдать несколько миллионов документов, которые Вам не просмотреть за всю жизнь.

Используя язык запроса, содержащий логические операции (логические операторы AND, OR, NOT, скобки и др.), префиксы обязательности присутствия ключевых слов в документе «+» и «-» (при,поиске по узкоспециализированным терминам — предпочтительней использовать), расположения ключевых слов в документе рядом или на определенном расстоянии и т. д.) и др. элементы, и большее количество связанных ими ключевых слов, можно значительно сузить область поиска и более качественно составить запрос к поисковому серверу. Следует учитывать, что разные поисковые системы могут иметь как различающиеся языки запросов, так и очень похожие.

На сайтах поисковых систем обычно есть ссылки на справочную информацию по использованию поисковых сервисов, языков запросов, рекомендации по поиску и т. д.

Некоторые поисковые системы дополнительно имеют функцию расширенного поиска, позволяющую пользователю более точно описать то, что ему конкретно нужно и без знания языка запроса. Функцию расширенного поиска имеют, например, поисковые системы Яндекс и .

Способы поиска информации в интернете: почему стоит пользоваться несколькими поисковыми системами?

При поиске информации рекомендуется использовать как минимум две поисковые системы – Google и Яндекс, но чем больше, тем лучше. Дело в том, что у разных поисковиков страницы сайтов индексируются по-разному. В связи с этим даже самый простой запрос в разных поисковых системах может привести вас к разным результатам.

То, что не заметили алгоритмы одной поисковой системы, могут заметить алгоритмы другой, а то, что Яндекс покажет на 10 или 20 странице поисковой выдачи, в Google вполне может оказаться на первых позициях. Кроме того, разные поисковые системы по-разному реагируют на частоту употребления слов в предложении, на наличие или отсутствие знаков пунктуации, на порядок слов и так далее.

Почему не получается найти нужную информацию в интернете

Итак, всего можно выделить две основные причины.

Первая — то, что вы ищете, попросту отсутствует в сети. Например, если вы учитесь в университете и ищете информацию на какую-то узкоспециализированную тему, вполне возможно, что ничего полезного для себя вы не найдете. Либо вам будут предлагаться материалы на похожие или приближенные к вашей темы, либо вы будете находить превью платного контента, за доступ к которому необходимо будет платить.

И вторая причина отсутствия нужной информации при поиске — это неправильная постановка запроса.

В первом случае мы вам помочь, к сожалению, никак не сможем, тут уж ничего не поделаешь, а вот что можно сделать во втором — сейчас расскажем.

Другие проекты, связанные с поиском в интернете

Интернет становится все более и более могущественным, и собирает все большее количество данных. Поэтому тема эффективного поиска необходимой информации пользуется все большей популярностью. Ниже представлено еще несколько предложений из ряда актуальных проектов, которые заслуживают внимания.

Hakia

Hakia – это наиболее перспективный кандидат новаторского поиска будущего.

Обеспечивает поиск по семантическим критериям и может подбирать ресурсы только на основе лингвистических свойств. Из-за этого Hakia располагает на данный момент скромным набором ресурсов, так что не в состоянии похвастаться слишком высокой точностью.

TouchGraph

TouchGraph (www.touchgraph.com) представляет собой приложение на основе платформы Java. Используется для графического представления связей между сайтами, результатами поиска и тематическими группами. Для того, чтобы воспользоваться 30-дневной демо-версией, вам необходимо зарегистрироваться.

TouchGraph играет роль мультипоиска. Сервис включает в результаты своих поисков выдачу из различных поисковых систем и создает своеобразную карту из отдельных тематических областей.

Запрос представляет собой главный узел графического отображения, расположенный в самом центре, а найденные тематические группы складываются вокруг него как спутники. Линии между отдельными узлами символизируют семантические взаимоотношения и вытекают из взаимных перессылок между результатами поиска.

>Совсем немного о позитивизме

Позитивизм является философским направлением в учении о методах и процедурах научной деятельности, в котором считается, что единственным источником истинного и действительного знания вообще являются только эмпирические (подтверждённые опытным путём) исследования.

Также позитивизм говорит о том, что философское исследование не несёт в себе познавательной ценности. Базовой предпосылкой позитивизма является то, что любые подлинные (они же позитивные) знания – это совокупность результатов специальных наук.

Основной же целью позитивизма является получение объективного знания, что возможно только через проверку информации на деле. Руководствуясь всем этим, мы снова можем вернуться к идее о том, что наиболее достоверными источниками информации являются научные исследования и научно-популярные размышления.

Вооружившись этим принципом как основным, можно начать использовать и другие.

Поиск в заголовках веб-страниц

Заголовки веб-страниц находятся в верхней части браузера и в результатах поиска. Вы можете ограничить свой поиск только заголовками веб-страниц с помощью команды поиска allintitle. Термин allintitle – это поисковый оператор, специфичный для Google, который возвращает результаты поиска, ограниченные поисковыми терминами, найденными в заголовках веб-страниц.

Например, если вы хотите получить результаты поиска только со словосочетанием «теннисный чемпионат», вы должны использовать этот синтаксис: allintitle: теннисный чемпионат

Это вернет результаты поиска Google со словами «теннисный чемпионат» в заголовках веб-страниц.

Попробуйте несколько поисковых систем

Не впадайте в рутину использования одной поисковой системы для всех ваших поисковых запросов. Каждая поисковая система возвращает разные результаты. Кроме того, существует множество поисковых систем, которые фокусируются на определенных нишах: игры, блоги, книги, форумы и т.д.

Чем внимательнее вы будете выбирать поисковую систему, тем успешнее будут ваши поиски. Проверьте этот список поисковых систем, чтобы использовать в следующий раз, когда вы что-то ищете.

У вас будет большой соблазн воспользоваться вашей любимой поисковой системы и использовать только самые известные функции; тем не менее, большинство поисковых систем имеют широкий спектр расширенных опций поиска, инструменты и сервисы, которые позволяют здорово экономить время. Всё это может сделать ваши поиски более продуктивными.

Кроме того, если вы только начинаете изучать, как искать в интернете, легко оказаться перегруженным огромным количеством информации, которая доступна вам, особенно если вы ищете что-то очень конкретное. Не сдавайтесь! Продолжайте пробовать, и не бойтесь пробовать новые поисковые системы, новые комбинации фраз, новые методы веб-поиска и т.д.

Используйте поисковый синтаксис

Можно существенно облегчить себе задачу, если использовать в запросах специальные символы или команды. Их очень много — перечислим только те, что помогут решить повседневные задачи: 

Если вы точно знаете, что ищете, используйте “ ” (кавычки). В выдаче будут показываться только сайты, содержащие слова в том порядке и в той форме, как вы указали в запросе. Так удобнее всего искать стихи и цитаты.

Если вы забыли одно или два слова в цитате — замените их * (звёздочкой), и скорее всего, система вас поймёт. 

Если вы хотите найти текст, из которого помните всего несколько слов, воспользуйтесь командой allintext:. Поисковик покажет страницы, где есть все указанные слова. 

Если вы точно знаете, что нужная информация есть на определённом сайте, но вам не удалось её там найти, поможет команда site:. Она ограничит область поиска только одним веб-адресом. 

Если вы хотите найти сайты, похожие на тот, что вы уже нашли, введите в Google related: и адрес сайта без пробела.

§ 4.2. Поиск информации в Интернете

Содержание урока

4.2. Поиск информации в Интернете

4.2. Поиск информации в Интернете

Сеть Интернет растет очень быстрыми темпами, поэтому найти нужную информацию становится все сложнее. Для поиска информации используются специальные поисковые системы, которые содержат постоянно обновляемую информацию о местонахождении Web-страниц и файлов на серверах Интернета.

Поисковые системы содержат тематически сгруппированную информацию об информационных ресурсах Всемирной паутины в базах данных. Специальные программы-роботы периодически «обходят» Web-серверы Интернета, читают все встречающиеся документы, выделяют в них ключевые слова и заносят в базу данных Интернет-адреса документов.

Большинство поисковых систем разрешают автору Web-сайта самому внести информацию в базу данных, заполнив регистрационную анкету. В процессе заполнения анкеты разработчик сайта вносит адрес сайта, его название, краткое описание содержания сайта, а также ключевые слова, по которым легче всего будет найти сайт.

Поиск по ключевым словам. Поиск документа в базе данных поисковой системы осуществляется с помощью введения запросов в поле поиска.

Запрос должен содержать одно или несколько ключевых слов, которые являются главными для этого документа. Например, для поиска самих систем поиска в Интернете можно в поле поиска ввести ключевые слова «российская система поиска информации Интернет».

Через некоторое время после отправки запроса поисковая система вернет список ссылок на документы, в которых были найдены указанные ключевые слова. Для просмотра такого документа в браузере достаточно активизировать указывающую на него ссылку.

Если ключевые слова были выбраны неудачно, то список ссылок на документы может быть слишком большим (содержать десятки и даже сотни тысяч ссылок). Для того чтобы уменьшить список, можно в поле поиска ввести дополнительные ключевые слова или воспользоваться каталогом поисковой системы.

Одной из наиболее полных и мощных поисковых систем является (www.google.ru), в базе данных которой хранятся более 300 миллиардов Web-страниц, и каждый месяц программы-роботы заносят в нее 5 миллионов новых страниц (рис. 4.9). В российской части Интернета обширные базы данных, содержащие по 400 миллионов документов, имеют поисковые системы Яндекс (www.yandex.ru), Mail (www.mail.ru) и Rambler (www.rambler.ru).

Поиск в иерархической системе каталогов. В базе данных поисковой системы Web-сайты группируются в иерархические тематические каталоги, которые являются аналогами тематического каталога в библиотеке.

Тематические разделы верхнего уровня, например «Интернет», «Компьютеры», «Наука и образование» и т. д., содержат вложенные каталоги. Например, каталог «Интернет» может содержать подкаталоги «Поиск», «Сервис» и др.

Рис. 4.9. Поиск по ключевым словам в системе Google

Поиск информации в каталоге сводится к выбору определенного каталога, после чего пользователю будет представлен список ссылок на наиболее посещаемые и содержательные Web-сайты. Каждая ссылка обычно аннотирована, т. е. содержит короткий комментарий к содержанию документа.

Наиболее полный многоуровневый иерархический тематический каталог русскоязычных Интернет-ресурсов имеет поисковая система Апорт (www.aport.ru) (рис. 4.10). Каталог содержит подробную аннотацию содержания Web-сайтов и указание на их географическое положение.

Поиск файлов. Для поиска файлов на серверах файловых архивов существуют специализированные поисковые системы, в том числе российская файловая поисковая система FileSearch (www. filesearch.ru). Для поиска файла необходимо имя файла ввести в поле поиска, и поисковая система выдаст ссылки на серверы файловых архивов, на которых хранится файл с заданным именем.

Рис. 4.10. Тематические каталоги поисковой системы Апорт

Cкачать материалы урока

Язык поисковых запросов Яндекс`а

Пример Значение
«К нам на утренний рассол« Слова идут подряд в точной форме
«Прибыл * посол« Пропущено слово в цитате
полгорбушки & мосол Слова в пределах одного предложения
снаряжайся && добудь Слова в пределах одного документа
глухаря | куропатку | кого-нибудь Поиск любого из слов
не смогешь << винить Неранжирующее «и»: выражение после оператора не влияет на позицию документа в выдаче
я должон /2 казнить Расстояние в пределах двух слов в любую сторону (то есть между заданными словами может встречаться одно слово)
государственное дело &&/3 улавливаешь нить Расстояние в 3 предложения в любую сторону
нешто я ~~ пойму Исключение слова пойму из поиска
при моем /+2 уму Расстояние в пределах двух слов в прямом порядке
чай ~ лаптем Поиск предложения, где слово чай встречается без слова лаптем
щи /(-1 +2) хлебаю Расстояние от одного слова в обратном порядке до двух слов в прямом
!Соображаю !что !чему Слова в точной форме с заданным регистром
получается && (+на | !мне) Скобки формируют группы в сложных запросах
!!политика Словарная форма слова
title:(в стране) Поиск по заголовкам документов
url:ptici.narod.ru/ptici/kuropatka.htm Поиск по URL
беспременно inurl:vojne Поиск с учетом фрагмента URL
host:lib.ru Поиск по хосту
rhost:ru.lib.* Поиск по хосту в обратной записи
site:http://www.lib.ru/PXESY/FILATOW Поиск по всем поддоменам и страницам заданного сайта
mime:pdf Поиск по одному типу файлов
lang:en Поиск с ограничением по языку
domain:ru Поиск с ограничением по домену
date:200712* Поиск с ограничением по дате
date:20071215..20080101, date:>20091231 Поиск с ограничением по интервалу дат
cat:11000051 Поиск по рубрике Яндекс.Каталога

Каким источникам в Интернете можно доверять?

Все ресурсы в сети можно разделить на достоверные и требующие проверки. Как правило, достоверная информация, которая готовится специалистами и проверяется до публикации, находится на следующих сайтах:

  1. Официальные сайты крупных компаний и государственных органов, либо ресурсы, официально поддерживаемые крупными компаниями и госорганами. Например, Минздав РФ создал и поддерживает сайт о здоровье www.takzdorovo.ru. На сайте указано, что информация перед публикацией проходит проверку специалистов. Как искать информацию в Интернете на специализированных сайтах, мы разберем ниже в статье.
  2. Корпоративные блоги компаний. Например, по теме ИТ можно искать информацию в официальных блогах ИТ-компаний, которые они ведут на сайте Хабрахабр. Там публикуется много полезной информации. Есть корпоративные блоги, которые находятся на самом сайте компании. Например, корпоративный блог Яндекса. Ниже в статье мы также разберем, как правильно искать информацию на определенных сайтах.
  3. Официальные сайты СМИ. На таких сайтах внизу будет размещена информация о регистрации сайта в качестве СМИ, указан номер свидетельства и дата регистрации. Перед публикацией информация в СМИ проверяется редакторами. Более того, по закону за достоверность размещаемой информации СМИ несут ответственность. Найти сайты СМИ можно, например, в каталоге Яндекса.
  4. Официальные каналы на YouTube. Например, компания Яндекс имеет канал Обучение рекламным технологиям, на котором публикует информацию по теме интернет-рекламы. Как правило, ссылки на официальные каналы можно найти на официальных сайтах компаний.

Из всех остальных источников информацию требуется проверять, поскольку вы не знаете, какой человек писал статью, каким опытом он обладает и может ли квалифицированно писать на ту или иную тему, проверял ли кто-то достоверность информации до публикации в Интернете или нет. Если вы напишете статью на основе недостоверных данных, вы можете ввести своих читателей в заблуждение.

Основные типы поисковых систем. Какой поисковой системой воспользоваться

Существует 2 основных типа поисковых систем Интернет: индексные и классификационные (каталоговые). Индексные поисковые системы (например, Яндекс, Rambler, , Bing и др.), работая в автоматическом режиме обновления своей информации, просматривают в Интернет содержимое серверов, индексируя информацию, содержащуюся в них и внося информацию о расположении слов на страницах сайтов в свои базы данных. Каталоговые системы поиска (например, Rambler, Yahoo! и др.) содержат тематически структурированный каталог серверов, и чаще всего пополняются вручную. Обычно на WWW-странице классификационной поисковой системы содержится и поле для ввода ключевых слов для поиска в собственной базе данных. В каталоговой системе поиска можно, начав с более крупной тематической рубрики, и постепенно спускаясь дальше по рубрикам, прийти к ссылке на нужный Вам сайт. В одних случаях бывает удобней воспользоваться первым типом поисковых систем, в других — вторым. Есть поисковые системы, сочетающие в себе оба принципа работы. В частности, многие индексные поисковые системы имеют и каталоговую систему поиска. Также поисковые машины могут использовать и какие-то другие принципы методы поиска.

Многие поисковые системы преобразовались в Интернет-порталы, объединяющие в себе большое количество ресурсов и сервисов. На страницах таких порталов можно прочитать новости, ознакомиться с программой телепередач, узнать о погоде, курсах валют, воспользоваться картографическим сервисом и мн. др.

Наиболее популярные российские поисковые системы имеют возможности поиска с учетом особенностей русского языка.

Для поиска одновременно в нескольких поисковых системах можно воспользоваться так называемыми поисковыми метамашинами, обращающимися сразу к нескольким поисковым средствам, например, NIGMa.

Существуют также поисковые системы, специализирующиеся по поиску по одной какой-либо теме (например, по информационным технологиям, по музыке, по ресурсам, посвященные природе и т. д.)

Программы обработки запроса

Программа обработки запроса — это программа, которая в соответствии с запросом пользователя «просматривает» индекс на предмет наличия нужной информации и возвращает ссылки на найденные документы.

Наиболее распространенными поисковыми системами являются:

Яндекс (www.yandex.ru)

Гугл (www.google.ru)

Результаты поиска выстраиваются по значимости – наиболее важные документы размещаются в начале списка. При этом положение найденного документа в списке определяется тем, в каком месте документа находится ключевое слово (в заглавии документа важнее, чем в любом другом месте) и числом упоминаний ключевого слова (чем больше упоминаний, тем ранг выше).

Таким образом, сайты, расположенные на первых местах в списке, являются ведущими не с содержательной точки зрения, а практически, по отношению к частоте упоминания ключевого слова. В связи с этим, не следует ограничиваться просмотром первого десятка предложенных поисковой системой сайтов.

Список документов, предлагаемый поисковой системой в ответ на ключевую фразу или слово, может оказаться огромным. В связи с этим в мощных Поисковых Машинах предоставлена возможность в рамках первого списка, выбрать документы, которые точнее отражают цель поиска, то есть уточнить или улучшить результаты поиска, с помощью команды «Искать в найденном».

Поиск

Типы и способы поиска.

Способы поиска:

С помощью адреса Web-страницы;

С помощью поиска по гипиерсвязям;

С помощью поисковых программ.

Типы поиска в интернете:

поиск «бытовой», «любительской» информации (это могут быть сведения о погоде, расписания движения самолетов, сведения о результатах спортивных состязаний, текущие политические новости и многое другое);

Профиссионально-ориентированный или широкий информационный поиск;

Поиск справочной информации;

Поиск текущей профессиональной информации;

Поиск мест хранения информации;

Поиск ресурса по неполным данным о нем.

Методы поиска

Сплошной. При сплошном методе пользователь для осуществления поставленной задачи обследует сплошь и без пропусков все наличие имеющихся пособий и источников.

Индуктивный. Индуктивный метод в широком смысле слова – это форма мышления, посредством которой мысль наводится (от лат. inductio – наведение) на какое-либо общее правило, общее положение, присущее всем единичным предметам какого-либо класса.

Дедуктивный. Содержанием дедукции, как метода познания, является использование общих положений при исследовании конкретных явлений.

Метод ассоциативной индексации определяется как «… механизм, благодаря которому любой элемент информации может служить отправной точкой для немедленного автоматического выбора (пользователем) любого другого элемента информации».

Метод навигации. Навигацией называется интерактивно управляемый пользователем процесс перемещения из одних узлов в другие, технически осуществляемый путем нажатия мышью на графически выделенные на экране компьютера объекты – «электронные» кнопки, идентифицирующие исходные точки дуг гипертекста.

Броузинг (browse) – процесс беглого просматривания гипертекстовых документов или гипертекстовой базы данных с целью поиска определенных сведений или просто чего-нибудь любопытного; в общем смысле – действий, целью которых является изучение информации, но не ее изменение.
Поиск информации — задача, которую человечество решает уже многие столетия. По мере роста объема информационных ресурсов, потенциально доступных одному человеку, были выработаны все более изощренные и совершенные поисковые средства и приемы, позволяющие найти необходимый документ. Обширные возможности для работы с большими массивами информации дают поисковые сервисы Interner.

Контекстный поиск – это поиск по точной фразе. Он удобен для реферативного поиска информации, но доступен далеко не во всех поисковых системах. Прежде всего, чтобы обеспечивать такую возможность, система должна работать не только индексированными файлами, но и с полноценными образами Web-страниц. Эта операция достаточно медленная, и ее выполняют не все поисковые системы.

Боты Telegram

Преимущества ботов:

  • удобство, скорость получаемой анализируемой информации по горячим следам — высокая;
  • отсутствие необходимости вкл. Tor и идти в Даркнет к БД;
  • отсутствие регистрации на специализированных сайтах;
  • много качественной/полезной получаемой информации.

Минусы ботов:

  • Некоторые боты могут работать в демо-режиме, предоставляемый функционал просит $.
  • Боты принадлежат хозяевам/разработчикам/киберпанкам, а значит могут отваливаться/глохнуть/сдохнуть;
  • По направлению указательного пальца г-а Дурова боты могут исчезнуть в забвенье.

1. EGRUL

@egrul_bot

Пробивает конторы/ИП, по вводу ФИО/фирмы предоставляет ИНН объекта, учредителей бизнеса/партнеров и отчет налоговую декларацию. И наоборот: поиск по ИНН выдаст ФИО/конторы. Работает по РФ.

2. BMI NP

@bmi_np_bot

По номеру телефона определяет регион и оператора.

3. MAILSEARCH

@mailsearchbot

4. GETFB

@getfb_bot

По запрашиваемому номеру телефона выдает ссылку на профиль в FaceBook.

5. BUZZIM ALERPTS

@buzzim_alerts_bot

Поисковая система по платформе Telegram. Ищет упоминания ников/каналов в чатах статьях. Присутствует функция оповещения, если что-то где-то всплывёт. Например, можно посмотреть какие каналы разнесли твои посты с Telegram, проверить ник юзера, где он еще трепался.

6. AVINFO

@avinfobot

По вводу мобильного телефона выдаст номер машины/марку, а также ссылку и все объявления на Avito.ru. В демо-режиме бесплатно доступно несколько таких поисков/отчетов. Ценник за функционал приличный, некоторые хитрожопые юзеры только ради этого бота сбрасывают свой аккаунт в Telegram, чтобы бесплатно пробивать своих жертв (бесконечное удаление/регистрация учетки на один и тот же номер телефона).

7. SMART SEARCH

@smart_searchbot

Робот разведчик. Подскажет секреты и приемы OSINT.

Традиционный способ представления результатов

Список результатов поиска это в значительной степени отсортированные в порядке убывания (по степени соответствия искомого понятия) документы найденные в интернете.

Влияние на это упорядочение имеют различные факторы. Каждому из них приписывается определенный вес (приоритет). К таким факторам относятся количество ссылок на данную страницу, степень соответствия языку, а также метаданные, такие как название сайта, его описание и ключевые слова, выделенные автором.

Кроме того, поисковые системы учитывают включения и оценки интернет-пользователей, посещающих сайт. Точные значения присвоены отдельным факторам, остаются в большинстве случаев в тайне и не становятся достоянием общественности.

Релевантность и интуиция

Когда, в поисках конкретной информации, вы получите простой список результатов, вы будете стоять лицом к лицу с несколькими проблемами. Только оценивая результаты, нажимая предлагаемые ссылки, одну за другой, вы обнаружите, что данный результат оказался хитом или нет.

На первый взгляд, пользователь не в состоянии определить, почему этот элемент оказался в списке результатов и почему отдельные результаты занимают такие, а не другие пункты рейтинга релевантности. Хотя ключевые слова, введенные пользователем в поисковом запросе пользователя, будут выделены жирным шрифтом в кратком описании, построенном из найденной страницы.

Таким образом, вам не удастся выяснить, почему поисковая система предложила вам определенный URL-адрес и удовлетворит ли содержимое ваши ожидания и жажду знаний.

Персонализация поиска

Стандартные поисковые системы ведут локальное журналы настройки поиска конкретного пользователя. Устанавливают в его компьютере профиль поиска и пытаются его интерпретировать.

Этот метод носит название профиля и имеет целью, помимо всего прочего, добиться большей точности, представляя вам индивидуальные, и поэтому подходящие для ваших нужд результаты поиска.

Это решение, однако, имеет серьезный недостаток. Со временем вы перестанете получать нейтральный, объективный результат поиска. И Вам не остается ничего другого, как удалить все протоколы поисковых систем и файлы cookie.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector