А. Артемов - Мониторинг информации в Интернете Страница 5
- Категория: Научные и научно-популярные книги / Прочая научная литература
- Автор: А. Артемов
- Год выпуска: -
- ISBN: нет данных
- Издательство: -
- Страниц: 9
- Добавлено: 2019-01-29 11:39:20
А. Артемов - Мониторинг информации в Интернете краткое содержание
Прочтите описание перед тем, как прочитать онлайн книгу «А. Артемов - Мониторинг информации в Интернете» бесплатно полную версию:В данном пособии рассматриваются принципы организации и поиска информации в интернете, приводится описание языков запросов поисковой машины Яндекс, Гугл, Рамблер.Предназначено для преподавателей и студентов вузов всех специальностей, руководителей и менеджеров компаний, специалистов по безопасности, а также для широкого круга лиц, работающих в сети Интернет.
А. Артемов - Мониторинг информации в Интернете читать онлайн бесплатно
6. Заглавные и строчные буквы.
Яндекс периодически меняет некоторые нюансы в этом вопросе, стараясь, однако, придерживаться главного правила: слова, написанные с маленькой буквы, будут выдаваться и с маленькой, и с заглавной, а слова, написанные с заглавной буквы, будут выдаваться только с заглавной. Изменения, которые периодически происходят в подходах Яндекса к этой проблеме, обычно касаются попыток исправить наиболее распространенные ошибки пользователей. Ознакомиться с текущим состоянием дел можно как на странице помощи самого поисковика, так и в работе Дениса Фурсова.
Однако для эффективной работы достаточно просто следовать приведенному в этом разделе правилу.
Если же слово написано целиком заглавными буквами, Яндекс будет рассматривать его как представленное прописными. То есть, результаты ввода в поисковую строку понятия «РИТЕЙЛЕР» будут такими же, как и в том случае, если мы оформим запрос иначе – «ритейлер».
Запрос: [бухгалтерский Учет] Результат поиска: страниц – 556 606, сайтов – не менее 1984 В выдаче: … Положение по бухгалтерскому учету «Учет основных средств» ПБУ 6/01» Запрос: [бухгалтерский учет]
Результат поиска: страниц – 5 742 378, сайтов – не менее 2169 В выдаче: …постановка, восстановление и ведение бухгалтерского учета
7. Обязательное включение слов запроса в выдачу.
Чтобы искомые слова непременно присутствовали в документах к выдаче, используется оператор «плюс» (+). Для того чтобы наглядно показать работу этого оператора, сделаем запрос со словами, которые редко оказываются в одном документе. При этом разделим их пробелом.
А затем сделаем точно такой же запрос, но поставим знак «плюс» перед каждым словом, запретив тем самым Яндексу выдавать документы, в которых набор искомых терминов неполный.
Результаты отличаются разительно – вместо тридцати трех тысяч страниц в первом случае, во втором мы имеем всего восемь!
Запрос: [литейщик провизор стоматолог маркшейдер]
Результат поиска: страниц – 33 005, сайтов – не менее 1192
Запрос: [+литейщик +провизор +стоматолог +маркшейдер]
Результат поиска: страниц – 8, сайтов – не менее 4 В выдаче:
ОК 010-93: Общероссийский классификатор занятий (ОКЗ)
… 222 1 Специалисты в здравоохранении (кроме медицинских сестер) 2221 5 Врачи 2222
Стоматологи 2223 2 Ветеринары 2224 6 Фармацевты 2229 4 Специалисты-…
Образование в Кузбассе Литейщик пластмасс Литейщик цветных металлов…
№ 257 від 27/07/1995, Покажчик, Класифікатор, Держстандарт України для детского и подросткового возраста 2222.1 23667 – Научный сотрудник (стоматология) 2222.2 20459 —
Врач-стоматолог 2222.2 20462 – Врач-стоматолог… 8122.2 13382 7 Листобойщик 8122.2
13384 2 Литейщик вакуумного, центробежно-вакуумного и центробежного литья 8122.2
13388 19 Литейщик изделий из…
Оператор «плюс» бывает незаменим и в тех случаях, когда есть необходимость обязательно включить в выдачу стоп-слова.
Очень хорошо это описано в работе Дениса Фурсова.
Если какие-то слова должны быть в результатах, поставьте перед ними +'. Помогает со стоп-словами. Сейчас Яндекс, кажется, учитывает стоп-слова только в запросе из трех и менее слов (даже не операндов!). +не покупай (samsung|lg) позволит найти негативные отзывы о продукции этих фирм (сравните с простым 'не покупай (samsung|lg)). Запрос: [+не покупай (samsung | lg)] Результат поиска: страниц – 5 314, сайтов – не менее 1227
В выдаче: phorum – Основной форум – Re: ЛЮДИ, не покупайте Samsung 753 DFX в Wellcome ЛЮДИ, не покупайте Samsung 753 DFX в Wellcome новое Запрос: [не покупай (samsung | lg)]
Результат поиска: страниц – 779 096, сайтов – не менее 629
В выдаче: Купля продажа мобильных телефонов на Buy-Mobile.ru – Мобильный друг ждет!
Текст ссылок: купить lg бу дешево… купить lg или sony… Правда, Яндекс игнорирует стоп-слова как-то бессистемно. Так, запросы: [+не покупай (троллейбус | автобус)] и [не покупай (троллейбус | автобус)] – дают одинаковое количество результатов, в которых слово «не» учитывается как релевантное. Тем не менее, поскольку нет возможности проверить, как Яндекс отреагировал на запрос в каждом конкретном случае, мы рекомендуем воспользоваться советом Дениса и ставить «плюс» перед стоп-словами, как, впрочем, и перед теми словами, которые вы обязательно хотели бы видеть в выдаче.
8. Поиск точной фразы.
Не исключено, что вам понадобится найти определенную цитату либо рекламный слоган какой-либо компании. Для этого используется оператор «двойные кавычки», аналогичные тем, что применяются в прямой речи. В выдаче при поиске цитаты будут присутствовать документы, содержащие все слова искомой фразы, в той же форме и последовательности, что и в оригинальной ее версии. Важно помнить, что точной цитата будет лишь в том случае, если кроме фразы, указанной в кавычках, в запросе не будет никаких лишних слов. Если помимо фразы в кавычках появится еще хотя бы одно слово, Яндекс будет выдавать документы, которые содержат все слова цитаты, сохранит их последовательность, варьируя при этом их формы. Как следствие, количество документов в выдаче заметно возрастет. Яндекс называет это «слова идут подряд».
Запрос: [ «ты всегда думаешь о нас»]
Результат поиска: страниц – 2905, сайтов – не менее 778
В выдаче: Tefal – ты всегда думаешь о нас! Онли!!
Tefal, ты всегда думаешь о нас!
X-файлы – Тефаль, ты всегда думаешь о нас.
Тефаль, ты всегда думаешь о нас! (антиреклама 1) (Николай Якимчук) | Проза. ру…
Электронный журнал со свободной публикацией произведений. Ежедневные редакторские обзоры лучших произведений.
Интересно понаблюдать при такой слаженности результатов за тем, как работает оператор исключения слова из предложения:
Запрос: [ «ты всегда думаешь о нас» ~ (tefal | тефаль)]
Результат поиска: страниц – 307 773, сайтов – не менее 1197
В выдаче: Конференции – АвтоКазань – АвтоКазань. Ru
а я вот всегда думал (+) >> OldDaddy 20.05.2005 17:21:24
Chel.ru – Новости бизнеса. Справочник промышленных, торговых, общественных и…
Почему-то я всегда думала, что практические статьи д.б. написаны ПОНЯТНЫМ языком.
Открытки Всегда думаю о тебе!!
> Красивые фотографии, открытки > Открытки > Всегда думаю о тебе!! Я Всегда думаю о тебе!!
9. Слова находятся на определенном расстоянии.
Этот оператор очень часто используется на практике, так как позволяет достаточно четко ограничить поиск. Вид он имеет следующий: /n, где n, по определению самого Яндекса, – это «максимально допустимое расстояние между двумя любыми словами запроса».
Денис Фурсов дает такое определение оператору: «Расстояние между словами». Мы предлагаем следующим образом запомнить значение цифры в операторе: эта цифра (n) показывает, каким по счету будет второе слово после первого. Например, если в запросе написано:
[годовой /1 отчет], то в выдаче будет присутствовать фраза «годовой отчет». Потому что слово «отчет» будет первым после слова «годовой». Если в запросе написано: [годовой /2 отчет] то в выдаче может появиться «годовой финансовый отчет», потому что слово «отчет» может быть вторым после слова «годовой», а первым может быть любое другое слово.
Надеемся, мы объясняем доступно, потому что хотим рассказать еще о двух нюансах оператора расстояния между словами.
На самом деле, по запросу:
[годовой /2 отчет] документы, содержащие выражение «годовой отчет», также будут выданы, потому что меньшее значение расстояния возможно, а большее – нет. Мало того, в выдачу попадет не только сочетание «годовой отчет», но и «отчет годовой». Расстояние между словами распространяется на оба слова.
Если же есть необходимость ограничить выдачу фразой «годовой отчет», исключив из нее выражение «отчет годовой», то оператор можно написать вот так: [годовой /+1 отчет].
Это практически эквивалентно запросу: [годовой /1 отчет ~ «отчет годовой»].
Количество документов в выдаче совпадает, и в первых рядах в момент составления запроса был документ:
Годовой отчет – 2005. О книге.
Только с «Годовым отчетом – 2005» от журнала «Главбух» вы получите удобный мини-справочник по годовому отчету…
Мы не будем чрезмерно загружать читателя описанием оператора расстояния между словами, так как сказанного вполне достаточно для работы, а изучение всех нюансов функционирования поискового движка Яндекса не входит в круг основных наших задач. Чтобы увидеть разницу между наличием и отсутствием знака «плюс» в операторе расстояния между словами, проведем напоследок такой эксперимент: сначала сделаем запрос, который позволяет появиться в выдаче документам, содержащим, согласно оператору расстояния, как фразе «годовой отчет», так и «отчет годовой», при этом исключив из результатов «годовой отчет»; а затем создадим запрос, требующий, за счет написания оператора расстояния между словами, выдачи только «годового отчета», и убедимся, что при попытке исключения конкретной фразы «годовой отчет» результат получить не удастся.
Жалоба
Напишите нам, и мы в срочном порядке примем меры.