Правила поиска Знаки препинания - davaiknam.ru o_O
Главная
Поиск по ключевым словам:
страница 1
Похожие работы
Название работы Кол-во страниц Размер
Знаки препинания в предложениях с прямой речью 1 23.37kb.
Урок русского языка в 11 классе (17 ноября 2011 г.) Тема урока «Знаки... 1 50.14kb.
Факультативные знаки препинания 1 54.54kb.
«Знаки препинания как средство художественной выразительности» 1 96.12kb.
Тематическое планирование № п/п Дата Тема раздела, урока 3 406.89kb.
Выпуск 4, декабрь 2009 года Из истории возникновения знаков препинания 1 55.32kb.
Пунктуация в простом и сложном предложениях 1 57.63kb.
Конспект урока по русскому языку в 7 классе. Тема: Обращение. 1 42.11kb.
Статья отнесена к разделу: Преподавание русского языка 1 79.85kb.
Причастие и причастный оборот I вариант 1 24.32kb.
Олимпиада по русскому языку для 5 класса 1 120.5kb.
Приучение к апортировке (захватывание и поднесение апортировочных... 1 27kb.
Направления изучения представлений о справедливости 1 202.17kb.

Правила поиска Знаки препинания - страница №1/1


Поисковые системы

Поиск информации в Интернет. Поисковые системы


ПС Google 1

ПС Яндекс 5

ПС Рамблер 11

ПС Апорт 12

ПС Nigma 13

Метапоисковые системы 13




ПС Google


Правила поиска

Знаки препинания

  • Не распознает знаки препинания, пропускает восклицательные знаки, вопросительные знаки или знак @. Сделано это для того, что поиск проходил наиболее быстро, а результаты поиска были наиболее полными.

  • Обрабатывает запросы C++ , $10, C/net и т.п.


Логические операции

  • OR. Позволяет установить логическую связь ИЛИ, то есть, указать, что нужно найти страницы, содержащие либо то, либо другое слово.

Пример, поисковый запрос отпуск Лондон OR Париж будут отображены все страницы, в которых встречаются слова отпуск Лондон или отпуск Париж.
Одиночные цифра, буквы и отдельные слова

По умолчанию Google игнорирует отдельные буквы, цифры, а также незначащие слова (например, где, как, the, who, and), которые указываются в запросах.



Пример поисковых фраз и то, как они будут обработаны поисковой системой.

  • The sound and the fury. Данная поисковая фраза состоит всего из двух слов, поиск которых будет выполняться. Это слова Sound и Fury. Остальные слова данного запроса будут отброшены.

  • Звездные войны эпизод I. В данном случае будет отброшен только символ I. То есть, поиск будет вестись только по фразе Звездные войны эпизод.

  • The who. Поскольку данный запрос состоит только из незначащих слов, он будет выполнен «как есть». То есть, поисковая система выполнит поиск фразы The Who.

Понимая то, что в некоторых случаях поиск по незначащим словам может быть просто необходим, разработчики поисковой системы включили возможность обхода игнорирования незначащих слов и отдельных символов.

Сделать это можно двумя способами:



+ (Звездные войны эпизод +I)

«The Sound and the Fury».

Знак + говорит о том, что слово либо символ, перед которым стоит данный знак, обязательно должен быть включен в поисковый запрос.

Ограничение поисковой фразы кавычками используется для того, чтобы найти страницы с точным соответствием введенной вами фразе. Например, такой поиск часто применяется для поиска человека по его имени и фамилии.

Диапазон чисел

Google поддерживает возможность поиска на страницах не только определенного числа, но и чисел, находящихся в определенном диапазоне. Для этого достаточно поставить между двумя числами, определяющими нижний и верхний порог диапазона, две точки без пробелов.



Пример, автомобиль вес 1000..3000 кг.
Знак подстановки

Знак подстановки * используется для того, чтобы указать, что между двумя искомыми словами может находиться любое другое слово (либо несколько слов).



Пример,

поисковый запрос витамин * полезный для * диабет выполнит поиск всех страниц, на которых имеется слово витамин, после которого идет фраза полезный для, а после нее встречается слово диабет.


Калькулятор

Одной из особенностей поисковой системы Google является встроенный в нее калькулятор. То есть, можно ввести в поля для поиска выражение, которое поисковая система самостоятельно посчитает, после чего отобразит результаты по вычисленному выражению. Как правило, поисковая система автоматически определяет выражения, которые нужно подсчитать. Однако нельзя и вручную указать выражение для вычисления. Для этого достаточно поставить после выражения знак =.

Встроенный калькулятор Google поддерживает следующие операторы.

+. Оператор сложения двух чисел.

-. Оператор вычитания одного числа из другого.

*. Оператор умножения одного числа на другое.

/. Оператор деления одного числа на другое.

^. Оператор возведения одного числа в степень, указанную другим числом.

%. Оператор остатка от деления одного числа на другое.



choose. Определяет количество вхождений одного элемента в другой. Например, 18 choose th root of. Определяет n-ный корень числа. Например, 5th root of 32.

% of. Определяет количество процентов от числа. Например, 20% of 150.

Sqrt(число). Возводит число в квадрат.

Sin(число), cos(число), tan(число) и т.д. Вычисляет синус, косинус, тангенс и другие стандартные тригонометрические функции от числа.

Ln(число). Возвращает логарифм числа по основанию e.

log(число). Возвращает логарифм числа по основанию 10.

!. Возвращает факториал числа. Например, 5!.

In. Преобразует число в одной системе в другую систему.

Например, 5 kilometers in miles или даже 160 лошадиных сил * минуту в калориях. Калькулятор понимает множество систем счисления, причем, он может понимать как полные формы названия системы, так и сокращенные. Например, он способен понимать следующие системы: kilometer, kilometers, km, mph, GW, miles, degrees, kg, in roman numerals.

При использовании функций калькулятора число можно указывать как в десятичной системе счисления, так и в других системах. По умолчанию число считается десятичным, однако можно самостоятельно добавить к числу один из префиксов, определяющих его систему счисления:

0x (шестнадцатеричная система счисления),

0o (восьмеричная система счисления),

0b (двоичная система счисления).

Например, калькулятор способен вычислять подобные выражения: 0x7f + 0b10010101.
Конвертер валют

В поисковую систему Google встроен и конвертер валют, позволяющий автоматически выполнять их конвертацию. Для этого достаточно воспользоваться запросом, подобным следующим:



3.5 USD в RUB по курсу ЦБ;

российская валюта в украинских деньгах;

5 российских рублей в валюте Великобритании;

5 фунтов стерлингов в рублях по курсу ЦБ;

3.2 доллара/галлон в рублях/литр.
Поиск специальных номеров

Поисковый механизм Google позволяет выполнять поиск по специальным номерам, относящимся к различным гражданским системам, организациям и услугам. Так, с ее помощью можно выполнить поиск следующих номеров.



  • номера отслеживания UPS. Для этого нужно воспользоваться запросом вида 1Z9999W99999999999.

  • номера отслеживания FEDEX. Для этого нужно воспользоваться запросом вида 999999999999.

  • номера отслеживания USPS. Для этого нужно воспользоваться запросом вида 9999 9999 9999 9999 9999 99.

  • идентификационные номера транспортных средств (VIN). Для этого нужно воспользоваться запросом вида AAAAA999A9AA99999.

  • коды UPC. Для этого нужно воспользоваться запросом вида 073333531084.

  • номера патентов. Для этого нужно воспользоваться запросом вида («patent 5123123»).


Поисковые команды

Помимо обычного поиска в содержимом страниц, с помощью данной поисковой системы можно выполнять специальный поиск. Для этого предназначены специальные команды, которые тем или иным образом ограничивают круг результатов поиска.

Эти команды имеют следующий формат: команда:искомое_слово.

Как правило, команды используются совместно с самой искомой строкой. То есть, сначала вводите слово, которое нужно искать, а потом уже команду, ограничивающую результаты поиска.

Поисковая система Google поддерживает следующие команды.

define: фраза Выполнить поиск определения слова (страницы, которые, как предполагает поисковая система, содержат определение данного слова, будут отображаться первыми в результатах).

allintext: слова_через_пробел Отобразить только те страницы, в содержимом которых встречаются указанные слова (поиск в заголовке страницы и ссылках, которые расположены на странице, вестись не будет).

intext: слово Отобразить только те страницы, в содержимом которых встречается указанное слово (поиск данного слова в заголовке страницы и ссылках, которые расположены на странице, вестись не будет). При использовании данной команды указывается только одно искомое слово — на остальные указанные слова действие команды распространяться не будет.

Например, при запросе intext:style one design поисковая система отобразит перед все страницы, в содержимом которых встречается слово style, а также в заголовке, содержимом или в гиперссылках которой встречаются слова one и design.



site: адрес_сайта Данная команда говорит поисковой системе о том, что введенную вами фразу нужно искать только на страницах, принадлежащих указанному в команде сайту.

Например, запрос поисковые системы site:www.onestyle.com.ua отобразит все страницы сайта www.onestyle.com.ua, на которых встречается фраза поисковые системы.

Помимо адреса сайта в данной команде можно указывать только домен.

Например, site:com.



allintitle: слова_через_пробел С помощью данной команды выполняется поиск сайтов, в заголовке которых встречаются указанные в команде слова.

Например, по запросу allintitle:дизайн программирование будут найдены все страницы, в заголовке которых присутствуют слова дизайн и программирование.



intitle: слово С помощью данной команды выполняется поиск сайтов, в заголовке которых встречается указанное в команде слово. От команды allintitle: данная команда отличается тем, что вместе с ней можно указывать слово или фразу, поиск которой будет выполняться в содержимом документа.

Например, по запросу alltitle:дизайн программирование будут найдены все страницы, в заголовке которых присутствует слово дизайн, а в содержимом — слово программирование.



allinURL: слова_через_пробел С помощью данной команды выполняется поиск сайтов, адреса которых содержат в себе указанные слова. Например, команда allinURL:one style отобразит все сайты, в адресе которых встречаются слова one и style.

inURL: слово С помощью данной команды выполняется поиск сайтов, адреса которых содержат в себе указанное слово. Вместе с данной командой можно указывать и слова для поиска в содержимом документа.

Например, команда inURL:one style отобразит все страницы, в адресе которых встречается слово one, а в содержимом — слово style.



cache: адрес_страницы При использовании данной команды будет отображена указанная вами страница, хранящаяся в кэше поисковой системы Google. Над отображенной перед вами страницей будет указана последняя дата ее индексации.

Данную команду можно использовать в том случае, если вы хотите получить доступ к документу, который уже был удален с сайта, однако который остался в базе данных Google (был проиндексирован).

Например, команда cache:www.onestyle.com.ua дизайн отобразит перед вами страницу www.onestyle.com.ua и выделит на ней все слова дизайн.

allinlinks: слова_через_пробел Отобразить только те страницы, в именах которых встречаются указанные слова.

link: адрес_страницы Отображает все страницы, на которых встречается ссылка на сайт с указанным адресом.

related: адрес_страницы Отображает все страницы, которые похожи на указанную вами страницу (то есть, содержат такой же или похожий текст).

info: адрес_сайта Данная команда может использоваться как заменитель команд related:, cache:, link:. Она отображает ссылку на указанную вами страницу, под которой будут находиться ссылки, с помощью которых можно выполнить следующие действия:


  • показать сохраненную в Google версию;

  • найти похожие страницы;

  • найти страницы, ссылающиеся на данную;

  • найти страницы на данном сайте;

  • найти страницы, упоминающие данную.

filetype: рисширение В качестве результатов поиска отображать только файлы с заданным расширением. Поисковая система Google индексирует файлы со следующими расширениями:

веб-странички (HTM и HTML);

Adobe Portable Document Format (PDF);

Adobe PostScript (PS);

Lotus 1-2-3 (WK1, WK2, WK3, WK4, WK5, WKI, WKS, WKU);

Lotus WordPro (LWP);

MacWrite (MW);

Microsoft Excel (XLS);

Microsoft Word (DOC);

Microsoft PowerPoint (PPT);

Microsoft Works (WKS, WPS, WDB);

Microsoft Write (WRI);

Rich Text Format (RTF);

Shockwave Flash (SWF);

Text (ANS, TXT).

Например, команда filetype:doc inurl:www.microsoft.com Vista отобразит список всех файлов с расширением DOC, найденных на сайте www.microsoft.com, и содержащих в себе слово Vista.

Обратите внимание на ссылку В ВИДЕ HTML, отображаемую напротив некоторых результатов поиска в поисковой системе Google. C ее помощью можно будет просмотреть содержимое найденного файла в виде HTML-страницы
Результаты поиска

Если искали по каким-то популярным фразам, тогда, скорее всего, количество результатов будет достигать миллиона. Весь миллион результатов поиска просмотреть нельзя, т.к. разработчики Google ввели ограничение, по которому пользователи могут просматривать только первую тысячу результатов поиска.



Предупреждение безопасности

При открытии некоторых страниц из результатов поиска может отобразиться сообщение о том, что данные страницы представляют угрозу для вашего компьютера. Это сообщение появляется при попытке открытия страницы сайта, который был определен поисковой системой как сайт, содержащий в себе вредоносный код. Поэтому следует внимательно относиться к таким предупреждениям.



Проверка орфографии

Поисковая система Google автоматически проверяет орфографию во фразе, которую ищете. Проявляется это в результатах поиска. Так, если неправильно ввели какое-либо слово для поиска, тогда над результатами поиска отобразится ссылка Возможно, вы имели в виду: правильный_запрос. Нажав эту ссылку, вы сможете выполнить поиск по скорректированному запросу.



Элементы поиска на главной странице

  • Кнопка Мне повезет!. ведет на первую страницу из результатов, которые Google найдет по указанному запросу.

  • Ссылка Языковые инструменты. - перевод нужной вас страницы на один из множества языков, а также перейти на главную страницу поисковой системы, созданную специально для конкретной страны, либо созданную под определенный стиль (например, специально для хакеров).

  • Ссылка Настройки. - определить языки, на которых написаны страницы, отображаемые в результатах поиска; определить количество результатов, отображаемых на одной странице (но не больше 100); определять, будет ли при отображении результатов отображаться ссылка Возможно, вы имели в виду: правильный_запрос и т.д. Также с помощью данной ссылки можно установить режим безопасного поиска. При использовании данного режима из результатов поиска будут исключаться все страницы, содержащие порнографию и материалы явно выраженного сексуального характера.

  • Ссылка Расширенный поиск. - определить язык, регион, домен, формат искомых файлов, дату изменения и т.д. То есть, при помощи данной ссылки можно активировать использование по умолчанию основных команд поисковой системы Google.


Программа Google Desktop

На вкладке Поиск Google desktop окна настройки программы можно определить адреса сайтов, на которых поиск выполняться не будет.

А на вкладке Другие окна настройки программы присутствует флажок Включить безопасный просмотр. С помощью данного флажка можно установить режим, при котором программа будет вам сообщать, если просматриваемый сайт является мошенническим или небезопасным для компьютера.

ICQ бот 56544550

Выполнять поиск в Google можно при помощи ICQ бота с номером 56544550 Для этого достаточно отправить данному боту команду Google поисковый_запрос.



ПС Яндекс


1990 г в компании CompTek начала создание поисковой технологии Яндекс.

Назначение – поиск по массивам русских текстов, т.е. с учетом морфологии русского языка. Слово «Яндекс» и первые программы с этим названием появились еще в 1993 г, а поисковая машина Яндекс (www.yandex.ru) была открыта 23 сентября 1997 года на выставке SofТool.



Возможности поисковой системы Яндекс

Поиск слова

Система позволяет находить:



  • все формы слова для русского, английского, польского и других языков; в том числе все формы неизвестных Яндексу слов (отсутствующих в базовом словаре языка) при помощи автоматического моделирования их словоизменения;

  • только заданную точную словоформу;

  • только формы, производные от заданной формы.

Расстояние между словами

Если же нужно еще больше расширить область поиска и выполнить поиск страниц, в которых введенные вами слова встречаются в пределах всей страницы, тогда следует поставить между словами искомой фразы символы &&.

Вместо оператора && можно воспользоваться оператором << Данный оператор также расширяет область поиска, и выполняет поиск страниц, в которых введенные вами слова встречаются в пределах всей страницы. Однако при этом слово, которое находится справа от оператора <<, не будет влиять на ранжирование страниц результатов запроса.

Можно точно определить максимальное количество предложений, которые могут отделять одно искомое слово от другого. Для этого между словами запроса нужно поставить структуру вида &&/максимальное_количество_слов.



Пример, по запросу культура &&/2 Россия отобразятся все страницы, в которых слово Россия отделяется от слова культура не более чем двумя предложениями.

Яндекс позволяет искать страницы, в которых введенные слова встречаются в одном предложении. Для этого достаточно поставить между словами искомой фразы символы &.



Пример, по запросу культура & Россия отобразятся все страницы, содержащие в одном предложении и слово культура и слово Россия.

Более того, вы можете точно определить максимальное количество слов, которые могут отделять одно искомое слово от другого. Для этого между словами вашего запроса нужно поставить оператор /максимальное_количество_слов.



Пример, по запросу культура /2 Россия отобразятся все страницы, в которых слово Россия отделяется от слова культура не более чем одним словом.

Усложняя задачу можно прийти к еще одному виду операторов поисковой системы Яндекс: /(минимальное_количество_слов максимальное_количество_слов). С помощью такого оператора выполняется поиск фраз, в которых между словами может находиться не более определенного количество слов и не менее другого такого же определенного количества слов.



Пример, запрос космическая /(2 3) станция найдет страницы, на которых могут присутствовать фразы вида космическая орбитальная станция, космическая российская орбитальная станция, но при этом не будут найдены страницы, на которых находятся фразы вида космическая станция.

Если же вы хотите выполнить поиск по жесткой фразе (то есть, найти страницы, содержащие точную фразу, которая совпадает с введенной вами), тогда следует взять искомую фразу в кавычки. Пример, «красная шапочка».


Порядок слов

Если для запроса важен порядок расположения слов искомой фразы, тогда при его создании следует воспользоваться несколькими дополнительными возможностями поисковой системы Яндекс.

Чтобы найти слова, которые идут в определенном порядке, достаточно поставить между ними знак + (в прямом порядке) или (в обратном порядке).

Пример, при запросе Иван + Тургенев будут найдены все страницы, содержащие в себе фразы вида Иван Тургенев и ни одной страницы, содержащей в себе фразы вида Тургенев Иван.

Особенность Яндекса – возможность объединения операторов изменения расстояния между словами и операторов изменения порядка слов. Для этого достаточно поставить оператор порядка слов после знака / операторов изменения расстояния между словами.



Пример, усложним предыдущий запрос: Иван /+2 Тургенев. С его помощью будут найдены все страницы, в которых между словом Иван и словом Тургенев находится одно слово. Причем, слово Иван всегда должно стоять перед словом Тургенев.

Еще один запрос: Васисуалий /(-1 +2) Лоханкин. Данный запрос отобразит только те страницы, которые содержат в себе одну из фраз следующего вида:



Лоханкин Васисуалий;

Васисуалий Лоханкин;

Васисуалий слово Лоханкин.
Логические операторы

Яндекс способна обрабатывать логические операторы типа ИЛИ и НЕ.

Так, для того, что выполнить поиск ИЛИ слова1 ИЛИ слова2, нужно поставить между искомыми словами знак |.

Пример, по поисковому запросу отпуск Лондон | Париж будут отображены все страницы, в которых встречаются слова отпуск Лондон или отпуск Париж.

Если же нужно найти все страницы, на которых нет определенного слова, тогда следует перед этим словом поставить оператор ~~.



Пример, запрос компьютерный журнал ~~CHIP отобразит все страницы, на которых встречаются слова компьютерный и журнал, но нет слова CHIP.

Кроме того, поисковая система Яндекс поддерживает еще одну разновидность логического оператора НЕ. Вы можете выполнить поиск страниц, в которых определенного слова нет в том же предложении, что и других слов запроса, однако оно может встречаться в других предложениях страницы. Для этого предназначен оператор ~.


Настройка морфологии

По умолчанию поиск всех слов, которые вы указываете, выполняется с учетом морфологии. Если же необходимо выполнить поиск без использования морфологии, тогда следует поставить перед искомым словом символ !



Пример, поиск по фразе !день отобразит все страницы, на которых присутствует слово день. Такие же страницы, на которых встречаются слова дня, дней, дни (а также деть, денешь и т.д., ведь слово день является и одной из форм слова деть) в результаты поиска не попадут.

Одной из проблем поиска с учетом морфологии является то, что формы некоторых слов могут совпадать.



Пример, форма день слова день и форма день слова деть. Чтобы решить эту проблему, достаточно указать поиск по слову в нормальной форме. Для этого достаточно поставить перед словом, расположенным в нормальной форме, оператор !!.

Пример, запрос !!день найдет все формы данного слова (дня, дню, днем и т.д.), и не найдет форм слова деть.
Зависимости между фразами

Можно устанавливать зависимости между целыми фразами либо даже между зависимостями слов (зависимости зависимостей, в общем, это что-то страшное) — взять отдельную фразу в круглые скобки.



Пример запрос:

мумие && (лечение | лечебный | болезни)~~(цена | прайс | рубли | доллар | фирма | магазин).

По данному запросу будут найдены все страницы, на которых присутствует слово мумие, а также одно из слов, символизирующих его лечебные качества. При этом, на страницах не должно быть слов, связанных с покупкой этого предмета.



Изменение правил релевантности

Чтобы изменить вес отдельного слова, нужно поставить после него оператор: вес.



Пример,

Запрос поисковые механизмы:5 говорит о том, что на результирующих страницах более важно слово механизмы, а не слово поисковые.

Яндекс позволяет определить уровень нестрогого поиска (коэффициент «мягкости»).

То есть, можно определить, будут ли в результаты поиска включаться страницы, которые содержат не все из тех слов, которые вы указали в запросе (пассажи).

Для этого предназначены запросы вида (слова через пробел)//число_от_1_до_100.

По умолчанию поиск ведется с коэффициентом мягкости, равным 6.

При коэффициенте мягкости, равном 50, число найденных документов должно быть примерно средним геометрическим чисел найденных документов при поиске всех возможных неполных пассажей.
Команды поиска

Как и Google, помимо обычных запросов Яндекс может обрабатывать и специальные — сформированные при помощи специальных команд.

$title (искомые слова) Искать указанные слова только в заголовке страниц.

Пример, взгляните на такой сложный запрос: Максвелл << $title (биография).

$anchor (искомые слова) Искать указанные слова только в именах страниц.



Пример, запрос $anchor (one style) отобразит только те страницы, в имени которых встречаются слова one и style.

#keywords=(искомые слова) Искать указанные слова только в ключевых словах страниц (то есть, внутри тега страницы).

#abstract=(искомые слова) Искать указанные слова только в описании страниц (то есть, внутри тега страницы).

#image="название" Искать только изображения, имеющие указанное название.

#hint=(искомые слова) Искать только изображения, в подписях к которым встречаются указанные слова.

#url="имя сайта" Выполнить поиск только на данном сайте.



Пример, запрос поисковые системы #url="www.onestyle.com.ua" отобразит все страницы сайта WWW.ONESTYLE.COM.UA, на которых встречается фраза поисковые системы.

host="имя сайта" Выполнить поиск только на данном сайте, а также на всех его зеркалах.

Помимо оператора host можно использовать оператор rhost. Данный оператор аналогичен оператору host во всем, кроме записи имени сайта — имя сайта при его использовании записывается в обратном порядке (то есть, в порядке ru.url.www).

Пример, rhost="ru.yandex.*".

#link="имя сайта" Выполнить поиск ссылок на указанный сайт.

#mime="тип файла" В качестве результатов поиска отображать только файлы с заданным расширением.

Пример, команда Vista #mime="doc"отобразит список всех файлов с расширением DOC, содержащих в себе слово Vista. При поиске страниц с несколькими расширениями правильнее было бы использовать запрос следующего вида: (инструкция && микроволновая печь) << (mime="pdf" | mime="rtf"). То есть, запретить ранжирование страниц результата запроса по расширениям.

Поисковая система Яндекс индексирует содержимое файлов со следующими расширениями: HTML, PDF (Adobe Portable Document Format), DOC (Microsoft Word), PPT (Microsoft PowerPoint), XLS (Microsoft Excel), RTF (Rich Text Format), SWF (Macromedia Flash).

lang="язык" Выполнить поиск только среди страниц, написанных на указанном языке.

Пример, вы можете искать на страницах со следующими языками: ru (русском), uk (украинском), be (белорусском), en (английском), fr (французском), de (немецком).

like="имя страницы" Выполнить поиск на страницах, похожих на указанную страницу.

domain="домен" Выполнить поиск на страницах, которые принадлежат данному домену.

Пример, Vista domain="ru".

date="ГГГГММДД" Выполнить поиск на страницах, дата изменения которых удовлетворяет заданной вами дате. Помимо конкретного дня, года или месяца можно указывать знак *. В этом случае день, год или месяц учитываться не будут.

Вместо знака = в данной команде можно использовать следующие знаки: >, <, >=, <=.

cat=(ID региона или темы) Выполнить поиск только среди страниц, зарегистрированных в Яндекс.Каталоге, тематическая рубрика или регион которых совпадают с указанными вами.

Идентификатор региона можно получить, прибавив к коду региона смещение 11000000. Идентификатор тематической рубрики получается прибавлением к коду темы смещения 9000000.

Пример, зяблик << cat=(11000051).
Настройка поиска

Вместо использования специальных команд поиска, можно воспользоваться специальными формами для настройки и формирования запроса поиска:

страница РАСШИРЕННЫЙ ПОИСК (http://www.yandex.ru/advanced.html)

НАСТРОЙКА РЕЗУЛЬТАТОВ ПОИСКА (http://www.yandex.ru/cgi-bin/customize.pl)


Расширенный поиск

С помощью данной страницы можно определить следующие параметры поиска:



  • область поиска (везде либо только в заголовке страницы);

  • будет ли использоваться механизм проверки морфологии (или будет выполнен поиск слова/фразы только в той форме, которую вы ввели);

  • как будет интерпретироваться расположение искомых слов друг от друга (слова идут подряд; должны встречаться в одном предложении; должны находиться недалеко друг от друга; должны находиться на одной странице);

  • на каких языках должны быть написаны страницы, отображаемые в результатах поиска;

  • какая дата изменения страниц, отображаемых в результатах поиска;

  • определить страницу, на которую должны быть похожи файлы, отображаемые в результатах поиска;

  • определить страну, в которой должны находиться сайты, страницы которых будут отображаться в результатах поиска;

  • определить сайт, страницы которого будут отображаться в результатах поиска;

  • файлы каких типов должны отображаться в качестве результатов поиска;

  • максимальное количество результатов, отображаемых на одной странице (но не больше 50).


Поиск нескольких слов

Поиск нескольких слов может происходить при:



  • задании произвольных «контекстных ограничений» — нужно искать документы, в которых заданные слова находятся на определенном расстоянии друг от друга либо на расстоянии, не большем или не меньшем данного. Расстояние может быть задано в словах или в предложениях. Интервал расстояний может быть отрицательным, точным, асимметричным (например, 5 слов вперед, 3 слова назад). Контекстные ограничения могут быть либо заданы пользователем явно (что крайне редко встречается на практике), либо могут быть автоматически назначены Яндексом на основе синтаксического разбора;

  • гарантированном ранжировании устойчивых словосочетаний (точных цитат). При наличии в базе точной цитаты документы, содержащие ее, будут гарантированно выданы в начале списка;

  • ранжировании, основанном на принципе «поиска неточной цитаты». Точно найденным документом считается документ с полным набором слов в заданных контекстных границах. Он гарантированно ранжируется выше документов с неполным набором таких слов. При отсутствии в базе индекса точного соответствия запросу с учетом заданных контекстных ограничений предпринимаются попытки найти максимально похожее словосочетание с возможным пропуском одного самого незначащего слова, затем, если это не удается, допускается пропуск двух слов или одного, но более значимого и т.д.;

  • автоматическом синтаксическом разборе «естественных» фрагментов поискового запроса с целью переформулирования и смены (смягчения или расширения) неявно заданных контекстных ограничений. Это значит, что если задан запрос из трех и более слов, то он будет проанализирован и при удачном построении синтаксического дерева переформулирован в такой же, но с контекстными ограничениями, назначенными Яндексом на основе синтаксических связей. Иными словами, Яндекс вместо того, чтобы рассматривать слова запроса (не образующего в текстах точной цитаты и не встречающегося в пределах одного предложения) как независимые и искать в документе их где угодно, пытается одни слова искать рядом, а другие «не очень рядом».

Пример.

Для Яндекса запрос «продажа автомобилей Россия» отличается от запроса «продажа автомобили России».

В первом запросе точно найденным документом будет считаться тот, в котором слова «продажа» и «автомобиль» находятся рядом (скажем, в одном предложении), а слово «Россия» — далеко (где угодно в документе).

Во втором запросе точно найденным документом будет считаться только такой, в котором слова «автомобиль» и «Россия» находятся достаточно близко. Яндекс решает так потому, что фраза «автомобили России» синтаксически согласована.

Таким образом, с точки зрения Яндекса первый запрос нацелен на поиск российсских автомобильных дилеров, а второй — на поиск любых продавцов «Лады»;


  • эвристических переформулировках естественных запросов. Запросы, использующие вопросительные слова и ряд других типичных конструкций, переформулируются. Например, запрос <что такое кванзаа> превратится в запрос <кванзаа это> ИЛИ <кванзаа означает> ИЛИ ...;

Все вышеперечисленные особенности позволяют Яндексу с приемлемым качеством выполнять разнообразные запросы на естественном русском языке, даже с учетом «рваного», телеграфного стиля общения пользователей с поисковой системой.

Поиск в социальной сети

Под поиском в социальной сети понимается учет внетекстовых критериев в поиске, ранжировании и индексировании:



  • взвешенный, тематический и иные виды индекса цитирования;

  • поиск по лексике ссылок на документ, в том числе по альтернативной лексике (словам, не употребляющимся в самом документе). Например, по слову «яндех» будет найден www.yandex.ru, хотя на сайте Яндекс слово «яндех» не употребляется. Этот метод применялся в Яндексе еще в 1990-1991 годах для патентных поисковых систем;

  • выявление и удаление из базы точных и неточных дубликатов;

  • выявление и удаление зеркал сайтов;

  • учет в ранжировании выбора пользователей после проведенного поиска;

  • многоязыковая поддержка (возможность автоматически распознавать язык и кодировку индексируемого документа).

Дополнительные поисковые возможности

К таким возможностям относятся следующие:



  • поиск похожего документа;

  • сортировка найденных документов по степени релевантности, а также по дате или по размеру, возможность влиять на порядок сортировки, используя операторы веса и уточнения запроса;

  • сортировка по любому внешнему целочисленному атрибуту (например, цена товара в Яндекс.Маркете и т.п.);

  • подсветка найденных слов в документе (возможность просмотреть найденный документ с выделенными ключевыми словами; пролистать документ к следующему или предыдущему найденному слову. Статистика найденных слов для каждого документа);

  • подсветка контекстов (возможность выделять слова, найденные в заголовках, на странице с результатами поиска; показывать отдельные предложения документа, содержащие найденные слова, на странице с результатами поиска);

  • поиск в любых поименованных частях текста документа (зонах). Например, можно искать в заголовках, текстах ссылок и т.д.;

  • поиск по «скрытым» свойствам документа (атрибутам). Возможность учитывать при поиске как атрибуты целого документа, заданные при индексировании, так и атрибуты отдельных частей документа. Например, можно искать документы с заданными ключевыми словами, в заданном каталоге или содержащие заданную картинку;

поиск в найденных документах (возможность искать документы, удовлетворяющие новому запросу, среди документов, полученных в результате предыдущего запроса).

Настройка результатов поиска

С помощью данной страницы можно настроить формат отображения результатов поиска (количество результатов на странице, будут ли отображаться пиктограммы сайтов и картинки, будет ли поисковая форма отображаться внизу страницы и т.д.), а также определить язык, на котором будет выполняться поиск страниц.

Также с помощью данной страницы можно включить использование семейного фильтра (из результатов поиска будут исключаться все страницы, содержащие порнографию и материалы явно выраженного сексуального характера).
Проекты Яндекса

Помимо поиска в Интернет портал Яндекс поддерживает работу ряда других проектов.

ЯНДЕКС.WIFI. Список бесплатных точек беспроводного доступа, поддерживаемых Яндекс.

РЕФЕРАТЫ (http://referats.yandex.ru/). - занимательный проект, который позволяет самостоятельно создать реферат по одной из предопределенных дисциплин путем нажатия всего нескольких кнопок.

КУБКИ. Турниры по поиску в Интернете, изобретенные Яндексом.

ЯНДЕКС.ДИРЕКТ (http://direct.yandex.ru/). Размещение рекламы в результатах поиска.

ЯНДЕКС.ПОЧТА (http://mail.yandex.ru/).

ЯНДЕКС.ДЕНЬГИ (http://money.yandex.ru/). Одна из лучших на Российской территории платежных систем

НАРОД.РУ (http://narod.yandex.ru/). Данный проект предоставляет бесплатный хостинг, объем дискового пространства, которое можно использовать, неограничен.

МОЙ КРУГ (http://www.moikrug.ru/). Данный проект предназначен для поиска одноклассников, коллег и знакомых.

ЗАКЛАДКИ (http://zakladki.yandex.ru/). Позволяет создавать закладки на любимые страницы Интернет. При этом созданные закладки будут автоматически периодически проверяться на работоспособность. Еще одной особенностью данного проекта является его интеграция с программой Яндекс.Бар, благодаря чему доступ к закладкам будет возможен из данной панели инструментов.

ЯНДЕКС.ЛЕНТА (http://lenta.yandex.ru/). Позволяет объединять RSS-потоки в одну ленту и читать их в виде одной единственной страницы (вместо того, чтобы постоянно заходить на разные сайты).

ФОТКИ (http://fotki.yandex.ru/). Позволяет публиковать свои фотографии, участвовать в конкурсах, а также смотреть, комментировать и выбирать лучшие среди фотографий других пользователей.

НАХОДКИ (http://nahodki.yandex.ru/). Позволяет быстро сохранять поисковые запросы и просмотренные результаты.

ГОРОДА (http://goroda.yandex.ru/). Формирует Интернет-индексы городов (на основе сотрудничества этих городов с команией Яндекс).

НОВОСТИ (http://news.yandex.ru/podpiska/login.pl). Отображает местные новости (ваше местоположение определяется по IP-адресу), а также позволяет подписаться на свежие новости.

МАРКЕТ. Ряд магазинов для онлайн-покупок.

Программы Также поисковая система Яндекс предоставляет ряд созданных ею продуктов, которые непосредственно касаются темы, рассматриваемой нами в книге.

YANDEX.SERVER (http://company.yandex.ru/technology/products/yandex-server.xml) Приложение для поиска по веб-сайту или локальной сети с учетом морфологии русского языка.

ПЕРСОНАЛЬНЫЙ ПОИСК (http://desktop.yandex.ru/). Программа, предназначенная для полнотекстового поиска с учётом морфологии русского языка в файлах локального компьютера (по файлам, письмам и кешам браузеров).

ЯНДЕКС.БАР. Панель инструментов для различных браузеров, с помощью которой можно быстро получить доступ к основным сервисам поисковой системы Яндекс.

ЯНДЕКС.CПАМООБОРОНА (http://so.yandex.ru/). Серверное приложение для фильтрации спама, предназначенное для корпоративных пользователей. Загрузить пробную версию данного приложения можно по адресу http://so.yandex.ru/companies/download.xml#new.


ПС Рамблер


Дата создания: сентябрь 1996 года.

Адрес: HTTP://WWW.RAMBLER.RU (главная страница),

HTTP://WWW.R0.RU/ (только форма для поиска),

HTTP://PDA.RAMBLER.RU/INDEX.JSPX

(главная страница для карманных компьютеров).

Поисковая система создана фирмой СТЕК для реализации поиска по русскоязычным сайтам, находящимся в домене .ru, а также в доменах некоторых из стран СНГ.



Особенность – индексирует только содержимое страниц, находящихся в доменах .ru, .su, .ua, .by, .kz, .kg, .uz, .ge (индексирует только содержимое русскоязычных страниц, игнорируя страницы с других доменов).

Не индексируется содержимое комментариев, тегов , текстовую информацию из флеш-объектов.



Правила поиска в Рамблер

  • Может обрабатывать знаки препинания

  • Игнорирует стоп-слова (незначащие слова, например, предлоги, частицы и артикли)

  • Для поиска с учетом какого-либо незначащего слова выполняется контекстный поиск (поисковую фразу заключить в двойные кавычки).

  • Поиск с учетом морфологии только для русского и английского языка.

  • Расстояние между словами. По умолчанию Рамблер игнорирует регистр слов поискового запроса. Но, если поисковый запрос состоит из 2-4 слов, каждое из которых написано с прописной буквы, тогда для такого поискового запроса автоматически изменяется максимально возможное расстояние между словами запроса (это расстояние становится равным (n-1)*2, где n – количество слов в запросе), т.е. такой запрос позволяет найти страницы, на которых между словами запроса находится не более одного лишнего слова. В остальных случаях поисковая система ищет страницы, в которых между словами запроса находится не более 40 слов. Чтобы изменить это правило, достаточно воспользоваться запросом вида (число, запрос), где число определяет максимальное количество лишних слов, которые могут находиться между словами запроса.

  • Логические операторы ПС Рамблер способна обрабатывать три основных логических оператора: И, ИЛИ и НЕ. Поиск сразу всех слов (логическое И) выполняется при помощи оператора AND (&), который нужно поместить между словами. Например, по запросу собака AND кошка найдутся только те документы, которые содержат и слово собака, и слово кошка. Оператор AND используется поисковой системой по умолчанию, поэтому его можно не указывать. Поиск одного из нескольких слов (ИЛИ) выполняется при помощи оператора OR (либо оператора |), который также нужно поместить между словами. Например, по запросу собака OR кошка найдутся все документы, в которых встречается либо слово собака, либо слово кошка. Поиск документов, которые не содержат определенное слово (логическое НЕ), выполняется при помощи оператора NOT (~). Его нужно поместить перед словом, которое не должно присутствовать в документе. Операторы AND и NOT имеют более высокий приоритет, чем оператор OR, поэтому при обработке запроса, сначала выполняется группировка по операторам AND и NOT, и лишь потом по операторам OR. Изменить порядок группировки можно при помощи круглых скобок.

Команды поиска

Помимо обычных запросов Рамблер поддерживает возможность использования команды ${counter=ID}

С помощью команды данного вида можно выполнить поиск страниц в одном из рейтингов Рамблер. Рейтинг определяет словом counter, вместо которого можно использовать слова: top100, toplist, spylog или hotlog. Раздел же рейтинга определяется ID, которая представляет собой номер раздела.

Например, для поиска в разделе открыток рейтинга top100 используется оператор ${top100=193680}.



Результаты поиска

В качестве результатов поиска Рамблер отображает одну строку содержимого найденной страницы, которое удовлетворяет введенному вами поисковому запросу. Рядом с этим содержимым также отображается несколько ссылок, с помощью которых можно выполнить дополнительные действия.



ВОССТАНОВИТЬ ТЕКСТ. Отображает страницу, хранящуюся в кэше ПС Google.

ВСЕГО. Отображает все страницы данного сайта, удовлетворяющие вашему запросу. В частности, данную ссылку можно использовать для поиска правильной страницы сайта, если она содержит в себе фреймы и текущая ссылка на страницу отображает только один из фреймов страницы.

По умолчанию результаты поиска выдаются в порядке соответствия запросу. На странице результатов поиска, можно выбрать и другой порядок поиска (по релевантности отдельных страниц или по дате).



Расширенный поиск При помощи страницы расширенного поиска (HTTP://WWW.RAMBLER.RU/CGI-BIN/ADVANCED.CGI?SET=WWW) можно выполнить поиск с применением следующих возможностей.

  • Определить область поиска: в содержимом страницы, в названии страницы или в ссылках страницы.

  • Определить отношения слов поисковой фразы: поиск всех слов (логическое И), поиск хотя бы одного слова (логическое ИЛИ), либо поиск точной фразы.

  • Определить, будет ли ограничиваться расстояние между словами.

  • Указать слова, которые не должны встречаться на найденных страницах.

  • Определить язык документа (русский, английский или украинский).

  • Определить формат документов, внутри которых можно выполнять поиск (HTML-страницы, DOC-файлы, PDF-файлы).

  • Определить дату модификации документов.

  • Определить сайт, на страницах которого нужно выполнить поиск.

ПС Апорт


Адрес: HTTP://WWW.APORT.RU (главная страница),

HTTP://WWW.AU.RU/ (только форма поиска без рекламы),

HTTP://PDA.APORT.RU/ (версия для карманных компьютеров),

HTTP://WWW.APORT.RU/WAP (версия для мобильных телефонов).

Поисковая система Апорт – проект фирмы Агама при поддержке российского отделения Intel; предназначена для поиска в Российской части Интернета, а также на русскоязычных серверах СНГ.

Правила поиска

Апорт позволяет выполнять поиск слов с учетом морфологии, игнорируя при этом различные незначащие слова (отменить игнорирование стоп-слов можно при помощи контекстного поиска).



Логические операторы Апорт поддерживает те же логические операторы, что и поисковая система Рамблер.

Поиск сразу всех слов – оператор AND (&).Например, собака AND кошка.

Поиск одного из нескольких слов – оператор OR ( | ) Например, собака OR кошка.

Поиск документов, которые не содержат определенное слово– оператор NOT (~)



Команды поиска

Помимо обычных запросов поисковая система Апорт поддерживает возможность использования команд.

text (<искомые слова>). Искать указанные слова только в содержимом страниц.

title (<искомые слова>). Искать указанные слова только в заголовке страниц.

keywords (<искомые слова>). Искать указанные слова только в теге страницы.

description (<искомые слова>). Искать указанные слова только в теге страницы.

alt (<искомые слова>). Искать указанные слова в комментариях к картинкам.

anchor (<искомые слова>). Искать указанные слова в тексте ссылок на страницах.

url=<имя сайта>. Выполнить поиск только на данном сайте.

СЛN (искомые слова). Выполнить поиск всех страниц, на которых искомые слова расположены в пределах N слов друг от друга. Например, при помощи запроса СЛ23 (дизайн программирование структурирование) выполняется поиск всех страниц, на которых искомые слова встречаются на расстоянии не более 23 лишних слов друг от друга.

Вместо команды СЛN (искомые слова) можно использоваться ее аналоги СN (искомые слова), WN (искомые слова) или [N, искомые слова].

ПС Nigma


Дата создания: 12 апреля 2005 год.

Адрес: HTTP://WWW.NIGMA.RU/ (главная страница),

HTTP://WWW.NIGMA.RU/INDEX.PHP?VIEW=LITE

(только форма поиска).

ПС Nigma позволяет выполнять поиск сразу по нескольким поисковым системам: Google, Yahoo, Msn, Яндекс, Рамблер, AltaVista, Aport, Nigma (есть свой собственный индекс страниц Интернета). По умолчанию поиск ведется во всех перечисленных поисковых системах, а результаты такого поиска объединятся между собой.

Правила поиска

Правила поиска в данной ПС являются самыми примитивными из всех, рассмотренных ранее.



Оператор AND – выполняется поиск страниц, которые содержат в себе все слова запроса, объединенные оператором AND ( +); можно вообще не использовать операторы, так как по умолчанию пробел между искомыми словами – аналог оператора AND.

Оператор OR – поиск страниц, которые содержат одно из двух слов (между которыми этот оператор находится).

Оператор (–) – позволяет исключить из результатов поиска страницы, в которых есть слово, перед которым в поисковом запросе установлен данный оператор (т.е.. аналог оператора NOT).

Оператор site:<имя сайта>- позволяет отобразить лишь страницы, которые принадлежат указанному сайту.

Метапоисковые системы


Метапоисковые системы – это службы, позволяющие транслировать запрос сразу в несколько поисковых систем.

Однако пользоваться ими во всех случаях не следует. Если документов по теме много, то метапоиск не нужен и, возможно, даже вреден, поскольку смешивает разные логики ранжирования. Но если документов по теме мало, то метапоиск может быть полезен именно благодаря тому, что объединяет большое число поисковиков.

Удобной является отечественная метапоисковая система «ДИСКо Искатель

Разработчик: фирма «ДИСКо» (www.disco.ru), права на распространение продукта принадлежат компании «Арсеналъ» (www.ars.ru).

ДИСКо Искатель — это инструмент для поиска информации на нескольких поисковых серверах одновременно. Главной особенностью этой программы является возможность запоминать параметры поиска и его результаты и использовать их впоследствии.

Двойным щелчком на любую ссылку можно вызвать браузер для просмотра этой страницы. Выбрав любое подмножество страниц, можно потребовать создать HTML-страницы со ссылками на все эти страницы.

«ДИСКо Искатель» запускает одновременно несколько соединений со всеми указанными поисковыми серверами, что существенно ускоряет время поиска. Оперативная информация о соединениях выводится в окно соединения. Пользователь может сохранить параметры и результаты поиска в файле с расширением dio, чтобы в следующий раз снова запустить этот же поиск или внимательнее просмотреть его результаты.

Есть два способа экспорта подмножества страниц из дерева поиска:



  • в закладки (избранное) интернет-проводника

  • в HTML-страницу для последующего вызова ее из браузера.





Чтобы научиться ругаться по-настоящему, нужно научиться водить машину. «Закон дедушки Чарнока»
ещё >>