Управленческая деятельность выступает в современных условиях как один из важнейших факторов функционирования и развития промышленных - davaiknam.ru o_O
Главная
Поиск по ключевым словам:
Похожие работы
Название работы Кол-во страниц Размер
Гражданская оборона в современных условиях 3 564.2kb.
Международная «Лига развития науки и образования» (Россия) 2 461.45kb.
Особенности общения детей с зпр 1 118.22kb.
В заключении дипломной работы сформулируем основные выводы отражающие... 1 37.14kb.
Информационные технологии в деятельности учреждений культуры Смоленской... 1 78.29kb.
Образовательная область Естествознание 5 429.14kb.
Воздействие институциональных факторов на эволюцию экономической... 1 310.66kb.
Ч. Дж. Турдалиева Имперское насилие в трудах западных 1 97.01kb.
“межличностные отношения в 3 436.77kb.
Инновационный потенциал классического университета как один из факторов... 1 226.63kb.
Анализ кадровой политики ни вгуэс 1 318.23kb.
Марина Серова я больше не шучу Телохранитель Евгения Охотникова – 0 8 1900.54kb.
Направления изучения представлений о справедливости 1 202.17kb.

Управленческая деятельность выступает в современных условиях как один из важнейших - страница №5/6


Протокол сервера PROTOS.INI (для Windows 95 записывается в Protos.log, для Windows NT - в системный протокол (event log))

"Maximum Server number exceeded." - превышено разрешенное количество виртуальных серверов

"Nothing to do." - в файле PROTOS.INI не найдено корректного конфигурационного файла ни для одной поисковой машины

"Program is corrupted." - дистрибутив испорчен

"Memory exceeded." - нехватает памяти для выполнения программы

"Dictionary is not found." - дистрибутив неполон

".INI file for server [имя_поискового_сервера] is not found." - не найден файл, описывающий конфигурацию данной поисковой машины

"Protocol file(s) for server [имя_поискового_сервера] can not be opened." - невозможно открыть протокол данной поисковой машины



Сообщения об ошибках, которые каждая поисковая машина пишет в свой протокол индексирования или поиска соответственно:

" Host parameter is not defined." - не определено имя хоста для поисковой машины ( параметр Host)

" Script parameter is not defined." - не определено имя поискового приложения ( параметр Script)

" CacheFolder parameter is not defined." - не определен каталог хранения результатов ( параметр CacheFolder)

"Cache folder [путь] is not found." - не существует каталог хранения результатов ( CacheFolder)

"DBaseFolder parameter is not defined." - не определен каталог хранения индекса ( параметр DBaseFolder)

"Data base folder [путь] is not found." - не существует каталог хранения индекса ( DBaseFolder)

"Images parameter is not defined." - не указан каталог картинок машины ( параметр Images)

"StopWords file [имя_поискового_сервера] is not found." - не найден файл стоп-слов ( StopWords)

"Can't start indexator. System is busy." - нехватает системных ресурсов



Сообщения, которые каждая поисковая машина пишет в свой протокол индекса :

"Can't create data base [имя_файла]." , "Can't create index file [имя_файла] ." , "Can't create temprorary file. May be disk is full." - система не может создать соответствующие файлы, возможные причины: отсутствие места на диске, отсутствие доступа на запись, системная ошибка диска

"Close index: Memory exceded." - нехватает памяти

"Data base is catched by another program." - база данных занята другой программой



Сообщения, которые каждая поисковая машина пишет в свой протокол поиска:

"Index file [имя_файла] is not found." , "Data base file [имя_файла] is not found." - не найдены файлы индекса, возможно, документы не проиндексированы.

"Ошибка создания временного файла." - система не может создать файл, возможные причины: отсутствие места на диске, отсутствие доступа на запись, системная ошибка диска

Информационные сообщения



Сообщения, которые каждая поисковая машина пишет в свой протокол индекса:

"Maximum licensed data base capacity exceded." - превышен объем текстов, указанные в лицензии на программу, обратитесь в CompTek за следующей версией

"[количество_документов] documents have been updated." , "[количество_документов] documents have been deleted." , "[количество_документов] documents have been added." , " Total [количество_документов] documents ([объем]Kb) have been indexed." , "[количество_документов] documents have been left unchanged." - статистика индексирования

"Data base capacity: [количество_документов] documents." - размер базы данных

"Indexator aborted due to user request." - индексатор снят по запросу пользователя (это не ошибка, но индекс не обновился)

"U [имя_файла] ) , "D [имя_файла]) , "A [имя_файла]) - сообщения о каждом изменненном в индексе файле (U - обновление, D - удаление, A - добавление)



Сообщения, которые каждая поисковая машина пишет в свой протокол поиска:

"Program expired." - время действия программы окончилось, это была демо-версия, для приобретения неограниченной по времени версии обратитесь в CompTek



Сообщения, выдаваемые при запросе с поисковой страницы (в формате HTML):

"Извините, но результат Вашего запроса уже удален."

"Неправильная конфигурация страницы." , "Извините, но Ваш запрос не правильно сформирован." - ошибка в вызове и формировании поискового приложения

"Извините, но запрошенный документ изменился после индексироавния."


Сообщения ядра Protos

"Синтаксическая ошибка Syntax error" - неправильно сформулирован запрос

"Для требуемой операции не хватает памяти Not enough memory for the operation"

"Ошибка при чтении файла File reading error" - не читается файл индекса

"Неизвестная зона Unknown zone" - используется не описанный таг зоны

"Внутренняя ошибка: дисбаланс зон Internal error: zone disbalance" - в документе есть таг открытия зоны, но нет тага закрытия

"Результат предыдушего запроса уже удален Previous search result is already deleted"



Глава 8. Сравнительные характеристики российских поисковых систем

Рассматриваемые в данной таблице Rambler, Yandex и Апорт являются основными полнотекстовыми поисковыми системами, представленными в русскоязычном секторе Интернет. Системы проводят автоматическое сканирование документов только с доменов ru, su, ua и других доменов, принадлежащих странам ближнего зарубежья. При регистрации страницы, располагающейся в зоне .com, робот проверит корневую страницу ресурса. При отсутствии русского текста индексация не произойдет...



I. Основные характеристики поисковых систем





Rambler

Yandex

Апорт

Адрес

www.rambler.ru

yandex.ru

www.aport.ru

Кол-во уникальных пользователей поисковой системы в день (среднее за неделю с 25 по 31 января)

19 344

13 323

6 714

Кол-во уникальных пользователей поисковой системы в месяц (январь 99)

137 300

94 775

55 200

Кол-во запросов к поисковой системе в день (среднее за неделю с 25 по 31 января)

138 983*

50 235

24 057

Размер поисковой системы

(на 31.01.99)



3 815 679 (DOC)

5 143 907 (URLs)

24 897 (SERV)


4 512 231 (DOC)

24 772 (SERV)



1 757 208 (DOC)

2 999 585 (URL)

13 264 (SERV) **


Кол-во индексируемых в день страниц (среднее за неделю с 25 по 31 января)

130 000 URLs

40 000 NEW



900 000 URLs

???

Период обновления страницы в индексах

от недели до месяца

7 дней

от недели до месяца

Появление в индексах после регистрации

ближайший выходной

10 мин для доменов 'ru', 'su', 7 дней для остальных

7 дней

Появление в индексах незарегистрированных страниц

от недели до месяца

около 7 дней

от недели до месяца

Глубина индексирования

не ограничена

не ограничена

не ограничена

Поддержка фреймов

+

+

+

Поддержка ImageMaps

+

+

+

Индексация закрытых разделов

+

+

+

Популярность веб-сайта

-

планируется

-

Определение частоты обновления

-

+

+

Robots.txt

+

+

+

Meta Robots

+

+

+

Возможность проверки страницы на наличие в индексах

+

+

+

Возможность проверки на наличие ссылок с других страниц

-

планируется

+

* - включая поиск по TOP100

** - данные на 02.12.98



II. Факторы, влияющие на определение релевантности страницы





Rambler

Yandex

Апорт

Адрес

www.rambler.ru

yandex.ru

www.aport.ru

Популярность страниц

-

-

-

Мета-теги

-

планируется

+

Индексация в поле ALT

+

планируется

+

Индексация текста в комментариях

+

-

+

Стоп слова

встречаются в более 600 тыс. документов

список

список

Морфологический поиск

+

+

+

Учет регистра

-

+

-

Meta-refresh

ОК (робот переходит)

OK (робот не переходит)

OK (робот переходит)

Невидимый текст

SPAM

SPAM

SPAM

Излишняя повторяемость ключевых слов

SPAM

SPAM

SPAM

Мелкий текст

SPAM

SPAM

SPAM



III. Факторы, влияющие на отображение страниц в результатах поиска





Rambler

Yandex

Апорт

Адрес

www.rambler.ru

yandex.ru

www.aport.ru

Длина заголовка (title)

не более 512 символов

не более 203 символов

не более 256 символов

Если нет заголовка

URL

выдается "Без заголовка"

выдается "Документ без названия"

Вид описания (мета-тег, первый текст на странице и т.д.)

первые 513 символов из основного текста документа

первые 203 символов из основного текста документа

отрывки предложений (до 10), где встречаются ключевые слова

Длина описания

три опции: отсутствует, не более 513 символов, не ограничена

не более 203 символов

цитата до 500 слов

Дата обновления документа

+

+

+

Дата индексации документа

+

-

+

Размер документа

+

+

-

Кодировка документа

+

+

+

Кол-во результатов на странице

15 - 30 - 50

10 - 20 - 50

10

Варианты отображения

стандартный, короткий, полный

простой и академический поиск

сжатая , обычная, подробная

Пояснения к таблице

I. Основные характеристики поисковых систем

Размер поисковой системы

Параметр, характеризующий объем информации, проиндексированной системой:

(URL) - кол-во хранящихся в индексах адресов страниц;

(DOC) - кол-во проиндексированных документов. Их, как правило, меньше чем (URL), т.к. по нескольким URL может находиться один и тот же документ;

(SERV) - кол-во проиндексированных серверов. На одном сервере может располагаться от одной до нескольких тысяч страниц, поэтому данная цифра больше свидетельствует о широте охвата системы, чем об ее информационном объеме.

От размера поисковой системы зависит, будет ли Ваш веб-сайт представлен в ее индексах, сколько страниц веб-сайта будет проиндексировано и т.д.

Кол-во индексируемых в день страниц

Кол-во страниц, которые индексируются роботами поисковых систем за одни сутки. Чем выше данный параметр, тем чаще происходит переидексация страниц, тем актуальнее информация в системе.



Период обновления страницы в индексах

Среднее и максимальное время, через которое происходит повторная индексация страницы.

Содержимое многих веб-страниц часто меняется, некоторые страницы попросту исчезают, поэтому для поисковой системы немаловажно поддерживать актуальную информацию в своих индексах. Однако ссылки в поисковой системе могут быть как однодневной давности, так и не обновлявшимися несколько месяцев. Причина в том, что робот не возвращается на все страницы через одинаковый промежуток времени. На скорость обновления могут влиять следующие факторы:

- регистрация по запросу пользователя, при этом указанная страница заносится в индекс "вне очереди";

- зависимость скорости обновления от популярности страницы;

- зависимости скорости обновления от динамичности страницы.



Появление в индексах после регистрации

Время, через которое зарегистрированная пользователем страница появится в индексах системы.

По идее робот поисковой системы рано или поздно найдет Вашу страницу, если на нее указывают другие веб-ресурсы. Но на практике гораздо быстрее это произойдет при их непосредственной регистрации (обычно ADD URL).

Появление в индексах незарегистрированных страниц

При регистрации (add url) пользователи, как правило, указывают URL главной страницы сайта. При этом поисковые системы обычно оперативно помещают в индексы указанную страницу и ставят весь остальной сайт в очередь на индексацию. Данный пункт указывает период, через который остальные страницы сайта появятся в индексах.



Глубина индексирования

Данный пункт показывает, сколько страниц помимо указанной будет индексировать поисковая система. Как правило, у крупных поисковых машин нет ограничения на глубину, и их роботы пытаются проиндексировать все страницы веб-сайта. Это не всегда получается, т.к. на их пути могут возникнуть преграды, например, такие как фреймы, Image maps, динамически созданные страницы и т.д. (см. ниже).

Ряд поисковых систем (например, Infoseek, Lycos) при индексации ограничиваются лишь некоторым кол-вом страниц веб-сайта. Кол-во страниц зависит как от самой системы, так и от популярности индексируемого ресурса.

Поддержка фреймов

Некоторые поисковые системы не понимают фреймовой структуры сайта. Вследствие этого практически все страницы Вашего сайта могут быть не проиндексированы.



Поддержка ImageMaps

Не все поисковые системы могут следовать по ссылкам, указанным посредством image maps. Вследствие этого некоторые страницы Вашего сайта могут быть не проиндексированы



Индексация закрытых разделов

Ряд поисковых машин могут индексировать защищенные разделы на серверах, если им указать login и пароль. Пользователь не сможет сразу перейти на защищенную страницу и изучить всю информацию, но благодаря поисковой системе он будет знать, что такая информация существует и, возможно, примет решение заплатить и получить к ней доступ.



Популярность веб-сайта

Поисковая система может определить "популярность" веб-сайта по количеству ссылок на него с других веб-ресурсов. "Популярность" может быть одним из факторов в принятии системой решения о том, индексировать данный веб-сайт или нет.



Определение частоты обновления

Некоторые поисковые машины определяют, насколько часто обновляются те или иные страницы. Данная информация помогает соответствующим образом спланировать график повторных визитов роботов для переиндексации страниц. Часто обновляемые ресурсы посещаются чаще, статичные страницы - реже.



Robots.txt, Meta Robots

В силу некоторых обстоятельств администратор сайта может не желать индексации всех или определенных страниц своего веб-ресурса. Избежать индексации можно двумя путями:

- c помощью файла Robots.txt, размещенного на веб-сервере. Его спецификации Вы можете изучить по адресу http://info.webcrawler.com/mak/projects/robots/exclusion.html

- при помощи специального мета-тега, который помещается на конкретную страницу веб-сайта и предписывает роботам не заносить ее в индексы системы. Выглядит следующим образом:





Возможность проверки страницы на наличие в индексах

Очень полезная опция, которой обладают далеко не все поисковые машины. Позволяет определить наличие в индексах системы той или иной страницы и посмотреть, как она выглядит в системе.

Синтаксис запроса для Rambler - $URL: host/url_name

Синтаксис запроса для Yandex - попробовать добавить страницу на http://yandex.ru/addurl.html, если страница уже есть в индексах, система выдаст соответствующее сообщение.

Синтаксис запроса для Апорта - url=www.promotion.aha.ru.

Возможность проверки наличия ссылок с других страниц

Для человека, занимающегося продвижением сервера, немаловажно знать, какие ресурсы сети содержат на него ссылку, в каком контексте эта ссылка используется и т.д. Поэтому возможность вывода сайтов, содержащих подобные ссылки, придает поисковой системе дополнительную ценность.

Синтаксис запроса для Апорта - link=www.promotion.aha.ru (пока можно указывать только имя сервера).

II. Факторы, влияющие на определение релевантности страницы

Популярность страниц

Для каждой страницы поисковая система может определить, какое количество веб-ресурсов имеют на нее ссылку. Некоторые системы учитывают данный параметр "популярности" и считают подобные страницы более релевантными запросу. В этом действительно есть логика, т.к. наличие большого кол-ва ссылок, как правило, свидетельствует о полезности и информативности страницы.



Мета-теги

Не все системы поддерживают мета-теги: description и keywords, т.е. учитывают ключевые слова, содержащиеся в этих тегах, при определении релевантности страницы.



Индексация в поле ALT

Не все системы учитывают ключевые слова, содержащиеся в поле ALT тега IMG, при определении релевантности страницы.



Для справки: в поле ALT заносится альтернативная текстовая подпись к картинкам на странице.

Индексация текста в комментариях

Не все системы учитывают ключевые слова, содержащиеся в комментариях, при определении релевантности страницы.



Для справки: комментарии не отображаются в браузере и посетители сайта их обычно не видят. В основном, используются для служебной разметки html-страницы и содержат информацию, не предназначенную для широкого круга пользователей.

Стоп-слова

Для экономии места и увеличения производительности некоторые поисковые системы не включают в индексы слова, встречающиеся на веб-страницах очень большое кол-во раз. Например, "www", артикли "а", "the" и т.д.



Морфологический поиск

Если поисковая система поддерживает морфологию, то поиск будет осуществляться не только по указанному слову, но и по всем его морфологическим формам. Т.е., например, при запросе "баннер" такая поисковая машина найдет также страницы, содержащие "баннера", "баннеров", "баннере" и т.д.



<< предыдущая страница   следующая страница >>



Возможно, равенство — это право, но никакая сила на земле не сделает его фактом. Оноре Бальзак
ещё >>