Управленческая деятельность выступает в современных условиях как один из важнейших факторов функционирования и развития промышленных - davaiknam.ru o_O
Главная
Поиск по ключевым словам:
Похожие работы
Название работы Кол-во страниц Размер
Гражданская оборона в современных условиях 3 564.2kb.
Международная «Лига развития науки и образования» (Россия) 2 461.45kb.
Особенности общения детей с зпр 1 118.22kb.
В заключении дипломной работы сформулируем основные выводы отражающие... 1 37.14kb.
Информационные технологии в деятельности учреждений культуры Смоленской... 1 78.29kb.
Образовательная область Естествознание 5 429.14kb.
Воздействие институциональных факторов на эволюцию экономической... 1 310.66kb.
Ч. Дж. Турдалиева Имперское насилие в трудах западных 1 97.01kb.
“межличностные отношения в 3 436.77kb.
Инновационный потенциал классического университета как один из факторов... 1 226.63kb.
Анализ кадровой политики ни вгуэс 1 318.23kb.
Марина Серова я больше не шучу Телохранитель Евгения Охотникова – 0 8 1900.54kb.
Направления изучения представлений о справедливости 1 202.17kb.

Управленческая деятельность выступает в современных условиях как один из важнейших - страница №6/6


Учет регистра

Некоторые поисковые системы чувствительны к запросам с учетом регистра, другие - нет. Например, поисковая система AltaVista при запросе "banner" выдаст Вам все страницы, содержащие слово "banner", где буквы могут быть в любом регистре, но при запросе "Banner" - только страницы, содержащие это слово с заглавной первой буквой.



Meta-refresh

В сети существуют страницы, которые автоматически переносят пользователя на другие веб-ресурсы. Причин, по которым они создаются, может быть много: сайт переехал на новое место и находится по другому адресу; страницы с редиректом созданы специально для поисковой системы, т.к. основные страницы сайта генерятся автоматически и не могут быть проиндексированы и т.д.

Обычно такой автоматический редирект реализуется с помощью мета-тега refresh. Его синтаксис:

Поисковые системы ведут себя в этом случае по-разному:

- одни считают такие страницы спамом поисковых систем и не индексируют их;

- другие не индексируют данную страницу, но переходят по ссылке редиректа и производят индексацию на странице назначения;

- третьи не понимают данного мета-тега, индексируют саму страницу, но по редиректу не переходят...

Спам поисковых систем

Вполне понятно стремление каждого веб-мастера добиться того, чтобы при запросе по определенным ключевым словам его страница выдавалась как можно ближе к началу списка. Иногда желание добиться успеха на этом поприще толкает некоторых использовать неприглядные приемы искусственного увеличения релевантности свой страницы - спамить поисковые системы.

В основном, спам заключается в использовании неоправданно большого кол-ва ключевых слов на странице. Причем их стараются использовать там, где они имеют наибольший "вес" для поисковой системы, - в заголовке страницы (теге title), названиях разделов и т.д. Часто для того, чтобы подобные дополнительные слова не портили посетителям впечатление от страницы, их пишут текстом, совпадающим по цвету с фоном страницы, пишут их мелким шрифтом и т.д.

Разумеется, администрация поисковиков не одобряет подобные действия. Системы поиска призваны находить и отображать документы в соответствии с тем, что содержит текст, предназначенный для посетителей, а не по "обогащенной смеси" ключевых слов.

Крупные международные поисковики применяют ряд мер по борьбе со спамом. Если таким системам попадется страница, которая содержит в мета-теге keywords одно и то же слово более 5 раз, или, например, невидимый для посетителей текст, она не будет проиндексирована системой.

Наши поисковые системы, к сожалению, пока не поддерживают автоматических средств борьбы со спамом, и в таблице просто представлены те действия, которые расцениваются администрацией как спам. Несмотря на отсутствие автоматического контроля, я рекомендую не использовать описанные выше приемы, т.к.:

- спам поисковых систем сильно затрудняет поиск информации в Интернет;

- подобную страницу при обнаружении могут выкинуть из индексов вручную;

- не за горами время ввода автоматических средств слежения за спаммерами в русских поисковых системах.

III. Факторы влияющие на отображение страниц в результатах поиска

Длина заголовка (title)

Максимальное кол-во сиволов из заголовка документа, которое отображает система.



Если нет заголовка

В сети встречаются страницы с пустым или отсутствующим тегом title (заголовком документа). Этот пункт показывает, что система выводит в этом случае.



Вид описания (мета-тег, первый текст на странице и т.д.)

Найденные документы каждая из систем отображает посвоему. Это могут быть первые N-символов текста со страницы, описание из мета-тега description, отрывки текста страницы, содержащие слова поиска и т.д.



Длина описания

Максимальное кол-во символов в описании страницы.



Дата обновления документа

При отображении веб-документов в результатах поиска некоторые системы указывают время создания или обновления данной страницы.



Дата индексации документа

При отображении веб-документов в результатах поиска некоторые системы указывают время последней индексации данной страницы.



Размер документа

При отображении веб-документов в результатах поиска некоторые системы указывают размер данной страницы в килобайтах.



Кодировка документа

При отображении веб-документов в результатах поиска некоторые системы указывают, в какой кодировке создана данная страница.



Кол-во результатов на странице

Найденные веб-документы отображаются в системе определенными порциями, обычно по 10 -20 документов.



Варианты отображения

Некоторые поисковые системы предусматривают несколько вариантов отображения найденых веб-документов.



Глава 9. Сравнительная таблица зарубежных
поисковых машин





Altavista

Excite

HotBot

InfoSeek

Lycos

OpenText

WebCrawler

Тип

Полнотекстовая

Полнотекстовая

Полнотекстовая

Полнотекстовая

Абстрактная

Полнотекстовая

Полнотекстовая

Размер

30 миллионов

55 миллионов

54 миллиона

20-50 миллионов

20-25 миллионов

5 миллионов

2 миллиона

Период обновления

от 1 дня до 3 месяцев

1 - 3 недели

не позднее 3 недель

от минут до месяца

ещемесячное обновление

1 - 4 недели

еженедельное обновление

Дата индексирования документа

Да

Нет

Да

Нет

Нет

Нет

Нет

Указанные (submitted) страницы

1 день

1 неделя

3 недели

1 месяц

1 месяц

2 - 4 недели

2 - 4 недели

Неуказанные (non-submitted) страницы

1 - 3 месяца

3 недели

3 недели

1 месяц

1 месяц

2 4 недели

2 4 недели

Глубина индексирования

Неограничена

Неограничена

Неограничена

Неограничена

Неограничена

-

Ограничена популярностью того или иного сервера

Поддержка фреймов

Нет

Да

Нет

Да

Да

Нет

Нет

Поддержка ImageMap

Да

Нет

Нет

Да

Да

Нет

Да

Защищенные паролями директории и сервера

Нет

Да

Нет

Да

Да

Нет

Нет

Частота появления ссылок

Нет

Нет

Да

Нет

Да

Нет

Да

"Обучаемость"

Да

Нет

Да

Да

Нет

Нет

Нет

Контроль индексации

robots.txt

robots.txt (в будущем и метаданные)

И то, и другое

robots.txt

robots.txt

robots.txt

И то, и другое

Перенаправление (redirect)

Поддерживает

Поддерживает

-

-

-

-

Поддерживает

Стоп-слова

Да

Да

Да

Нет

Да

Нет

Нет

Влияние на алгоритм определения релевантности

Нет

-

Ключевые слова в метаданных

Нет

Нет

Нет

Частота появления ссылок

Spam-штрафы

Да

Да

Да

Да

Да

Да

Да

Поддержка META-тагов

Да

Нет

Да

Да

Да

Нет

Только NOINDEX таг

Title

Заголовок страницы или No Title

Заголовок страницы или Untitled

Заголовок страницы или URL

Заголовок страницы или первая строка документа

Заголовок страницы или первая строка документа

Первые 100 символов из документа

Заголовок страницы или URL

Description

Метатаг или первые несколько строк из документа

Формируется из наиболее релевантных к запросу фраз документа

Метатаг или первые несколько строк документа

Метатаг или первые 200 символов после тага

Метатаг или экстакт из содержимого страницы

Первые 100 символов документа

Создается из содержания; обещается поддержка метатагов в будущем

Проверка статуса URL

Да

Нет

Нет

Нет

Да

Нет

Да

Удаление старых данных

Удалить содержимое и указать новый адрес

Удалить содержимое или переписать robots.txt

Переписать robots.txt

Удалить содержимое и указать новый адрес или переписать robots.txt

-

-

-

Имя поискового робота (Spider User Agent)

Scooter

Architext Spider

Slurp the Web Hound

Side winder

T-rex

-

Spidey

Список используемой литературы и материалов




  1. Компьютер. Октябрь 1991, часть24, номер.10

  2. Сеть Relcom. Адресный справочник, изд. МЦНТИ, Москва, 1992 г.

  3. Газета “Компьютерная Казань” 1998-1999гг.

  4. Журнал “Komputer World Казань” 1999г.

  5. Журнал “HiTech” №1-6. 1999г.

  6. “Секреты INERNET” Джон Р.Левин и Кэрол Бароди. Издательство “Диалектика” г.М.

  7. URL: http://www.citforum.ru – сервер аналитической информации.

  8. URL: http://www.promo.ru - сборник полезной информации

  9. Были исползованы поисковые системы Rambler, Yandex и Апорт.

  10. http://m2.hq.cti.ru:8080/arcadia/articles/art00023.html - Articles: Как улучшить поиск на Web-узлах

  11. http://www.webber.net.ua/softoboz/searchsite.htm - Поиск на сайте

  12. http://m2.hq.cti.ru:8080/arcadia/general.html - Полнотекстовые поисковые системы : программные продукты

  13. http://www.promotion.aha.ru/search/stips.htm – Что понимается под успешной индексацией в поисковых системах

  14. http://www.tunis.tver.su/internet/search/intersr.html - Global search systems

  15. http://www.usmga.ru/Koi-8/Search.htm - Поиск в INTERNET

  16. http://m2.hq.cti.ru:8080/arcadia/general.html - Полнотекстовые поисковые системы : программные продукты

  17. http://www.cor.neva.ru/pch/russian/index.html - MEDLINE via PaperChase

Приложение --- Листинги системы PROTOS.
MIDL_FILE_HEADING( )

#include "rpc.h"

#include "rpcndr.h"

#ifndef __protos_h__

#define __protos_h__

#ifdef __cplusplus

extern "C"{

#endif


/* Forward Declarations */

void __RPC_FAR * __RPC_USER MIDL_user_allocate(size_t);

void __RPC_USER MIDL_user_free( void __RPC_FAR * );

#ifndef __ProtosSearchEngine_INTERFACE_DEFINED__

#define __ProtosSearchEngine_INTERFACE_DEFINED__

/****************************************

* Generated header for interface: ProtosSearchEngine

****************************************/

/* [implicit_handle][unique][version][uuid] */

/* [fault_status][comm_status] */ error_status_t Ping( void);

/* [fault_status][comm_status] */ error_status_t Shutdown( void);

/* [fault_status][comm_status] */ error_status_t QueryStatus(

/* [string][out] */ unsigned char __RPC_FAR *__RPC_FAR *Report);

/* [fault_status][comm_status] */ error_status_t IndexOpen(

/* [string][in] */ unsigned char __RPC_FAR *IndexName);

/* [fault_status][comm_status] */ error_status_t IndexClose(

/* [string][in] */ unsigned char __RPC_FAR *IndexName);

/* [fault_status][comm_status] */ error_status_t SearchOpen(

/* [string][in] */ unsigned char __RPC_FAR *IndexName);

/* [fault_status][comm_status] */ error_status_t SearchClose(

/* [string][in] */ unsigned char __RPC_FAR *IndexName);

/* [fault_status][comm_status] */ error_status_t SearchWork(

/* [string][in] */ unsigned char __RPC_FAR *IndexName,

/* [string][in] */ unsigned char __RPC_FAR *QueryString,

/* [string][out] */ unsigned char __RPC_FAR *__RPC_FAR *ReportFile);

extern handle_t hProtos;

extern RPC_IF_HANDLE ProtosSearchEngine_v1_0_c_ifspec;

extern RPC_IF_HANDLE ProtosSearchEngine_v1_0_s_ifspec;

#endif /* __ProtosSearchEngine_INTERFACE_DEFINED__ */

/* Additional Prototypes for ALL interfaces */

/* end of Additional Prototypes */

#ifdef __cplusplus

}

#endif


#endif

#define WIN32_LEAN_AND_MEAN

#include

#include

#include

#include "protos.h"

unsigned long BindProtos()

{

RPC_STATUS status;



unsigned char * pszStringBinding = NULL;

BOOL bWin95;

OSVERSIONINFO osVer;

osVer.dwOSVersionInfoSize = sizeof(OSVERSIONINFO);

GetVersionEx(&osVer);

switch(osVer.dwPlatformId)

{

case VER_PLATFORM_WIN32_WINDOWS:



bWin95 = TRUE;

break;


case VER_PLATFORM_WIN32_NT:

bWin95 = FALSE;

break;

default:


return 1; // Unsupported operating system.

}

--------------------------------------------------------------------------------



/* Use a convenience function to concatenate the elements of */

/* the string binding into the proper sequence. */

status = RpcStringBindingCompose(NULL,

bWin95 ? "ncalrpc" : "ncacn_np",

NULL,

NULL,


NULL,

&pszStringBinding);

if (status) return status;

/* Set the binding handle that will be used to bind to the server. */

status = RpcBindingFromStringBinding(pszStringBinding, &hProtos);

RpcStringFree(&pszStringBinding);

return status;

}

unsigned long UnbindProtos()



{

RPC_STATUS status;

/* The calls to the remote procedures are complete. */

/* Free the binding handle */

status = RpcBindingFree(&hProtos);

return status;

}

#define SERVER_PARM "server="



int IsScript()

{

return getenv("GATEWAY_INTERFACE") != NULL;



}

char *GetServerNameCGI()

{

char *ptrb, *ptre, *server;



char *query = getenv("QUERY_STRING");

if (!query) return NULL;

query = strlwr(strdup(query));

if (!query) return NULL;

ptrb = strstr(query, SERVER_PARM);

if (!ptrb) return NULL;

ptrb += strlen(SERVER_PARM);

ptre = strchr(ptrb, '&');

if (!ptre)

server = strdup(ptrb);

else {

server = (char*) malloc(ptre - ptrb);



if (server) {

*server = 0;

strncat(server, ptrb, ptre - ptrb);

}

}



free(query);

return server;

}

char *GetServerNamePathInfo()



{

char *ptre, *server;

char *ptrb = getenv("PATH_INFO");

if (!ptrb) return NULL;

while(*ptrb == '/') ptrb++;

ptre = strchr(ptrb, '/');

if (!ptre)

server = strdup(ptrb);

else {

server = (char*) malloc(ptre - ptrb);



if (server) {

*server = 0;

strncat(server, ptrb, ptre - ptrb);

}

}



return server;

}

char *GetServerNameArgv()



{

if (__argc < 2) return NULL;

return strdup(__argv[1]);

}

char *GetServerNameModuleName()



{

char fname[MAX_PATH];

char *ptrb, *ptre, *server;

GetModuleFileName(0, fname, MAX_PATH);

if ((ptrb = strrchr(fname, '\\')) == NULL) return NULL;

if ((ptrb = strchr(++ptrb, '.')) == NULL) return NULL;

if ((ptre = strchr(++ptrb, '.')) == NULL) return NULL;

server = (char*) malloc(ptre-ptrb);

if (!server) return NULL;

*server = 0;

return strncat(server, ptrb, ptre-ptrb);

}

char *GetServerName()



{

char *server;

if (

(server = GetServerNameCGI())



|| (server = GetServerNamePathInfo())

|| (server = GetServerNameArgv())

)

return server;



else

return NULL;

}

void MakeMessage(char *mes, ...)



{

char buffer[1024];

va_list argptr;

puts("Content-type: text/plain\n");

va_start(argptr, mes);

_vsnprintf(buffer, 1024, mes, argptr);

va_end(argptr);

puts(buffer);

}

void __RPC_FAR * __RPC_API midl_user_allocate(size_t nLen)



{

return malloc(nLen);

}

void __RPC_API midl_user_free(void __RPC_FAR * lpvPointer)



{

if (NULL != lpvPointer) free (lpvPointer);

}

--------------------------------------------------------------------------------



#include "protos.h"

#include "protutl.h"

int main()

{

RPC_STATUS status;



char *str;

if (BindProtos()) {

MakeMessage(MES_BIND_ERROR);

return 1;

}

str = GetServerName();



if (!str) {

MakeMessage(MES_NAME_ERROR);

return 1;

}

status = IndexOpen(str);



UnbindProtos();

free(str);

if (status) {

char *str = GetErrorText(status);

if (str) {

MakeMessage(str);

free(str);

} else


MakeMessage("System is busy.");

}

else



MakeMessage(MES_INDEX_OK);

return 0;

}

--------------------------------------------------------------------------------



#include

#include "protos.h"

#include "protutl.h"

int main()

{

RPC_STATUS status;



char *server, *command, *report = NULL;

if (BindProtos()) {

MakeMessage(MES_BIND_ERROR);

return 1;

}

server = GetServerName();



if (!server) {

MakeMessage(MES_NAME_ERROR);

return 1;

}

command = getenv("QUERY_STRING");



if (!command || !*command) {

free(server);

MakeMessage(MES_QUERY_ERROR);

return 1;

}

status = SearchWork(server, command, &report);



UnbindProtos();

free(server);

if (status) {

char *str = GetErrorText(status);

if (str) {

MakeMessage(str);

free(str);

} else


MakeMessage(MES_UNKNOWN);

}

else {



FILE *fd = fopen(report, "rt");

char buf[BUFSIZ];

if (fd) {

puts("Content-type: text/html\n");

while(!feof(fd) && !ferror(fd))

fwrite(buf, 1, fread(buf, 1, BUFSIZ, fd), stdout);

fclose(fd);

}

else



MakeMessage(MES_FILE_ERROR);

}

midl_user_free(report);



return 0;

}

--------------------------------------------------------------------------------



#include "protos.h"

#include "protutl.h"

int main()

{

RPC_STATUS status;



if (BindProtos()) {

MakeMessage(MES_BIND_ERROR);

return 1;

}

status = Shutdown();



UnbindProtos();

if (status) {

char *str = GetErrorText(status);

if (str) {

MakeMessage(str);

free(str);

} else

MakeMessage(MES_UNKNOWN);



}

else


MakeMessage(MES_SHUTDOWN_OK);

return 0;

}

--------------------------------------------------------------------------------



#include "protos.h"

#include "protutl.h"

int main()

{

RPC_STATUS status;



char *str;

if (BindProtos()) {

MakeMessage(MES_BIND_ERROR);

return 1;

}

str = GetServerName();



if (!str) {

MakeMessage(MES_NAME_ERROR);

return 1;

}

status = SearchClose(str);



UnbindProtos();

free(str);

if (status) {

char *str = GetErrorText(status);

if (str) {

MakeMessage(str);

free(str);

} else


MakeMessage(MES_UNKNOWN);

}

else



MakeMessage(MES_SEARCHOFF_OK);

return 0;

}

--------------------------------------------------------------------------------



#include "protos.h"

#include "protutl.h"

int main()

{

RPC_STATUS status;



char *str;

if (BindProtos()) {

MakeMessage(MES_BIND_ERROR);

return 1;

}

str = GetServerName();



if (!str) {

MakeMessage(MES_NAME_ERROR);

return 1;

}

status = SearchOpen(str);



UnbindProtos();

free(str);

if (status) {

char *str = GetErrorText(status);

if (str) {

MakeMessage(str);

free(str);

} else


MakeMessage(MES_UNKNOWN);

}

else



MakeMessage(MES_SEARCH_OK);

return 0;

}

--------------------------------------------------------------------------------



#include "protos.h"

#include "protutl.h"

int main()

{

RPC_STATUS status;



char *str = NULL;

if (BindProtos()) {

MakeMessage(MES_BIND_ERROR);

return 1;

}

status = QueryStatus(&str);



UnbindProtos();

if (status) {

char *str = GetErrorText(status);

if (str) {

MakeMessage(str);

free(str);

} else

MakeMessage(MES_UNKNOWN);



}

else


MakeMessage(str);

midl_user_free(str);

return 0;

}


1 Журнал "Hi-Tech". №1 декабрь 1998. Стр 16.

2 Журналы “Hi-Tech”, “Komputer World Казань”, газета “Компьютерная Казань” и другие.

3 От англ. host - компьютер, который обеспечивает доступ пользователю в internet и через который происходит взаимодействие ПК и Internet.

4 URL адрес - http://www.nw.com

5 URL адрес - http://www.yahoo.com/

6 URL адрес - http://www. altavisla.com/

7 URL адрес - http://www.au.ru/

8 URL адрес - http://www.aport.ru/

9 URL адрес - http://lcweb.loc.gov/calalog/

10 Протокол - “язык” общения различных компонент вычислительных систем друг с другом.

11 По состоянию на начало 1999 г.

12 Фраза постоянно произносимая Иваном Демидовым в программе “Музобоз”

13 От анг.chat – болтовня, разговоры.

14 "Не строгое определение термина. В данной работе для определения явления. ввиду отсутствия общепринятого термина, используется название одной из программ, обеспечивающей объясняемый вид связи.

15 См. Деньги” №39 за 1997 г., с.48-50.

16 См. “Эксперт” №39 за 1998г. с54,55. № 44 за 1998г. с.68

17 См. “Эксперт” №4 за 1998г. с79

18 Например – piva.net

19 ЦБ РФ "Cистемы безопасности связи и телекоммуникаций", #6/96

<< предыдущая страница  



Четыре возраста человека: младенчество, детство, юность, старение. Арт Линклеттер
ещё >>