Какво е търсачката

версия за печат

Помогне на потребителя да намерите информацията в мрежата, се наричат ​​търсачки (търсачки). В намирането на правилния ресурс потребителят въведе една или няколко ключови думи, които, по негово мнение, е най-добре да улови същността на въпросите. Търсачката за секунди сканира цялата собствен каталог уеб-ресурси, състояща се от десетки или стотици гигабайта данни. В резултат на това, потребителят се предлага списък с линкове към страници, които включват определени думи. Тази основна схема търсене се осъществява с различни подобрения и разширения в почти всички търсачки в света. По-специално, има системи, които въвеждате заявка на естествен език (например: "Какво знаем за".) Системи, които реализират тематични каталози за лесно извличане и т.н. Освен това, почти всички системи са се опитали да съдържание добив страница, за да се подобри качеството на търсене и показване на съответната информация.







Всички търсачки (търсене, търсещи машини) са разделени в търсачки (роботи, показатели) и директории за търсене. Разбиране на разликата между тях ще бъде много полезно при избора на инструмент за търсене. Търсачките - система, състояща се от 2 части. Един от тях (той работи на потребителя) търси в тяхната директория на уеб-страници (наречен "индекс"). Другата част - е сложна програма, която непрекъснато комуникира с уеб сървъри по целия свят, да ги зарежда с всички налични документи и анализи на съдържанието включва документи в индекса. Тази част от системата се нарича "паяците", (с гъсенични вериги, паяк - "слайдер"). Всяка търсачка има своя собствена "паяк" със собствените си "навици". Всяка система за индексиране на страниците ни специален начин, както и приоритети при търсене на индексите са различни, също. Ето защо, като запитване за определени ключови думи или изрази, ще имаме различни резултати за всяка от търсачките.

За разлика от търсачките, директории търсене на информация се добавят само по инициатива на потребителя. Page добавен в добре дефинирана раздел на каталога, който е свързан с този въпрос, осветената страницата. От тези участъци се формира мощен Index, да преминем към който може да се намери на страницата повече или по-малко популярна тема. Въпреки това, не е задължително да отидете на теми във всеки добър директория е система за търсене, който също може да въведете ключови думи, което значително намалява времето, прекарано от потребителя.







Също така, има някои търсачки (Excite, Infoseek), които са в притежание на и каталог. В съответствие с това на индекса за добив на "паяците", търсачката себе си и директория актуализирана система модераторите.

Понякога интернет има пълен текст търсачки (пълен текст на търсачката). Те индекс всичко думи и фрази на страница и да вземе предвид тяхната цел. За разлика от абстрактните търсачки за определена алгоритъм създава "екстракт" индексираната страница, което значително опростява задачата за търсене на потребителя.

Глобални търсачки и директории е вече доста добре познати по целия свят, дори и тези, които едва ли знае нищо за развитието на компютъра, и още повече, интернет-технологии. Всяка година техните услуги се обръщат все повече и повече хора, но тук възниква въпросът: "Какво да се търси" Отговорът на този въпрос е много прост и кратък.

Най-често в интернет е за търсене на ключови думи, т.е. търсене на документи, които съдържат точно определен текст.

По-рядко срещани търсене с помощта на операнди на Булева алгебра, като AND, NOT и OR. Използването на операнди значително повишава ефективността на търсене. Ако влезе в заявка за търсене на двигателя: (голям или дебел) с богата и (НЕ умен). Ще получим връзки към страници, които отговарят на следните критерии:

  • съдържа думата "богат";
  • съдържат или "дебели" или "голям";
  • Те не съдържат думата "умен".

Новото в областта на интернет търсене - търсене Proximity (търсене в зависимост от разстоянието). Това търсене, в които потребителят показва на какво разстояние между тях трябва да се постави на ключови думи в документа. Например, за руски език търсачката "Яндекс" (www.yandex.ru), когато бъдете подканени: "мазнини / богата 4" Трябва да се намери документи, които съдържат думата "мазнини", а думата "богат", а разстоянието между тях трябва да бъде да бъде не повече от четири думи.

Друг търсене - напреднал заявка (Query Разширяване) - в процеса на изграждане на нова заявка въз основа на предишната. Например, един от най-популярните търсачки - AltaVista (www.altavista.com) - позволява да обезвреди хилядите търсене Списък резултати чрез заличаване от тях документи, според определени критерии.

Търсене в специфични области (Търсене по Field) ви позволява да търсите не само за целия HTML-документа, но и селективно върху определени области. Например, можете да търсите в заглавието на документа (заглавие), в този случай, се взема предвид само ключовите думи, намерени е заглавието на документа.

Има поле за търсене ALT IMG тагове, търсенето се използва за намиране на изображения в Интернет за конкретна тема.

Изхождайки (Изхождайки): способността на системата да търси думи в документа не е само в строго определени форма, но също така и във всичките си морфологични форми. Така например, не само "отиде", но "е", "ходене" и т.н. Изрично пример за това търсене - каталога на "Yahoo!".

В Интернет свят търсене има такова нещо като "Тежест" (с тежест фактор). Той засилва значението на документа, а не само от сумата, която съдържа ключови думи, но и от мястото в документа. По-голяма "тежест" са думи в заглавието на страницата, думите разделят тагове , , , думи, които са в близост до таговете и документ.

При търсене на даден потребител може да показва, че е важно системата на дадена дума в заявка. Например, в "Rambler" при поискване "-Koza ++ Вол" при издаването на резултатите от най-подходящи ще получите страници, съдържащи "овца", по-малка - ". Козелът"