Wyszukiwarka umożliwia nam organizowanie informacji i wyszukiwanie informacji w sieci WWW. Wyszukiwarka to program komputerowy, który pomaga nam przesłać zapytanie, które składa się ze słowa lub frazy opisującej unikalne informacje, które próbujemy zlokalizować w sieci. Wyszukiwarka następnie znajduje w swojej bazie danych próbę dopasowania zapytania. Zestawia i zwraca listę adresów URL zawierających prezentacje pasujące do naszego zapytania. Ta lista jest uporządkowana lub uszeregowana według lepszych dopasowań pojawiających się u góry. Ogólna wyszukiwarka pobiera informacje z bazy danych, która zawiera informacje w szerokim zakresie tematów.
Jak działa wyszukiwanie
Wyszukiwarka pobiera swoje informacje za pomocą zbieracza, programu przechodzącego przez WEB i zbierającego informacje o dokumentach sieci Web. Wiele osób może nie uważać wyszukiwarek za łatwe w użyciu, ponieważ spodziewają się zawężonej listy adresów URL, które mogą uprościć ich wyszukiwanie. Aby zawęzić wyszukiwanie, używamy techniki zwanej przeszukiwaczem sieci. Robot sieciowy (znany również jako web spider lub robot sieciowy) to program lub automatyczny skrypt, który przegląda WWW w sposób metodyczny, zautomatyzowany. Innymi rzadziej używanymi nazwiskami robotów sieciowych są mrówki, automatyczne indeksatory, roboty i robaki.
Ten proces nazywa się indeksowaniem w Internecie lub spideringiem. Wiele witryn, w szczególności wyszukiwarek, wykorzystuje spidering jako sposób dostarczania aktualnych informacji. Przeszukiwacze internetowe są używane głównie do tworzenia kopii wszystkich odwiedzanych stron w celu ich późniejszego przetworzenia przez wyszukiwarkę, która zaindeksuje pobrane strony, aby zapewnić szybkie wyszukiwanie. Przeszukiwacze mogą być również wykorzystywane do automatyzacji zadań związanych z konserwacją na stronie internetowej, takich jak sprawdzanie łączy lub sprawdzanie poprawności kodu HTML. Ponadto przeszukiwacze mogą być używane do pobierania określonych typów informacji ze stron internetowych, takich jak zbieranie adresów e-mail (zazwyczaj w przypadku spamu). Niedawny wzrost liczby stron generowanych przez języki skryptowe po stronie serwera spowodował również trudności w tym, że istnieją nieskończone kombinacje parametrów HTTP GET, a tylko niewielki wybór rzeczywiście zwróci unikalne wyniki.
Podsumowując, ranking stron internetowych zależy od wielu czynników. Najbliżej dopasowane słowa kluczowe witryny, najczęściej odwiedzane i popularne witryny. Zapytują, które są wysyłane, są przetwarzane przez wyszukiwanie słów kluczowych, przechowywane w metatagu strony. Niezależnie od najlepszego dopasowania, które znajdzie, jest ono sortowane i zwracane z powrotem do użytkownika. Jak działa wyszukiwarka Google Zacznijmy od mniejszego silnika: InfoSeek. Indeksują tylko około 200 słów Twojej strony, dlatego ważne jest, aby upewnić się, że masz metatagi na swojej stronie i że najważniejsze rzeczy są wymienione jako pierwsze. Informacje, które umieścisz w swoich metatagach, będą używane do wyświetlania opisu Twojej witryny, a większość metatagów może zawierać około 200 znaków tekstu. Metatag słów kluczowych może mieć maksymalnie 1000 znaków.
Te proste zasady są ważne, o których należy pamiętać w przypadku wszystkich wyszukiwarek. Im ważniejsze są te informacje, tym bliżej początków metatagów, a nawet początku zawartości witryny. Wiele wyszukiwarek nawet nie dotknie twoich znaczników meta, więc ważne jest, abyś miał te same informacje w swoim ciele, które masz w swoich metatagach (chociaż oczywiście nie możesz po prostu wpisywać list i list słów kluczowych, ponieważ byłoby to szkodliwe dla zawartość twojej strony).
Wyszukiwarka AltaVista wyśle Scooter, jego pająka, aby sprawdzić całą witrynę. Skuter może trwać nawet trzy miesiące, aby spider i w pełni indeksować witrynę? przeciętny pająk zajmuje tylko 6-8 tygodni. Scooter zwykle spakuje co tydzień od dwóch do dziesięciu stron z Twojej witryny. Oznacza to, że im dłużej trwa Twoja strona, tym lepiej będzie ona indeksowana, co jest przykładem tego, jak wyszukiwarki wykorzystują teorię Darwina do swojej ideologii.
Ekscytacja była kiedyś wyszukiwarką, ale została odrzucona jako dostawca wyszukiwania AOL i Netscape, więc jest mniej ważna niż kiedyś. Algorytm, którego używa do określenia istotności słowa kluczowego jest bardzo skomplikowany: indeksuje twoje strony, a następnie próbuje je podsumować, wybierając tylko najbardziej trafne zdania. Spodziewaj się, że twoje strony będą przeglądane mniej więcej raz na dwa tygodnie. Należy jednak pamiętać, że z metatagami nie mają znaczenia Excite, jeśli chodzi o rankingi, nawet jeśli będą używać tagów opisowych, o ile są one odpowiednie dla twoich stron. zawartość.
Przejdźmy do Lycos. Lycos w pełni zintegrował projekt Open Directory (ODP) z głównymi stronami wyników, a także korzysta z wyników wyszukiwania z AllTheWeb. Lycos uruchamia również kliknięcia do swojej siostrzanej strony HotBot. Lycos jest jedną z trudniejszych wyszukiwarek do zrozumienia, ponieważ strony z ich zgłoszeniami mówią jedno, ale potem indeksują twoją witrynę w zupełnie inny sposób. Zasadniczo Twoja witryna zostanie zaindeksowana w Lycos w odpowiednim czasie, o ile zostanie zaindeksowana w ODP i AllTheWeb.
Mimo że WebCrawler jest własnością Excite, wciąż ma własną wyszukiwarkę i indeks. Jeśli zdarzy ci się, że jesteś na liście z WebCrawlerem, powinieneś spróbować pozostać na liście, ponieważ nie jest to najłatwiejsza wyszukiwarka, którą możesz zamieścić na liście. Jego trafność w połączeniu ze sporadycznymi metodami indeksowania sprawia, że proces składania zgłoszeń jest trudny, choć nie niemożliwy.
Największym graczem jest oczywiście Google, który używa systemu rankingu stron jako centralnej podstawy swojego indeksu. Kiedyś prawie niemożliwe było manipulowanie systemem rankingu stron, aby podnieść ranking, ale ludzie szybko zorientowali się, że im więcej linków mogą wygenerować na swojej stronie w reszcie sieci, tym lepszy ranking Google. Uważa się, że Google nie wykorzystuje rankingów uwzględniających kontekst. Informacje kontekstowe są wykorzystywane w Yahoo, Looksmart i ODP, a Google regularnie odwiedza te witryny, gdy ponownie indeksuje swoją własną bazę danych.
MSN to kolejna ważna wyszukiwarka. Trójcy wyszukiwarek w tej chwili jest Google, Yahoo !, i MSN. Te trzy wyszukiwarki łączą się, aby zapewnić Ci znaczną większość ruchu, który otrzymasz z wyszukiwarek. MSN będzie na ogół pierwszą wyszukiwarką, która zaindeksuje twoją witrynę i prawie na pewno wymieni większość stron najszybciej.
Chociaż nikt nie jest w stanie dokładnie określić, kiedy zostanie zaindeksowany w dowolnej wyszukiwarce, najlepiej sprawdzić co najmniej raz w tygodniu. Cokolwiek jednak robisz, nie przesyłaj ponownie witryny częściej niż co dwa miesiące? możesz w ogóle nie zostać zaindeksowanym, jeśli to zrobisz.