statystyki indeksowania i logi serwerowe w GSC

Jak korzystać ze statystyk indeksowania w Search Console?

Od niedawna w narzędziu Search Console możesz zobaczyć, w jaki sposób Google odwiedza Twoją stronę. To swoiste logi serwerowe, dzięki którym techniczne SEO jest teraz dla każdego. Przynajmniej w podstawowym zakresie.

Czym są logi serwerowe?

Logi z serwera to zapis wydarzeń, które wywołali użytkownicy lub boty korzystający z zasobów serwera. Gdy odwiedzasz jakąś stronę, serwer zapisuje takie dane, jak:

  • przeglądarka, z której korzystasz,
  • adres IP,
  • zdarzenia, które wywołujesz (np. otwarcie strony),
  • odpowiedzi serwera.

W tych logach znajdują się też odnotowane wizyty botów, w tym Google. Jednak nie każdy ma dostęp do logów serwerowych, i nie każdy potrafi je opracować poprawnie.

Na szczęście Google też zapisuje te wizyty i Ci je udostępnia w raporcie GSC. To cenna informacja, bo dla SEO ważne jest, jakie strony, jak często i z jakim rezultatem odwiedza bot Google.

Teraz te dane znajdziesz (w uproszczonej formie) w Google Search Console w raporcie indeksowania (zakładka ustawienia)!

raport GSC indeksowania - host

Search Console – podstawowe narzędzie SEO

Logi serwerowe dla SEO

Jednym z wyzwań SEO jest odpowiednie skupienie uwagi komputerów Google na właściwych stronach. To współczesny problem, który wynika po prostu z ogromnej skali stron, które są generowane przez serwisy czy sklepy www.

Nawet Google nie jest w stanie odwiedzić ich wszystkich. Dla przykładu Allegro ma 46 milionów zindeksowanych stron.

skala serwisu - logi serwerowe

A ile możliwych stron ma ten serwis? Miliardy, jeśli weźmiemy pod uwagę możliwe kombinacje tysięcy filtrów z kategoriami.

Dlatego zadaniem specjalisty SEO w przypadku dużych serwisów jest kontrola tego, co i kiedy odwiedza bot Google. Poprzez dyrektywy w meta danych, pracę z robots.txt, a także bardziej zaawansowane techniki może zadbać, by Google regularnie wchodził na ważne biznesowo strony.

Logi pełnią też funkcję kontroli „zdrowia” komunikacji między serwerami Google a naszym. Nawet, jeśli użytkownik dostaje treści bez przeszkód odwiedzając witrynę, to Google może być blokowany, albo trafiać na błędy, których nie dostrzeżemy. To może całkowicie wyeliminować Twoje szanse na ruch organiczny. W logach serwera te problemy widać od razu.

Jak pracować z danymi statystyk indeksowana?

Tak, jak w przypadku większości raportów w narzędziu, ta sekcja jest też tylko do wglądu. Google zgłasza Ci tu problemy, którymi musisz się zająć.

Stan hosta

W pierwszej kolejności zajrzyj do raportu „stan hosta”. W nim zobaczysz wszelkie problemy w komunikacji Google i Twój serwer.

stan hosta w raporcie indeksowania Gogle

Najważniejsza będzie łączność z serwerem. W tym raporcie zobaczysz, jak często Google napotykał problemy z pobieraniem danych z Twojej strony. Jeśli w raporcie widzisz liczne nieudane próby indeksowania, może to oznaczać, że Twój serwer nie jest w stanie obsłużyć większego ruchu lub jest źle skonfigurowany.

łączność z serwerem w Search Console

Ten raport pozwoli Ci, bez specjalistycznej wiedzy, domagać się od administratora serwera lub dostawcy hostingu działań. Łatwo zweryfikujesz ewentualne poprawki.

Pamiętaj, że
jeśli Google nie może zindeksować treści, nie będzie ich wyświetlał w wynikach wyszukiwań. Twoja praca z optymalizacją czy link buildingiem będzie wtedy bez znaczenia.

Wykres odwiedzin Google

Następnie przyjrzyj się wykresowi odwiedzin Google.

statystyki odwiedzin bota w GSC

Na tym wykresie zobaczysz, ile czasu zajmuje serwerowi odpowiedź na żądanie pobrania strony. To nie jest całkowity czas pobierania strony, ale i tak, im krótszy czas, tym lepiej.

Bardzo ważna jest łączna ilość żądań, czyli budżet indeksowania (crawl budget). Im więcej jest zapytań, tym lepiej. Chcesz, by Google regularnie pobierał strony i odświeżał je w swoim indeksie.

Tak, jak w przypadku wykresu w raporcie skuteczności, niebieska linia powinna mieć tendencję wzrostową wraz z rozrostem Twojego serwisu.

Statystyki według odpowiedzi serwera

statystyki odwiedzin według odpowiedzi serwera

W tym raporcie Google podsumowuje to, jak Twój serwer odpowiada na prośby. Dominować powinny odpowiedzi OK 200, czyli serwer wysłał potrzebne informacje, lub Nie zmodyfikowano (304), czyli serwer zgłosił, że nic się na stronie nie zmieniło i nie trzeba jej jeszcze raz pobierać.

Mogą też pojawić się statusy Przeniesiono na stałe (301). To jeden z tych statusów, który jest narzędziem pracy specjalisty SEO. Zobaczysz go w większej ilości, gdy będziesz np. zmieniać strukturę kategorii i robić przekierowania ze starych na nowe adresy URL. Ten status może być złym lub dobrym sygnałem zależnie od sytuacji!

Podobnie jest ze statusem Nie znaleziono (404), który z reguły jest złym sygnałem, i widząc go w raporcie Search Console, reaguj. Jednak, jeśli niedawno zniknęła duża ilość stron w serwisie (celowo, bo np. był to spam), ten status jest pożądany i znaczy tylko tyle, że bot dostał informację o kasacji stron.

Każdą grupę możesz kliknąć, by zobaczyć jakie konkretnie adresy były przez Google odpytywane.

lista adresów url z raportu statusu odpowiedzi serwera w GSC

To bardzo pomocne, jeśli np. nagle zauważysz wzrost udziału odpowiedzi 301 w tym raporcie. Po kliknięciu w listę, dowiesz się, co to za strony są przekierowane. Możesz sprawdzić status każdej z nich.

sprawdzanie url w raporcie indeksowania

 

Najgorszym statusem jest Błąd serwera (5xx), czyli po prostu coś poszło nie tak i serwer nie odpowiedział poprawnie.

Możesz też zobaczyć status: Żądania indeksowania: Plik robots.txt jest niedostępny. Będzie to oznaczało, że Google nie mógł otworzyć pliku robots.txt z dyrektywami, a brak dyrektyw może znacznie utrudnić indeksację stron, więc reaguj.

Podstawy dyrektyw dla botów w SEO

Statystyki według przeznaczenia

W tym prostym raporcie dostaniesz najcenniejszą wiedzę o tym, jak Google traktuje Twój serwis.

raport indeksowania według przeznaczenia w GSC

To proste. Google mówi Ci, ile stron odwiedza, by odświeżyć ich treść, a ile znajduje po raz pierwszy. Zajrzyj do raportu wykrywalności, a dowiesz się, czy boty Google wyszperały w zakamarkach serwera jakieś zbędne, dziwne strony.

Jeśli jest tego dużo – reaguj. Musisz zablokować Google dostęp do tych zbędnych stron. Jak? Poprzez zarządzanie linkowaniem wewnętrznym, bo głównie przez linki Google natrafia na te strony.

Linkowanie wewnętrzne w SEO

Z drugiej strony, jeśli w ofercie pojawił się nowy produkt, albo wpis na blogu, to z tego raportu dowiesz się kiedy Google wykryje Twoją pracę. Bardzo przydatne do określania „zdrowia” Twojego budżetu indeksowania (crawl budget).

Statystyki według typu Googlebota

W tym raporcie Google mówi Ci, jaki rodzaj bota (i w jakim celu) odwiedza Twoją stronę. Przede wszystkim zwróć uwagę na to jaki procent indeksowania odbywa się przez smartfony, a ile przez wersję na komputery.

Jeśli większa część indeksu odbywa się przez telefony – Twoja witryna przeszła na indeks mobilny (Mobile First Indexing).

Potwierdzisz to w głównym oknie ustawień. Google Ci to napisze wprost :)

indeks mobilny w raporcie GSC

Ostatnim raportem jest ten według typu pliku. Ten raport zostaw już specjalistom SEO!

Podsumowanie

Dzięki nowemu raportowi w Google Search Console każdy może zweryfikować swój budżet indeksowania, poprawność komunikacji na linii botów i serwera, a także ocenić, jak Google określa priorytety. To widać po skali indeksowania poszczególnych stron. Im częściej są indeksowane, tym stanowią większą wartość dla Google.

Wykorzystaj tę wiedzę!

Share: