Pedro Dias przeprowadził szczegółową analizę tagów kanonicznych, koncentrując się na dodatkowych atrybutach HTML i ich wpływie na interpretację przez Google. Oprócz potwierdzenia, że atrybuty takie jak „hreflang”, „lang”, „media” oraz „type” powodują ignorowanie tagów kanonicznych przez Google, przedstawił także inne często dodawane atrybuty. W swojej analizie podkreśla, że tag kanoniczny powinien być jak najprostszy, aby uniknąć problemów z kanonizacją.
Poprawna implementacja tagów kanonicznych jest kluczowa dla skutecznego indeksowania strony internetowej. Tagi te pomagają zarządzać zduplikowaną treścią i kierować wyszukiwarki na preferowaną wersję strony. Jednakże, dodanie dodatkowych atrybutów do tagów kanonicznych może wpłynąć na sposób, w jaki wyszukiwarki, w szczególności Google, interpretują te tagi.
Cel Badań
Nasze badania miały na celu odpowiedzenie na następujące pytania:
Jak Google przetwarza tagi kanoniczne z dodatkowymi atrybutami?
Które konkretne atrybuty powodują, że Google ignoruje tagi kanoniczne?
Czy inne wyszukiwarki traktują tagi kanoniczne z dodatkowymi atrybutami podobnie jak Google?
Jakie kroki mogą podjąć właściciele stron, aby zapewnić, że ich tagi kanoniczne są respektowane przez wyszukiwarki?
Metodologia
Badania przeprowadziliśmy w kilku etapach:
Scraping stron: Zebraliśmy tagi kanoniczne z 1 miliona najpopularniejszych stron.
Analiza atrybutów: Zidentyfikowaliśmy 210 unikalnych nazw atrybutów używanych w tagach kanonicznych.
Testowanie: Stworzyliśmy aplikację do generowania URL-i z różnymi kombinacjami atrybutów i sprawdziliśmy ich interpretację w Google Search Console (GSC).
Wyniki
Najczęściej Występujące Atrybuty
Nasza analiza zidentyfikowała 10 najczęściej występujących atrybutów w tagach kanonicznych, które Google nie uznaje za problematyczne:
| Atrybut | Liczba wystąpień |
|---|---|
| data-react-helmet | 3348 |
| itemprop | 2902 |
| data-n-head | 1423 |
| data-rh | 967 |
| id | 837 |
| data-senna-track | 610 |
| data-hid | 576 |
| data-baseprotocol | 393 |
| data-basehost | 392 |
| class | 335 |
Z kolei atrybuty znane z tego, że powodują ignorowanie tagów kanonicznych przez Google, występowały w naszej próbce w następujących ilościach:
| Atrybut | Liczba wystąpień |
|---|---|
| hreflang | 3196 |
| type | 889 |
| media | 421 |
| lang | 8 |
Interpretacja przez Google
Testy wykazały, że:
Google ignoruje tagi kanoniczne zawierające atrybuty hreflang, lang, media oraz type.
Inne atrybuty, które nie są wymienione w dokumentacji Google, nie wpływają na rozpoznawanie tagów kanonicznych.
Ograniczenia Narzędzi SEO
Wyniki naszego badania wskazują, że wiele popularnych narzędzi SEO nie wykrywa problematycznych atrybutów w tagach kanonicznych. Może to prowadzić do niezauważonych problemów z kanonizacją, co może wpłynąć na skuteczność SEO.
Rekomendacje
Na podstawie naszych badań zalecamy:
Uproszczenie tagów kanonicznych: Unikaj zbędnych atrybutów, używaj tylko rel i href.
Unikanie atrybutów takich jak id, name, czy content: Mogą stać się zarezerwowanymi słowami w przyszłości.
Weryfikacja tagów kanonicznych: Korzystaj z narzędzi takich jak Google Search Console do regularnej kontroli tagów kanonicznych.
Podsumowanie
Nasze badania pokazują, jak istotne jest właściwe implementowanie tagów kanonicznych, szczególnie w kontekście dodatkowych atrybutów. Ważne jest, aby uprościć strukturę HTML tagów kanonicznych i regularnie je weryfikować, aby zapewnić ich skuteczność w procesie indeksowania.
Poprawna implementacja tych zaleceń pomoże uniknąć potencjalnych problemów z kanonizacją, co w efekcie może wpłynąć na lepsze pozycjonowanie strony w wynikach wyszukiwania.
Źródło: https://merj.com/blog/how-extra-html-attributes-in-canonical-tags-impact-search-engines
