Thursday, March 3, 2022

Crawling parametrisierter doppelter Inhalte blockieren – Search Console-Hilfe [gg-webmasters-de]

Blockieren Sie das Crawlen parametrisierter doppelter Inhalte

Wann und wie Sie das URL-Parameter-Tool verwenden

URL-Parameter und Duplicate Content

Wenn Ihre Website URL-Parameter für unbedeutende Seitenvariationen verwendet (z. B. color=red vs color=green ) oder wenn Ihre Website Parameter verwendet, die im Wesentlichen denselben Inhalt mit unterschiedlichen URLs anzeigen können (z. B. example.com/shirts?style=polo,long-sleeve und example.com/shirts?style=polo&style=long-sleeve ), crawlt Google Ihre Website möglicherweise ineffizient.

Hier ist ein Beispiel für URLs, die im Wesentlichen zu doppelten Inhalten führen, die sich nur durch unterschiedliche Parameter unterscheiden:

URL Beschreibung
https://example.com/products/women/dresses/green.html Statische, nicht parametrisierte Seite
https://example.com/products/women?category=dresses&color=green Die URL verwendet die Parameterkategorie und category , um denselben Inhalt wie eine nicht parametrisierte Seite color .
https://example.com/products/women/dresses/green.html?limit=20&sessionid=123 Die URL enthält Parameter, um die Anzahl der Ergebnisse zu begrenzen, und eine Sitzungs-ID, damit der Benutzer denselben Inhalt anzeigen kann.

Wenn Sie viele solcher URL-Parameter auf Ihrer Website haben, können Sie davon profitieren, wenn Sie das URL-Parameter-Tool verwenden, um das Crawlen doppelter URLs zu reduzieren.

Wichtig: Wenn Ihre Website Duplicate Content ohne Verwendung von Parametern an verschiedene URLs liefert , sollten Sie eine kanonische Seite definieren, anstatt das Crawling zu blockieren, wie auf dieser Seite beschrieben.

Blockieren Sie das Crawlen von URLs, die bestimmte Parameter enthalten

Sie können Google daran hindern, URLs zu crawlen, die bestimmte Parameter oder Parameter mit bestimmten Werten enthalten, um das Crawlen doppelter Seiten zu vermeiden.

Anforderungen

Sie sollten das URL-Parameter-Tool nur verwenden, wenn Ihre Website ALLE der folgenden Anforderungen erfüllt.

  • Ihre Website hat mehr als 1.000 Seiten UND
  • In Ihren Protokollen sehen Sie eine erhebliche Anzahl doppelter Seiten, die vom Googlebot indexiert werden, wobei sich alle doppelten Seiten nur durch URL-Parameter unterscheiden (z. B.: example.com?product=green_dress und example.com?type=dress&color=green ).
Warnung vor falscher Verwendung
Sie sollten das URL-Parameter-Tool nur verwenden, wenn Ihre Website die oben genannten Anforderungen erfüllt und Sie ein erfahrener SEO sind. Die falsche Verwendung des URL-Parameter-Tools kann dazu führen, dass Google wichtige Seiten auf Ihrer Website ignoriert, ohne Warnung oder Meldung über ignorierte Seiten. Wenn sich das ein wenig schlimm anhört, liegt es daran, dass viele Leute das Tool missbrauchen oder es unnötigerweise verwenden. Wenn Sie sich nicht sicher sind, ob Sie dieses Tool richtig verwenden, sollten Sie es besser nicht verwenden.

    Verwendungszweck

    Sie können das Verhalten von Google beim Crawlen Ihrer Website mit bestimmten Parametern festlegen. Das Parameterverhalten gilt für die gesamte Eigenschaft; Sie können das Crawling-Verhalten für einen bestimmten Parameter nicht auf eine bestimmte URL oder einen Zweig Ihrer Website beschränken.

    So verwenden Sie das URL-Parameter-Tool:

    1. Stellen Sie sicher, dass Ihre Website die zuvor aufgeführten Anforderungen erfüllt.
    2. Öffnen Sie das URL-Parameter-Tool .
    3. Bearbeiten Sie entweder einen vorhandenen Parameter oder klicken Sie auf Parameter hinzufügen , um einen neuen zu erstellen. Beachten Sie, dass bei diesem Tool zwischen Groß- und Kleinschreibung unterschieden wird . Geben Sie Ihren Parameternamen also genau so ein, wie er in Ihrer URL erscheint.
    4. Geben Sie an, ob sich Ihr URL-Parameter auf den Seiteninhalt auswirkt:
      • Nein: Wirkt sich nicht auf den Seiteninhalt aus : Ihr Parameter hat keinen Einfluss darauf, wie der Seiteninhalt dargestellt wird. Diese Art von Parametern kann verwendet werden, um Besuche und Referrer zu verfolgen, hat aber keinen Einfluss auf den eigentlichen Inhalt der Seite. Beispiel: sessionID oder userName . Wenn Google viele URLs findet, die sich nur in diesem Parameterwert unterscheiden, wird eine davon gecrawlt. Google versucht, diese Arten von Parametern zu erkennen, aber wenn Ihre Protokolle darauf hindeuten, dass wir diesen statischen Parameter nicht korrekt identifizieren, können Sie ihn hier angeben.
      • Ja: Seiteninhalt ändern, neu anordnen oder einschränken : Ihr Parameter kann den Seiteninhalt ändern. Beispiele könnten brand , gender , country oder sortorder . Wählen Sie den Zweck des Parameters:
        • Sortierungen (z. B. sort=price_ascending ) : Ändert die Reihenfolge, in der Inhalte angezeigt werden.
        • Verengt (z. B. t-shirt_size=XS ): Filtert den Inhalt auf der Seite.
        • Spezifiziert (z. B. store=women ): Bestimmt die allgemeine Inhaltsklasse, die auf einer Seite angezeigt wird. Wenn dies ein genaues Element angibt und dies die einzige Möglichkeit ist, diesen Inhalt zu erreichen, sollten Sie "Jede URL" für das Verhalten auswählen.
        • Übersetzt (z. B. lang=fr ): Zeigt eine übersetzte Version des Inhalts an. Wenn Sie einen Parameter verwenden, um verschiedene Sprachen anzuzeigen, möchten Sie wahrscheinlich, dass Google die übersetzten Versionen mit hreflang crawlt, um Sprachvarianten Ihrer Seite anzuzeigen, anstatt Inhalte mit diesem Tool zu blockieren.
        • Seitenzahlen (z. B. page=2 ): Zeigt eine bestimmte Seite einer langen Auflistung oder eines langen Artikels an.
        • Welche URLs mit diesem Parameter soll der Googlebot crawlen? Wählen Sie eine Option aus, um das Verhalten von Google beim Auffinden von URLs anzugeben, die diesen Parameter enthalten:
          • Googlebot entscheiden lassen : Diese Einstellung ist die Standardeinstellung für bereits bekannte Parameter. Wählen Sie diese Option aus, wenn Sie sich bezüglich des Verhaltens eines Parameters nicht sicher sind oder wenn sich das Parameterverhalten für verschiedene Teile der Website ändert. Der Googlebot kann Ihre Website analysieren, um festzustellen, wie der Parameter am besten gehandhabt wird.
          • Jede URL: Weist Google an, niemals URLs mit diesem Parameter zu blockieren. URLs mit eindeutigen Werten dieses Parameters enthalten keinen doppelten Inhalt. Nachdem Sie beispielsweise diese Art von Einstellung für URLs implementiert haben, die den Parameter productid enthalten, betrachtet Google die URL http://www.example.com/dresses/real.htm?productid=1202938 automatisch als völlig anders als http://www.example.com/dresses/real.htm?productid=5853729 , weil jede URL einen anderen productid -Parameterwert hat.
          • Nur URLs mit Wert: Weist Google an, nur URLs zu crawlen, bei denen Ihr URL-Parameter auf einen bestimmten Wert gesetzt ist. URLs mit einem anderen Parameterwert werden nicht gecrawlt. Dies ist besonders nützlich, wenn Ihre Website den Parameterwert verwendet, um die Reihenfolge zu ändern, in der ansonsten identische Inhalte angezeigt werden. Beispiel: http://www.example.com/dresses/real.htm?sort=price_high enthält denselben Inhalt wie http://www.example.com/dresses/real.htm?sort=price_low . Sie können diese Einstellung verwenden, um den Googlebot anzuweisen, nur die URLs zu crawlen, bei denen sort=price_low ist, um das Crawlen des doppelten Inhalts zu vermeiden.
          • Keine URLs: Weist Google an, keine URLs mit einem bestimmten Parameter zu crawlen. Google crawlt keine URLs, die den von Ihnen eingegebenen Parameter enthalten. Beispielsweise können Sie Google anweisen, URLs mit Parametern wie pricefrom und priceto (wie http://www.examples.com/search?category=shoe&brand=nike&color=red&size=5&pricefrom=10&priceto=1000 ) nicht zu crawlen, um unnötiges Crawling zu verhindern von duplizierten Inhalten, die bereits unter http://www.examples.com/search?category=shoe&brand=nike&color=red&size=5 verfügbar sind.
    5. Wenn Ihre Website mehrere Parameter in einer URL verwendet, finden Sie weitere Informationen unter URLs mit mehreren Parametern verwalten .
    6. Beachten Sie, dass Ihre Regeln möglicherweise von anderen Eigenschaften geerbt werden (siehe Vererbung von Parameterregeln ).

    Vererbung von Parameterregeln

    Wenn Sie separate Eigenschaften für http und https oder separate übergeordnete und untergeordnete Eigenschaften haben (z. B. example.com und example.com/fr/ oder example.com und m.example.com), werden Ihre Parametereinstellungen möglicherweise zwischen vererbt Eigenschaften nach diesen Regeln:

    • http/https: Wenn nur eine Ihrer http- oder https-Eigenschaften Regeln hat, werden die Regeln auf beide angewendet. Wenn sowohl für Ihre http- als auch für Ihre https-Eigenschaften eigene Regeln definiert sind, werden nur ihre eigenen Regeln angewendet.
    • Übergeordnet/untergeordnet: Wenn eine übergeordnete Property (example.com) Parameterregeln hat, erbt jede untergeordnete Property (example.com/fr/) ohne Parameterregeln diese Regeln; Jede untergeordnete Eigenschaft mit Parameterregeln verwendet nur ihre eigenen Regeln. Beachten Sie, dass Subdomains (m.example.com) als untergeordnete Domains von übergeordneten Domains (example.com) gelten.

    Verwalten von URLs mit mehreren Parametern

    Eine einzelne URL kann viele Parameter enthalten; Sie können die Crawling-Einstellungen für jeden einzeln festlegen. Wenn eine einzelne URL mehrere verwaltete Parameter enthält, befolgt Google bei der Entscheidung, ob die URL gecrawlt wird, die folgende Regel:

    Die restriktiveren Parametereinstellungen setzen die weniger restriktiven Parametereinstellungen außer Kraft.

    Im Folgenden finden Sie beispielsweise drei URL-Parameter und ihre jeweiligen Google-Crawling-Einstellungen:

    Parameter Parameter-Crawling-Einstellungen
    shopping-category Alle URLs mit diesem Parameter crawlen
    sort-by Nur URLs mit Wert = production-year
    sort-order Nur URLs mit Wert = asc

    Beispiel 1

    http://www.example.com?shopping-category=shoes&sort-by=size&sort-order=asc .

    Google wird diese URL nicht crawlen, da der Parameter sort-by nicht auf production-year gesetzt ist, obwohl die URL einen gültigen Wert für die sort-order ( asc ) enthält.

    Beispiel 2

    http://www.example.com?shopping-category=DVD-movies&sort-by=production-year&sort-order=asc .

    Google kann diese URL crawlen, da die Werte für sort-by und sort-order mit den zulässigen Einstellungen übereinstimmen.

    Beispiel 3

    http://www.example.com/shoes/33453

    http://www.example.com?country=fr

    Google kann beide URLs crawlen, da sie keine gekennzeichneten Parameter haben.

    No comments:

    Post a Comment