06.06.2026 | Lesezeit: ca. 5 Minuten

Filter-URLs als Duplikat-Quelle — Crawl-Budget schonen

Wenn ein Filter Hunderte Adressen baut

Eine Produktliste mit ein paar Filtern wirkt harmlos. Farbe, Größe, Preis, dazu eine Sortierung nach Beliebtheit oder Datum. Doch jede dieser Auswahlmöglichkeiten hängt einen kleinen Zusatz an die Webadresse, und genau dort beginnt das Problem.

Hinter dem Fragezeichen in einer URL stehen Parameter, und Filter füllen sie fleißig. Sechs Farben mal vier Größen mal drei Sortierungen sind schon 72 Adressen, die fast denselben Inhalt zeigen. Bei Onlineshops und großen Listen entstehen so schnell Tausende. Für Dich als Betreiber ist das unsichtbar, für Google nicht.

Wie aus drei Filtern Hunderte Adressen werden

Ein Filter verändert die angezeigte Auswahl, aber nicht zwingend die Adresse im sichtbaren Menü. Im Hintergrund schreibt das System trotzdem eine eigene URL, an die sich der gewählte Wert anhängt. Klickst Du zwei Filter, kombiniert das System beide. Klickst Du sie in anderer Reihenfolge, entsteht oft noch eine weitere Variante derselben Auswahl.

Das eigentliche Problem ist die Multiplikation. Jeder zusätzliche Filter vervielfacht die Zahl der möglichen Kombinationen, statt sie nur zu erhöhen. Eine Kategorie mit zwanzig sinnvollen Filterwerten und einer Sortierung erzeugt mehr Adressen, als ein Mensch je manuell anklicken würde.

Suchmaschinen folgen diesen Links aber automatisch. Sie sehen jede Kombination als eigene Seite und versuchen, sie zu erfassen. So wächst aus einer überschaubaren Liste ein Geflecht aus Hunderten Adressen, die sich inhaltlich kaum unterscheiden.

Warum fast gleiche Seiten Deinem Ranking schaden

Wenn zehn Adressen praktisch denselben Inhalt zeigen, muss Google entscheiden, welche davon in den Suchergebnissen erscheint. Diese Entscheidung trifft die Suchmaschine selbst, und nicht immer fällt sie auf die Adresse, die Du eigentlich ranken lassen willst.

Schlimmer wiegt die Verteilung der Signale. Verlinkungen, Klicks und Relevanz, die sich auf einer starken Kategorieseite bündeln sollten, verteilen sich stattdessen auf viele schwache Varianten. Jede einzelne bleibt dadurch blasser, als die zentrale Seite sein könnte.

Das verwandt liegende Grundproblem der doppelten Inhalte beschreibe ich allgemein im Beitrag Duplicate Content vermeiden. Parameter-URLs sind die häufigste technische Quelle dafür, deshalb schaue ich hier gezielt auf sie.

Was Crawl-Budget bedeutet

Google erfasst nicht unbegrenzt viele Seiten pro Besuch. Jede Webseite bekommt grob ein Kontingent zugeteilt, wie viele Adressen der Crawler in einem Zeitraum abruft. Dieses Kontingent nennt sich Crawl-Budget.

Verschwendet Deine Seite das Budget auf Hunderte fast identische Filter-Adressen, bleibt weniger für die Seiten übrig, die wirklich zählen. Neue Produkte, frische Artikel oder geänderte Inhalte werden dann langsamer erfasst. Der Crawler war beschäftigt, aber mit dem Falschen.

Für kleine Webseiten mit wenigen Hundert Seiten spielt das selten eine Rolle. Google kommt dort ohnehin mit allem hinterher. Relevant wird das Thema erst, wenn die Zahl der erreichbaren Adressen die Zahl der echten Inhalte um ein Vielfaches übersteigt.

Canonical zeigt auf die eine echte Adresse

Das wichtigste Werkzeug gegen Parameter-Duplikate ist das Canonical-Tag. Damit sagst Du Google bei jeder Filter-Variante, welche Adresse die maßgebliche ist. Alle Signale fließen dann auf diese eine Seite, statt sich zu zersplittern.

In der Praxis verweisen die gefilterten Adressen per Canonical auf die ungefilterte Kategorieseite. Google darf die Filter-Seite weiterhin besuchen, behandelt sie aber als Variante und nicht als eigenständigen Treffer. Wie Du das sauber einrichtest, steht im Beitrag Canonical-Tags richtig setzen.

Canonical ist allerdings ein Hinweis, keine Anweisung. Google hält sich meistens daran, aber nicht zwingend. Bei sehr großen Adressmengen lohnt sich deshalb eine zweite Verteidigungslinie.

Noindex und robots.txt für die harten Fälle

Mit der Anweisung noindex hältst Du eine Seite gezielt aus dem Suchindex. Das eignet sich für Filter-Kombinationen, die niemand je gezielt suchen würde, etwa eine Sortierung nach Preis absteigend in Kombination mit drei Detailfiltern.

Die robots.txt arbeitet eine Stufe davor. Sie sagt dem Crawler, bestimmte Parameter gar nicht erst abzurufen. Das spart Crawl-Budget am wirksamsten, weil die Seiten nie geladen werden. Vorsicht ist trotzdem geboten, denn was per robots.txt gesperrt ist, kann Google auch nicht als Duplikat erkennen und dem Original zuordnen.

Eine bewährte Aufteilung sieht so aus:

Wertvolle Filter: indexierbar lassen, wenn echte Nachfrage besteht (etwa eine ganze Produktart als eigene Landingpage).
Reine Varianten: per Canonical auf die Hauptseite verweisen.
Sortierungen und endlose Kombinationen: per noindex aus dem Index halten oder per robots.txt vom Crawling ausschließen.

Welche Filter echten Suchwert haben

Nicht jede Filter-Adresse ist Ballast. Manche treffen genau das, wonach Menschen suchen. „Laufschuhe in Größe 44" oder „Sofa in Grau" sind eigenständige Suchanfragen mit echtem Volumen. Solche Seiten dürfen ruhig indexiert bleiben und als eigene Landingpage Rankings sammeln.

Die Kunst liegt in der Trennung. Ein Filter, der einer realen Suchanfrage entspricht, verdient eine eigene, optimierte Seite mit eigenem Titel und eigener Beschreibung. Ein Filter, der nur eine Sortierreihenfolge ändert, verdient keinen eigenen Platz im Index.

Diese Unterscheidung triffst Du am besten anhand der tatsächlichen Suchnachfrage, nicht anhand der technischen Machbarkeit. Was niemand sucht, muss auch nicht im Index stehen.

Ab wann das Thema Dich betrifft

Eine Visitenkarten-Webseite mit zehn Unterseiten hat keine Filter und kein Parameter-Problem. Ein Blog mit fünfzig Beiträgen meistens auch nicht. Hier lohnt der Aufwand nicht, und Google kommt mühelos mit allem hinterher.

Kritisch wird es bei Onlineshops, Immobilien- oder Stellenportalen, Veranstaltungskalendern und überall dort, wo Listen filter- und sortierbar sind. Sobald Du in der Search Console deutlich mehr erfasste als gewünschte Adressen siehst, ist der Zeitpunkt gekommen, hinzuschauen.

Ein guter erster Blick ist der Bericht zur Seitenindexierung. Tauchen dort massenhaft Adressen mit Fragezeichen und Parametern auf, weißt Du, dass der Filter-Wildwuchs bei Dir angekommen ist.

Welches Gespräch Du zu Deinen Filter-URLs anstößt

Du musst die Technik nicht selbst umsetzen, aber Du solltest das richtige Gespräch anstoßen. Frag konkret, wie Filter- und Sortier-URLs auf Deiner Seite behandelt werden und ob ein Canonical auf die Hauptkategorie gesetzt ist.

Hilfreiche Fragen sind außerdem, welche Filter als eigene Landingpages indexiert werden sollen und welche Parameter besser per noindex oder robots.txt aus dem Index bleiben. Wenn die Antwort lautet, dass alle Kombinationen frei crawlbar sind, lohnt ein genauerer Blick.

Eine barrierearme und zugleich saubere Umsetzung von Filtern beschreibe ich im Beitrag Filter und Facetten für alle. Dort geht es um die Bedienbarkeit, hier um die Sichtbarkeit, und beides gehört zusammen.

Fazit

Filter und Sortierungen sind nützlich für Deine Besucher und tückisch für Suchmaschinen. Aus einer schlanken Liste werden schnell Hunderte fast gleicher Adressen, die Rankings verwässern und Crawl-Budget binden.

Die Lösung ist überschaubar. Eine maßgebliche Adresse per Canonical festlegen, wertlose Kombinationen per noindex oder robots.txt aussortieren und die wenigen Filter mit echter Suchnachfrage gezielt als eigene Seiten pflegen. So bleibt für Google sichtbar, was zählt, und Deine starken Kategorieseiten behalten ihr volles Gewicht.

Zurück