DTILE Technisches SEO Crawl Budget Optimierung
Technisches SEO · Crawl Budget · Googlebot · Indexierung · 2026

Crawl Budget —
warum Google wichtige
Seiten übersieht.

Googlebot hat ein Limit. Wenn deine Website zu viel Crawl-Aufwand für irrelevante Seiten verschwendet, werden wichtige Seiten seltener gecrawlt — und ranken schlechter. Crawl Budget Optimierung ist der unterschätzte technische SEO-Hebel für Websites mit vielen URLs.

🕷️ Crawl Budget — Beispielaufteilung
So wird Crawl Budget typischerweise verteilt:
Wichtige Seiten (Hub + Commercial)→ sollte ~70%
⚠️ Tatsächlich oft: nur 35%
URL-Parameter / Filter→ sollte ~0%
⚠️ Oft: 40% Verschwendung
Thin Content / dünne Seiten→ sollte ~0%
Sonstige (404, Redirects)→ sollte ~5%
Was ist Crawl Budget?

Crawl Budget — warum Googlebot nicht alle
Seiten deiner Website crawlt

Crawl Budget — Definition (DTILE) Crawl Budget bezeichnet die Menge an Crawl-Ressourcen die Googlebot einer bestimmten Website zuweist — konkret: wie viele Seiten Googlebot in einem gegebenen Zeitraum crawlen wird. Es ergibt sich aus Crawl Rate Limit (Serverkapazität) und Crawl Demand (Googles Interesse an einem erneuten Crawl). Wer das Crawl Budget mit irrelevanten Seiten verschwendet, riskiert dass wichtige Seiten seltener gecrawlt und schlechter indexiert werden. Entität: Crawl Budget · Attribut: Definition · Wert: Zugeteilte Crawl-Ressourcen von Googlebot — Funktion aus Rate Limit und Crawl Demand

Googlebot crawlt nicht einfach jede Seite jeder Website täglich neu. Es hat ein Budget — und das verteilt es nach Priorität. Große, autoritative Domains mit vielen Backlinks bekommen mehr Crawl-Budget als neue kleine Sites. Innerhalb einer Domain entscheidet Googlebot welche Seiten gecrawlt werden basierend auf ihrer internen Verlinkung, PageRank und Aktualitätssignalen.

Das Problem entsteht wenn eine Website Crawl-Budget mit nutzlosen Seiten verschwendet: URL-Parameter, Filter-URLs, dünne Seiten ohne Content, Redirect-Ketten oder hunderte technisch duplizierter Seiten. Googlebot crawlt diese irrelevanten URLs — und kommt dann nicht mehr dazu die wirklich wichtigen Seiten häufig genug zu crawlen.

💡 Crawl Budget ist die Menge an Crawl-Ressourcen die Googlebot einer Website zuweist. Wenn irrelevante Seiten (URL-Parameter, dünne Inhalte, Duplicate Content) das Budget verschwenden, werden wichtige Seiten seltener gecrawlt — was Rankings und Indexierung direkt schadet. Crawl Budget Optimierung bereinigt diese Verschwendung.

Crawl Rate

Wie schnell Googlebot crawlt ohne Server zu überlasten

Crawl Demand

Googles Interesse an einem erneuten Crawl einer Seite

GSC

Crawl-Statistiken direkt in der Google Search Console messbar

Wann wichtig

Primär für Websites mit 1.000+ URLs und URL-Parametern

Crawl Rate Limit und Crawl Demand erklärt

Crawl Rate Limit vs. Crawl Demand —
die zwei Faktoren die das Crawl Budget bestimmen

Crawl Budget = Crawl Rate Limit × Crawl Demand. Crawl Rate Limit definiert wie schnell Googlebot crawlen darf ohne den Server zu belasten (serverseitig begrenzt). Crawl Demand beschreibt Googles Interesse an einem erneuten Crawl einer Seite — basierend auf Popularität (Backlinks, Traffic) und Aktualität (häufige Content-Updates).

Crawl Rate Limit — Serverseitig

Wie viele Anfragen Googlebot pro Sekunde an den Server senden darf ohne ihn zu überlasten. Google passt die Crawl Rate automatisch an — wenn der Server langsam antwortet, reduziert Googlebot die Rate. Kann in der Google Search Console manuell gesenkt werden (nicht erhöhen).

Erhöhen: Server-Performance verbessern, Ladezeiten optimieren — Googlebot crawlt mehr wenn Server schnell antwortet
Messen: GSC → Einstellungen → Crawl-Statistiken → Antwortzeiten
Manuell senken: GSC → Einstellungen → Crawl-Rate → nur wenn Server überlastet

Crawl Demand — Googles Interesse

Wie stark Google an einem erneuten Crawl einer Seite interessiert ist. Hoher Crawl Demand: Seite ist beliebt (viele interne/externe Links), hat sich kürzlich geändert oder ist im Index aber weit hinten. Niedriger Crawl Demand: Seite wurde kürzlich gecrawlt und hat sich nicht geändert.

Erhöhen: Wichtige Seiten häufig mit neuen Inhalten aktualisieren + mehr interne Links darauf
Schützen: Irrelevante Seiten mit noindex/robots.txt vom Crawling ausschließen
Messen: GSC → Seitenindexierung → gecrawlt aber nicht indexiert

🕷️ Wichtige Erkenntnis: Crawl Budget Optimierung bedeutet nicht primär mehr Budget für die gesamte Website zu bekommen — sondern das vorhandene Budget effizienter auf die wirklich wichtigen Seiten zu konzentrieren. Irrelevante Seiten aus dem Crawling-Prozess entfernen damit wichtige Seiten mehr Crawl-Ressourcen bekommen.

Crawl Budget analysieren und messen

Wie analysiert man das aktuelle
Crawling-Verhalten von Googlebot?

Crawl Budget analysieren: Google Search Console → Einstellungen → Crawl-Statistiken zeigt Crawl-Anfragen pro Tag, gecrawlte Seiten, HTTP-Statuscodes und Antwortzeiten. Ahrefs Site Audit findet gecrawlte nicht-indexierte Seiten und Crawl-Budget-Verschwendung. Server-Logs geben das vollständigste Bild welche URLs Googlebot wann gecrawlt hat.

📊

Google Search Console — Crawl-Statistiken

Der primäre Einstiegspunkt für Crawl Budget Analyse. Zeigt tägliche Crawl-Anfragen, gecrawlte URL-Typen, HTTP-Statuscodes (200, 301, 404, 503) und Antwortzeiten des Servers. Wichtige Signale: viele 404-Crawls = kaputte interne Links, viele 301-Crawls = Redirect-Chains, hohe Antwortzeiten = Crawl Rate Limit wird gedrosselt.

GSC → Einstellungen (⚙️) → Crawl-Statistiken
🔍

GSC → Seitenindexierung — gecrawlt aber nicht indexiert

Unter „Seiten“ in GSC zeigt „Gecrawlt – derzeit nicht indexiert“ Seiten die Googlebot gefunden hat aber nicht aufnimmt. Das sind oft Crawl-Budget-Verschwender: Seiten die gecrawlt werden obwohl sie nicht ranken sollen. Jede dieser Seiten kostet Crawl Budget ohne Return.

GSC → Indexierung → Seiten → „Gecrawlt – derzeit nicht indexiert“
🛠️

Ahrefs Site Audit — systematische Crawl-Probleme

Ahrefs Site Audit crawlt die Website wie Googlebot und findet: Redirect-Chains, interne Links zu 404-Seiten, noindex-Seiten die noch intern verlinkt werden, zu große Sitemaps mit nicht-indexierbaren URLs und andere Crawl-Budget-Probleme. Ideal für systematische Audit-Vorbereitung.

Ahrefs → Site Audit → Crawl → Issues-Report
📋

Server-Logs — das vollständigste Bild

Server Access Logs zeigen exakt welche URLs Googlebot wann gecrawlt hat — inklusive Status-Codes, User-Agent und Crawl-Häufigkeit. Technisch aufwendiger auszuwerten als GSC, aber die genaueste Methode. Tools: GoAccess, Screaming Frog Log Analyzer, Logstash. Besonders wertvoll für große Websites mit komplexer URL-Struktur.

ℹ️ Praxis-Tipp: Die wichtigste erste Frage bei der Crawl Budget Analyse: „Wie viele meiner indexierten Seiten vs. gecrawlten Seiten sind wirklich wertvoll?“ Wenn GSC 10.000 gecrawlte URLs zeigt aber nur 500 davon aktiv ranken, ist die Crawl-Effizienz gering. Ziel: möglichst viele gecrawlte Seiten sollen auch ranken.

Crawl Budget Optimierungsmaßnahmen

Welche Maßnahmen verbessern das
Crawl Budget am wirkungsvollsten?

Die effektivsten Crawl Budget Maßnahmen: robots.txt für irrelevante URL-Pfade (Parameter, Admin, Suche), noindex für dünne Seiten die nicht gecrawlt werden sollen, Canonical Tags für Duplicate Content, Redirect-Chain-Bereinigung, Sitemap-Bereinigung (nur indexierbare 200-URLs), interne Verlinkungsoptimierung und schnelle Server-Antwortzeiten.

🤖

robots.txt — Crawler-Zugang steuern

Blockiert Googlebot explizit für bestimmte URL-Pfade. Ideal für: Admin-Bereich, interne Suche, Warenkorb, Login-Seiten, URL-Parameter-Pfade. robots.txt-Blockierung verhindert Crawling komplett — aber: robots.txt-geblockte Seiten können trotzdem im Index auftauchen wenn sie von anderen Seiten verlinkt werden.

Disallow: /admin/ Disallow: /warenkorb/ Disallow: /suche/ Disallow: /*?sort=* Disallow: /*?filter=*
🚫

noindex — Indexierung verhindern

noindex-Tag (X-Robots-Tag oder Meta) sagt Googlebot: Seite crawlen ist ok, aber nicht indexieren. Gut für: dünne Seiten die trotzdem intern zugänglich sein sollen (Danke-Seiten, interne Tools), paginierte Seiten ab Seite 2+ und Tag-/Kategorieseiten ohne echten Content. Vorteil: Seite bleibt intern nutzbar.

<meta name=“robots“ content=“noindex, follow“>
🔗

Canonical Tags — Duplicate Content

Bei mehreren URL-Varianten desselben Inhalts (URL-Parameter, www vs. non-www, http vs. https) Canonical auf die Hauptversion setzen. Googlebot crawlt zwar alle Varianten, aber gibt den PageRank an die kanonische URL. Reduziert Signalverwässerung ohne URLs technisch zu blockieren.

→ Canonical Tag Guide
➡️

Redirect-Chains bereinigen

Jeder Redirect kostet extra Crawl-Zeit — eine Redirect-Chain (A → B → C → D) vervielfacht diesen Aufwand. Alle Redirects direkt auf die finale Ziel-URL setzen. Interne Links immer auf finale URLs aktualisieren statt auf weitergeleitete Versionen. Tools: Ahrefs Site Audit oder Screaming Frog.

# Direkt statt Kette: 301: /alte-url/ → /finale-url/ # Nicht: 301: /alt/ → /zwischen/ → /final/
🗺️

Sitemap bereinigen

Die XML-Sitemap sollte ausschließlich indexierbare 200er-URLs enthalten — keine noindex-Seiten, keine 301-Weiterleitungen, keine 404er. Google priorisiert Sitemap-URLs beim Crawling. Eine saubere Sitemap mit nur den wichtigsten Seiten signalisiert Google was gecrawlt werden soll.

→ Search Console Guide

Server-Performance verbessern

Schnelle Server-Antwortzeiten erhöhen das Crawl Rate Limit direkt. Time to First Byte (TTFB) unter 200ms ist optimal. Caching, CDN, Hosting-Upgrade und Code-Optimierung verbessern die Antwortzeit. Core Web Vitals und technische Performance zahlen direkt auf das Crawl Budget ein.

→ Core Web Vitals Guide

🔗 Interne Verlinkung als Crawl Budget Hebel: Gut strukturierte interne Verlinkung nach dem Hub-and-Spoke-Prinzip hilft Googlebot die wichtigsten Seiten zu identifizieren und häufiger zu crawlen. Seiten mit vielen internen Links bekommen mehr Crawl Demand. Orphan Pages (keine internen Links) werden dagegen kaum gecrawlt.

DTILE analysiert und bereinigt Crawl Budget Probleme

robots.txt, noindex, Redirect-Chains, Sitemap — vollständiges technisches SEO Audit.

Interaktive Checkliste

Crawl Budget Optimierung Checkliste —
so audierst du deine Website systematisch

🕷️
Crawl Budget Audit
12 Punkte · Interaktiv
0 von 12 Punkten0 %

Hake ab was bereits umgesetzt ist.

Analyse & Messung

Google Search Console Crawl-Statistiken geprüft (Anfragen/Tag, Statuscode-Verteilung)Analyse
GSC „Gecrawlt – nicht indexiert“ Seiten identifiziert und bewertetAnalyse
Anzahl indexierter vs. gecrawlter Seiten verglichen — Effizienz-Ratio bekanntAnalyse

robots.txt & noindex

robots.txt sperrt Admin, Login, Warenkorb, interne Suche und andere nicht-indexierbare PfadeWichtig
URL-Parameter (Filter, Sortierungen, Tracking) entweder per robots.txt oder Canonical behandeltWichtig
Dünne Seiten ohne echten Mehrwert haben noindex gesetztWichtig
KI-Crawler (PerplexityBot, GPTBot) sind explizit erlaubt (kein versehentlicher Block)Wichtig

Redirects & Struktur

Keine Redirect-Chains über 2 Hops — alle internen Links zeigen auf finale URLsWichtig
Sitemap enthält nur indexierbare 200er-URLs ohne noindex-Seiten oder RedirectsWichtig
Keine internen Links auf 404-Seiten (kaputte interne Links bereinigt)Wichtig

Performance & Laufend

Server-Antwortzeit (TTFB) unter 500ms — Core Web Vitals im grünen BereichPerformance
Crawl Budget wird nach größeren Änderungen (neue Seiten, Migrationen) erneut geprüftLaufend
FAQ

Häufige Fragen zum Crawl Budget

Crawl Budget ist die Menge an Crawl-Ressourcen die Googlebot einer Website zuweist — wie viele Seiten in einem Zeitraum gecrawlt werden. Es setzt sich aus Crawl Rate Limit (Server-Kapazität) und Crawl Demand (Googles Interesse am erneuten Crawl) zusammen. Wenn irrelevante Seiten das Budget verschwenden, werden wichtige Seiten seltener gecrawlt.
Primär relevant für Websites mit 1.000+ URLs, vielen URL-Parametern (E-Commerce-Filter), häufig aktualisiertem Content oder nach Website-Migrationen. Für kleine Websites unter 500 Seiten mit sauberer Struktur ist Crawl Budget selten kritisch — Google crawlt alle wichtigen Seiten ohne Probleme.
robots.txt blockiert Crawling komplett — Googlebot folgt dem Link gar nicht. noindex erlaubt Crawling aber verhindert Indexierung. Für Crawl Budget: robots.txt spart mehr Budget weil Googlebot die Seite nicht einmal lädt. noindex ist besser wenn die Seite intern zugänglich bleiben soll aber nicht ranken darf.
Google Search Console → Einstellungen → Crawl-Statistiken ist der Einstieg. Zeigt Crawl-Anfragen pro Tag, Statuscode-Verteilung und Antwortzeiten. Ergänzend: GSC → Seitenindexierung → „Gecrawlt – nicht indexiert“ für Budget-Verschwendung. Ahrefs Site Audit für systematische technische Probleme. Server-Logs für exakteste Analyse.

→ Google Search Console Guide

Ja — wenn KI-Sichtbarkeit in ChatGPT, Perplexity und anderen LLMs gewünscht ist. PerplexityBot, GPTBot (OpenAI) und ClaudeBot sollten nicht geblockt sein. Vorsicht: Cloudflare blockiert KI-Bots standardmäßig — in Server-Einstellungen explizit freigeben. Wer in LLM-Antworten erscheinen will, muss seine Website für KI-Crawler zugänglich machen.

→ LLM SEO Guide

Die häufigsten Crawl Budget Verschwender: URL-Parameter (Tracking, Filter, Sortierungen erzeugen hunderte Duplikat-URLs), Redirect-Chains, kaputte interne Links (404), dünne Seiten ohne Content, Paginierung ohne noindex, Tag- und Kategorieseiten ohne Eigeninhalt, Session-ID-URLs und technische Artefakte aus CMS-Systemen wie WordPress (Attachment-Seiten, Author-Archive ohne Inhalt).
Indirekt ja: schnellere Server erhöhen das Crawl Rate Limit, mehr Backlinks und höhere Domain-Autorität erhöhen den Crawl Demand. Das Crawl Rate Limit kann in der Google Search Console manuell nur gesenkt, nicht erhöht werden. Direktes Erhöhen ist nicht möglich — effektiver ist das vorhandene Budget durch Bereinigung irrelevanter Seiten besser zu nutzen.
Crawling: Googlebot lädt die Seite und liest den Inhalt aus. Indexierung: Google entscheidet nach dem Crawl ob die Seite gut genug für den Index ist und dort aufnimmt. Nicht gecrawlt = nie indexiert. Gecrawlt aber nicht indexiert = Seite wurde gelesen aber als nicht wertvoll genug eingestuft. Crawl Budget Optimierung verbessert primär das Crawling, Qualitäts-Optimierung die Indexierungsrate.
Crawl Budget · Technisches SEO · DTILE Hamburg

Google crawlt deine wichtigen Seiten
nicht oft genug? Wir ändern das.

Crawl Budget Analyse, robots.txt, Redirect-Bereinigung und Sitemap-Optimierung — als Teil der vollständigen technischen SEO-Betreuung durch DTILE.

✓ Google Partner Hamburg✓ Stormsweg 5A · 22085 Hamburg · HRB 159534✓ Monatlich kündbar
Engin Buldak – Technisches SEO Experte DTILE GmbH Hamburg

Engin Buldak

Gründer · DTILE GmbH Hamburg · Technisches SEO · Koray-Framework

Engin ist Gründer der DTILE GmbH (Stormsweg 5A, 22085 Hamburg, HRB 159534). Technisches SEO ist der erste Schritt jedes DTILE-Projekts — Crawl Budget, Core Web Vitals, Canonical Tags und Indexierungsstatus werden im Onboarding-Audit vollständig analysiert.