Niet gevonden, niet gecrawld of geweigerd: wat is het verschil?
De kern van het probleem: Google kan je pagina niet indexeren om drie fundamenteel verschillende redenen. Hij vindt haar niet, hij mag haar niet bezoeken, of hij besluit haar na het bezoek toch niet op te nemen. Elk van die drie vraagt een andere aanpak.
We zien dit patroon constant in ons werk met technische KMO’s in België. Een machinebouwer zet een nieuwe website live, de zaakvoerder verwacht verkeer, maar drie maanden later staat er niets in Google. Na een technische audit blijkt de oorzaak in negen van de tien gevallen niet dat de content slecht is, maar dat de site technisch nog niet indexeerbaar genoeg is. Dat onderscheid is cruciaal, want het bepaalt volledig wat je moet aanpakken.
Google Search Console toont je welke status een pagina heeft. “Ontdekt, momenteel niet geïndexeerd” betekent dat Google de URL kent maar nog niet bezocht heeft. “Gecrawld, momenteel niet geïndexeerd” betekent dat Google wel langskwam, maar de pagina toch niet opnam. Beide statussen zijn oplosbaar, maar de oorzaak verschilt.
Wat blokkeert het crawlen van je technische site?
De meest voorkomende blokkade is ook de meest vermijdbare: een foutieve instelling die je site actief verbergt voor zoekmachines.
Robots.txt is het eerste wat Google raadpleegt. Eén foutieve `Disallow`-regel kan een volledige sectie van je site onzichtbaar maken voor crawlers, inclusief je product- en dienstpagina’s. Dat klinkt als een fout die nooit gemaakt wordt, maar in de praktijk zien we het regelmatig bij sites die zijn overgezet van een testomgeving naar productie.
Noindex-instructies zijn de tweede grote valkuil. Veel CMS-systemen, waaronder WordPress, hebben een instelling “Ontmoedig zoekmachines” die standaard aanstaat tijdens de bouw. Als die instelling niet wordt uitgeschakeld bij de livegang, staat er in de HTTP-header van elke pagina een `noindex`. Google ziet dat, respecteert het, en indexeert niets. Wij vinden dit bij een verrassend groot deel van de technische websites die we auditen, zelfs bij sites die al maanden live staan.
Loginwalls en firewallregels zijn een derde categorie. Als je technische documentatie, productbladen of dienstenpagina’s achter een login staan, kan Google ze simpelweg niet bereiken.
Waarom vindt Google je pagina’s niet eens?
Als Google je pagina niet kan vinden, heeft crawlen geen zin. Ontdekbaarheid is de eerste stap, en die hangt af van twee dingen: je sitemap en je interne linkstructuur.
Een XML-sitemap is geen garantie op indexatie, maar zonder sitemap kan Google nieuwe product-, dienst- of casuspagina’s trager vinden. Dat is bijzonder relevant voor technische B2B-sites met uitgebreide productcatalogi of veelvuldige toevoegingen aan het aanbod. Als je sitemap niet up-to-date is of ontbrekende pagina’s bevat, weet Google niet dat ze bestaan.
Interne links zijn minstens even belangrijk. Als een pagina alleen bereikbaar is via een filter, een zoekfunctie of een formulier, kan Google haar missen. Crawlers volgen links, geen JavaScript-interacties. Een technische dienstenpagina die nergens in de navigatie of in de bodytekst van andere pagina’s wordt gelinkt, is voor Google een weespagina. Ze bestaat, maar Google heeft geen reden om er naartoe te gaan.
Voor technische KMO’s die hun B2B-website willen optimaliseren voor meer leads is een solide interne linkstructuur dan ook een van de eerste aanpassingen die concreet resultaat geeft.
Wanneer weigert Google te indexeren?
Google kan je pagina vinden, haar crawlen, en toch beslissen haar niet op te nemen. Dat is de meest frustrerende situatie, omdat het probleem minder zichtbaar is.
De meest voorkomende oorzaken in technische B2B-omgevingen:
- Dunne content. Een productiepagina met alleen een productnaam, een foto en een contactknop heeft te weinig inhoud om te indexeren. Google verwacht dat een pagina echte meerwaarde biedt.
- Duplicaatcontent. Technische sites met varianten, parameters of filterpagina’s genereren snel honderden bijna-identieke URL’s. Google kiest er één uit en negeert de rest. Zonder correcte canonical-tags kiest Google zelf, en dat is niet altijd de pagina die jij wilt tonen.
- Soft 404’s. Een pagina die “geen resultaten gevonden” toont maar technisch een 200-statuscode geeft, behandelt Google als een lege pagina en indexeert haar niet.
- Canonicalproblemen. Bij meertalige sites, een veelvoorkomende situatie voor Belgische bedrijven met Nederlands en Frans, kan een fout in de canonical-instelling ertoe leiden dat Google de verkeerde taalversie kiest of beide versies negeert.
Voor Belgische technische bedrijven is hreflang een bijzonder gevoelig punt. Als de verwijzingen tussen de Nederlandse en Franse versie van een pagina niet correct zijn ingesteld, ziet Google twee versies van dezelfde content zonder duidelijke hiërarchie. Dat leidt tot indexatieverwarring die moeilijk te diagnosticeren is zonder de juiste tools.
Hoe beïnvloeden server en infrastructuur de indexatie?
Een trage of instabiele server is geen SEO-probleem op papier, maar wel in de praktijk.
Als je server regelmatig 5xx-fouten geeft of traag antwoordt, past Google zijn crawlbudget aan. Dat betekent dat hij minder pagina’s bezoekt per sessie, of minder frequent terugkomt. Voor een technische site met tientallen product- en dienstenpagina’s is dat een reëel probleem.
Dit speelt extra sterk bij hostingmigraties. Na een serververhuizing zien we regelmatig dat bepaalde pagina’s tijdelijk of permanent uit de index verdwijnen, niet omdat ze zijn verwijderd, maar omdat Google tijdens de migratie herhaaldelijk een fout kreeg en de pagina’s als niet-beschikbaar heeft gemarkeerd.
JavaScript is een aanverwant probleem. Een site kan er visueel perfect uitzien, maar als belangrijke content pas beschikbaar wordt na JavaScript-rendering, loopt indexatie vertraging op. Moderne front-end frameworks en single-page applications zijn gevoelig voor dit probleem. Google kan JavaScript renderen, maar doet dat in een aparte wachtrij, wat indexatie kan vertragen met dagen of weken.
De april 2026 core update van Google heeft dit nog scherper gesteld: technische kwaliteit en inhoudelijke relevantie wegen zwaarder dan ooit. Een technisch gebrekkige site verliest sneller terrein, ook als de content op zich goed is.
Hoe diagnosticeer je het probleem stap voor stap?
Een gestructureerde aanpak spaart tijd. In onze SEO-trajecten voor technische bedrijven beginnen we altijd met dezelfde vijf controlepunten:
Stap 1: Kan Google de pagina vinden?
Controleer of de URL in je sitemap staat en of er minstens één interne link naartoe verwijst. Gebruik Google Search Console om te zien of de URL überhaupt bekend is.
Stap 2: Mag Google de pagina crawlen?
Controleer je robots.txt op foutieve Disallow-regels. Controleer de meta robots-tag en de HTTP-headers op noindex-instructies. Kijk of de pagina achter een login of firewall staat.
Stap 3: Wil Google de pagina indexeren?
Bekijk de inhoud: is ze uniek, heeft ze voldoende diepgang, zijn de canonical-tags correct, zijn er soft 404’s? Controleer bij meertalige sites de hreflang-implementatie.
Stap 4: Is de server gezond?
Kijk in Search Console naar crawlfouten. Controleer de serverresponstijd en de uptime-logs. Let extra op na een hosting- of CMS-migratie.
Stap 5: Is de technische opbouw correct?
Controleer hoe JavaScript-content wordt geladen. Bekijk of filter- of parameter-URL’s voor indexruis zorgen. Verifieer dat alle taalversies correct naar elkaar verwijzen.
Dit is ook de aanpak die marketing voor technische bedrijven fundamenteel anders maakt dan generieke marketingtrajecten: de technische laag moet kloppen voor de commerciële laag resultaat geeft.
Indexatieproblemen zijn oplosbaar, maar je moet weten waar je zoekt
Indexatieproblemen bij technische websites zijn bijna altijd technisch van aard, niet inhoudelijk. Wie dat begrijpt, weet ook waar hij moet beginnen met zoeken in plaats van te blijven schrijven aan content die toch niet getoond wordt.
Met die kennis kun je gerichte acties nemen: robots.txt controleren, noindex-instellingen uitzetten, sitemaps aanvullen, canonicals rechtzetten, en je serverinfrastructuur stabiliseren. Dat zijn concrete stappen, geen vage aanbevelingen.
Wil je weten welke van deze problemen spelen op jouw site? Vraag een gratis marketing scan aan en ontvang drie concrete actiepunten op basis van een analyse van je website, je online vindbaarheid en je technische instellingen.
Veelgestelde vragen
Waarom wordt mijn website niet geïndexeerd door Google?
De meest voorkomende oorzaken zijn een actieve noindex-instructie, een foutieve robots.txt-regel, een ontbrekende sitemap of te weinig interne links naar de pagina. Soms beslist Google ook zelf om een pagina niet op te nemen vanwege dunne content, duplicaatcontent of canonicalproblemen. Controleer Google Search Console voor de exacte status van je pagina’s. Die status vertelt je of het probleem bij ontdekking, crawlen of indexatie zit.
Is een URL indexeerbaar als hij in mijn sitemap staat?
Niet automatisch. Een sitemap helpt Google om URL’s te ontdekken, maar garandeert geen indexatie. Als de pagina een noindex-tag heeft, slechte content bevat, als duplicaat wordt beschouwd of via een foutieve canonical naar een andere pagina wijst, zal Google haar toch niet opnemen. Een sitemap is een signaal, geen garantie.
Hoe kan ik pagina’s van mijn website laten indexeren?
Controleer eerst of er technische blokkades zijn: noindex-tags, robots.txt-regels, loginwalls. Zorg daarna dat de pagina vindbaar is via interne links en in je sitemap staat. Dien de URL in via Google Search Console met de functie “URL inspecteren” en vervolgens “Indexering aanvragen”. Houd er rekening mee dat indexatie daarna nog enkele dagen tot weken kan duren, afhankelijk van de autoriteit van je site.
Hoe zorg je dat je technische website beter gevonden wordt in België?
Goede vindbaarheid begint bij correcte indexatie. Zorg dat alle relevante pagina’s crawlbaar zijn, voldoende inhoud hebben en correct zijn gelinkt. Voor Belgische bedrijven met een tweetalige site is een correcte hreflang-implementatie essentieel om verwarring tussen taalversies te vermijden. Daarna helpt gerichte SEO op niche-zoektermen die je doelgroep, zoals inkoopverantwoordelijken of engineers, effectief gebruikt.
Wat is het verschil tussen “Ontdekt” en “Gecrawld, niet geïndexeerd” in Search Console?
“Ontdekt, momenteel niet geïndexeerd” betekent dat Google de URL kent maar haar nog niet heeft bezocht. Dit kan wijzen op een laag crawlbudget of een lage prioriteit. “Gecrawld, momenteel niet geïndexeerd” betekent dat Google de pagina wel heeft bezocht maar besliste haar niet op te nemen. Dat laatste is een actieve weigering en vraagt een inhoudelijke of technische aanpassing aan de pagina zelf.
Kan een trage server mijn indexatie schaden?
Ja. Als je server regelmatig 5xx-fouten geeft of traag antwoordt, past Google zijn crawlfrequentie aan en bezoekt hij minder pagina’s. Bij een hostingmigratie is dit een bijzonder reëel risico. Pagina’s die tijdens de migratie herhaaldelijk een fout gaven, kunnen tijdelijk of permanent uit de index verdwijnen. Controleer na elke serverwijziging de crawlstatistieken in Google Search Console.
Sources
- Google Search Central, 2025 — Officiële Google-documentatie over redenen waarom pagina’s niet worden geïndexeerd.
- Google Search Console Help, 2025 — Uitleg van indexeringsstatussen in Google Search Console, inclusief “Ontdekt” en “Gecrawld, niet geïndexeerd”.
- Google Search Central, hreflang, 2025 — Documentatie over gelokaliseerde versies en hreflang-implementatie voor meertalige sites.