Pourquoi le fichier Sitemap ne signifie pas toujours « indexation » ?

Le fait de soumettre un fichier Sitemap à Google laisserait à penser que toutes les pages d’un site soient indexées. Ce n’est pas le cas, pourquoi ?

À l’instar de ce webmaster qui a soumis à Google un fichier Sitemap contenant 40 000 URL, seule une centaine de pages ont été indexées à ce jour. Pourquoi ?

Le premier constat est donc que le fait de soumettre un fichier Sitemap n’est aucunement une garantie que toutes les pages spécifiées seront indexées.

Comme l’explique Gary Illyes, un membre de l’équipe Webmaster Trends de Google, le fichier Sitemap ne garantit en rien l’indexation de toutes les pages mentionnées dans son contenu. Le fichier est avant tout une aide à l’exploration pour les Google Bot.

Par ailleurs, Gary Illyes explique aussi que le manque de pertinence d’un contenu, un contenu non relié à d’autres contenus ou une directive d’exclusion de l’indexation (meta noindex) peuvent aussi expliquer la décision de l’algorithme de Google de ne pas indexer toutes les URL rencontrées.

Au final, il faut retenir que le fichier Sitemap n’est pas un moyen à lui tout seul, mais qu’il appartient à la cohérence du tout.

C’est Gary Illyes qui s’est chargé d’apporter la réponse ci-dessous :

« First and foremost, submitting a Sitemap doesn’t guarantee the pages referenced in it will be indexed. Think of a Sitemap as a way to help Googlebot find your content: if the URLs weren’t included in the Sitemap, the crawlers might have a harder time finding those URLs and thus they might be indexed slower. Another thing you want to pay attention to is that our algorithms may decide not to index certain URLs at all. For instance, if the content is shallow, it may totally happen it will not be indexed at all ».

 

Tags

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Close

Adblock Detected

Please consider supporting us by disabling your ad blocker