A quoi sert le Sitemap XML 

Le sitemap XML est un document qui liste des URLs. En anglais, sitemap XML veut dire « carte du site ». Il s’agit d’un outil permettant d’aider dans la gestion du crawl : si vous avez un très gros site, le sitemap permet d’indiquer les pages les plus importantes pour guider le robots.

Il ne s’agit donc pas d’y indiquer toutes les URLs du site, mais principalement les URLs ou catégories d’URLs principales que l’on souhaite faire indexer en priorité.

Le sitemap est-il indispensable ?

Non :) Si votre site a seulement quelques centaines de pages, Googlebot devrait s’en sortir avec la navigation naturelle. Il faut en revanche bien vérifier et faire en sorte que le site a une profondeur de clic maximale de 4 : à savoir que Google privilégiera toujours la navigation naturelle, évitez donc de considérer que le sitemap va corriger des défauts d’arborescence. 

A partir de 1000 pages, un sitemap devient utile, et à partir de 10000 pages il devient nécessaire.

Comment  créer un Sitemap ?

  • Manuellement, en créant un fichier XML. Cette méthode est généralement à déconseiller, sauf si vous savez vraiment ce que vous faites ! Au minimum il est conseillé d'utiliser un éditeur XML pour créer ce fichier.
  • En faisant un développement informatique spécifique à votre site : cette méthode sera la plus puissante et s'adaptera à toutes les problématiques de vos sites. Mais c'est aussi la plus coûteuse en ressource. Attention aux nombre maximum d'URLs dans un fichier sitemap, il faut parfois pouvoir segmenter en plusieurs fichiers.
  • En utilisant un outil de génération automatique de site map (se trouve facilement sur Google) . Cette méthode est tentante : très peu de travail pour un résultat professionnel ! Mais attention elle présente un inconvénient de maintenabilité car si on change quelque chose il faut relancer le générateur à chaque fois. 
  • Grâce à votre CMS (=outil de gestion de site) : la plupart ont des plugin qui permettent de créer des sitemap, et tout est automatisé en cas de mise à jour.

Règles à suivre :

  • Le fichier XML doit être enregistré en UTF-8.
  • Un sitemap ne peut lister qu'au maximum 50 000 URL et la taille du fichier XML ne doit pas dépasser 50 Mo (52 428 800 octets).
  • Toutes les URL listées dans un fichier sitemap XML doivent provenir du même hôte, tel que mon-domaine.fr par exemple

La structure du Sitemap XML

Le fichier sitemap.xml se présente comme suit : 

<urlset xmlns=”http://www.sitemaps.org/schemas.org/schemap/0.9”>

<url>

<loc>https://smartkeyword.io/</loc >

<changefreq>daily</changefereq>

<lastmod><2017-09-02TO9:04:58+00:00</lastmod>

<priority>1.00</priority>

</url>

<url>

<loc>https://smartkeyword.io/client.html/</loc >

<changefreq>daily</changefereq>

<lastmod><2015-09-02TO9:05:58+00:00</lastmod>

<priority>0.80</priority>

</url>

<url>

            <loc>https://smartkeyword.io/formation-seo.htm/</loc >

<changefreq>daily</changefereq>

<lastmod><2015-09-02TO9:24:53+00:00</lastmod>

<priority>0.80</priority>

</url>

</urlset>

Paramètres du fichier :

  • L’URL (en gras) : obligatoire
  • La fréquence de MAJ : facultatif
  • Dernière modification : facultatif
  • Priorité : facultatif (0 étant le plus faible et 1 le plus élevé)

Règles à suivre :

  • Débuter par une balise d'ouverture <urlset> et terminer par une balise de fermeture </urlset>
  • Spécifier l'espace de nom (standard de protocole) dans la balise <urlset>
  • Inclure pour chaque URL une entrée <url> en tant que balise XML parent
  • Inclure une entrée enfant <loc> pour chaque balise parent <url>

--> Si vous voulez en savoir plus, allez dans dans la partie "Good to know" de cet article (en bas de la page ;) )

Comment informer Google de votre sitemap ?

  1. Connectez-vous à votre compte Google webmaster tools et rendez-vous dans « Exploration / Sitemaps » 
  2. Cliquez sur le bouton « Ajouter / tester un sitemap ».
  3. Ajoutez l’url de votre « index de Sitemap » en n’oubliant pas de supprimer le nom de domaine.
  1. Cliquez ensuite sur le bouton « Envoyer ».
  2. Vous pourrez ensuite revenir régulièrement dans ce menu afin de voir si Google indexe bien toutes les urls envoyées via votre Sitemap.

Nos conseils pour optimiser son utilisation

Faites des sitemaps selon les types de pages (les catégories les produits..).

Pour les gros sites qui ont besoin d’un fichier sitemap, vous pouvez en faire de 2 types :

  • 1 listant les dernières pages créées (pour tenter de gagner en vitesse d’indexation)
  • 1 par type de pages (pour essayer de mesurer le taux d’indexation par types de pages, par exemple fiches produits, catégories, articles éditoriaux, etc.)

Faites des sitemaps par langue et/ou par pays 

Si vous avez un site multilingue, c’est une bonne idée de séparer votre sitemap (ou vos sitemaps) en plusieurs : un par langue. Si vous avez plusieurs sitemaps (par types de pages), re-découpez par langues.

Si vous avez un site qui cible plusieurs pays, là aussi vous avez intérêt à les séparer.

Dans les 2 cas, l’idée est de faciliter l’étude du taux de pages indexées selon les types de pages, les langues et les pays.

Informations techniques :

  • Sitemap XML : la balise <urlset>

La balise <urlset> est obligatoire. Elle englobe le fichier sitemap et référence le standard de protocole utilisé.

  • Sitemap XML : la balise <url>

La balise <url> est également obligatoire. Elle représente la balise parent pour chaque URL référencées.

  • Sitemap XML : la balise <loc>

La balise <loc> est la dernière des trois balises obligatoires. Elle représente l'URL de la page. Celle-ci doit commencer obligatoirement par l'intitulé du protocole (http://, https://) et ne doit pas comporter plus de 2048 caractères.

  • Sitemap XML : la balise <lastmod>

La balise <lastmod> est facultative. Elle informe de la date de la dernière modification du fichier/page. Cette date doit être au format date et d'heure du W3C. Pour une question de simplicité, on utilise généralement le format AAAA-MM-JJ

  • Sitemap XML : la balise <changefreq>

La balise <changefreq> est également facultative. Elle représente la fréquence de modification de la page. Cette valeur fournit aux moteurs de recherche une information générale et est considérée comme une indication, et non comme une commande. Même si les robots d'exploration des moteurs de recherche peuvent tenir compte de cette information, ils ne l'appliquent pas nécessairement de façon stricte.

Les valeurs acceptées sont : "always" (toujours), "hourly" (toutes les heures), "daily" (quotidiennement), "weekly" (hebdomadairement), "monthly" (mensuellement), "yearly" (annuellement) et "never" (jamais).

La valeur "always" (toujours) doit être utilisée pour décrire les documents qui changent à chaque accès. La valeur "never" (jamais) doit être utilisée pour décrire les URL considérées comme étant archivées.

  • Sitemap XML : la balise <priority>

La balise <priority> est la dernière des trois balises facultatives. Elle représente la priorité d'une page par rapport aux autres du site. Les valeurs acceptées sont comprises entre 0.0 et 1. Par défaut (sans balise <priority>), la priorité d'une page est égale à 0.5.

Cette valeur permet uniquement de signaler aux moteurs de recherche les pages que vous jugez les plus importantes pour les robots d'exploration.

Découvrez les articles similaires :

Le rapport de couverture Google Search Console : 

Avez-vous trouvé votre réponse?