Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the debug-bar domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/u670148216/domains/lucyseo.com/public_html/app/wp-includes/functions.php on line 6114

Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the simple-custom-post-order domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/u670148216/domains/lucyseo.com/public_html/app/wp-includes/functions.php on line 6114

Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the wordpress-seo domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/u670148216/domains/lucyseo.com/public_html/app/wp-includes/functions.php on line 6114
Formation SEO : Maîtrisez le Sitemap pour booster votre visibilité !

 

Le fichier sitemap et l’indexation

Un fichier sitemap, également connu sous le nom de « sitemap XML » dans le contexte du référencement naturel, est un fichier spécialement formaté qui répertorie et décrit les pages d’un site web. A la différence du fichier robots.txt, unique, un site Internet peut proposer un ou plusieurs fichiers sitemaps.

l’objectif principal du sitemap est d’aider les moteurs de recherche à découvrir, explorer et indexer efficacement le contenu du site. Il n’est pas obligatoire dans une stratégie SEO mais ne peut que vous aider à faire indexer rapidement vos pages.

Voici tout ce qu’il faut savoir sur le fichier sitemap.

Présentation des fichiers sitemaps

Illustration d'un fichier sitemap
Illustration de la structure d’un site Internet et de la liste des pages à insérer dans un sitemap

Objectif du fichier sitemap

Commençons par le commencement. Qu’est-ce qu’un fichier sitemap et à quoi cela sert ? Un fichier sitemap est un fichier qui va lister l’ensemble des pages présentes sur votre site.

Il n’est pas destiné aux Internautes, mais aux robots d’exploration des moteurs de recherche, les crawlers. il va leur indiquer la liste des pages à aller explorer. C’est d’ailleurs pour cette raison que l’on va indiquer la ou les urls des fichiers sitemaps dans le fichier robots.txt.

Le format des fichier sitemaps

Il existe de nombreux types de fichiers sitemap utilisables. Voici les formats principaux :

  • Sitemap XML (Extensible Markup Language) : il s’agit du format le plus couramment utilisé et celui préconisé. Ce format est accepté par tous les moteurs de recherche. Il n’est pas très lisible car son code mêle balises xml et informations.
  • Sitemap HTML (HyperText Markup Language) : c’est un format plus lisible que le format xml, car il peut être interprété par les navigateurs et pourra donc être affiché sous un format plus clair pour les internautes. Ces fichiers ne sont pas utilisés par les moteurs de recherche pour l’exploration des pages. il peuvent en revanche faciliter la navigation des internautes.
  • Le sitemap TXT : sous forme d’un texte brut, et moins courant que le format XML ou HTML, le format txt reprend les inconvénients des fichiers XML et HTML. Il ne peut être ni lu par un moteur de recherche, ni être facilement lisible par un internautes. Il est réservé à des applications spécifiques.
  • RSS, mRSS et Atom 1.0 : ce sont d’autres formats de sitemap. Peu utilisés, mais tout de même reconnus par Google, il ne sont pas conseillé.

Dans le cas qui nous intéresse, le référencement naturel, c’est donc le format XML qui sera utilisé.

Y a-t-il une taille maximale pour un fichier sitemap XML ?

Google, qui fait référence dès que l’on parle de référencement, recommande que chaque fichier sitemap XML ne dépasse pas 50 000 URL et 50 Mo de taille. Si votre site dépasse les 50000 urls, vous pouvez toujours partitioner votre sitemap en plusieurs fichiers distincts.

Ou trouver le fichier sitemap ?

il n’y a pas d’emplacement prédéfini pour le ou les fichiers sitemaps. il est cependant fréquent de placer ses fichiers sitemaps à la racine de son site Internet. Concernant le nommage de vos fichiers sitemaps, vous pouvez utiliser n’importe quel nom de fichier, sous réserve d’utiliser les nomenclatures habituelles, en n’utilisant pas d’espaces, d’accents ou de caractères spéciaux.

Quelles informations peuvent être incluses dans un sitemap ?

Le principal objectif d’un fichier sitemap est donc de fournir la liste des urls du site. Mais ce n’est pas la seule information qui peut être présente. Voici donc les principales données qui peuvent être incluses dans un sitemap :

  • L’URL (Uniform Resource Locator) : on vient de le dire…
  • La date de dernière modification : indique la date à laquelle la page a été modifiée pour la dernière fois. Importante pour le SEO, les robots d’indexation peuvent comparer cette date à la dernière date d’exploration et ainsi ne pas perdre de temps à parcourir des pages qui n’ont pas subie de modification.
  • La fréquence de mise à jour. Moins précise que la date de dernière modification, elle indique aux crawlers à quelle fréquence ils peuvent venir explorer la page. Voici quelques valeurs utilisables : « always », « hourly », « daily », « weekly », « monthly », « yearly » ou « never ».
  • Priorité. il est possible d’indiquer les pages que l’on souhaite faire indexer en priorité. Cela peut être intéressant dans le cas ou le site bénéficie d’un « budget crawl » limité.
  • Les urls des médias associées : images, vidéos… il est possible de lister les urls des médias présents dans la page.
  • L’url de fichiers sitemaps : un fichier sitemap peut aussi servir à lister les urls d’autres fichiers sitemaps.
Capture d'écran du fichier sitemap de Lucy SEO
Code source du fichier sitemap de Lucy SEO

Création du fichier sitemap

La création d’un fichier sitemap varie en fonction du type de site Internet ou de la plateforme ou du CMS utilisé.

Création du fichier sitemap pour un site statique

La création du sitemap d’un site statique est relativement simple. Après avoir listé les urls présentes sur le site, voici le code source à copier et mettre à jour :

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>https://www.monsite.com/page1.html</loc>
        <lastmod>2023-09-15</lastmod>
        <changefreq>monthly</changefreq>
        <priority>0.8</priority>
    </url>
    <url>
        <loc>https://www.monsite.com/page2.html</loc>
        <lastmod>2023-09-10</lastmod>
        <changefreq>weekly</changefreq>
        <priority>0.9</priority>
    </url>
    <url>
        <loc>https://www.monsite.com/page3.html</loc>
        <lastmod>2023-09-05</lastmod>
        <changefreq>daily</changefreq>
        <priority>1.0</priority>
    </url>
</urlset>

  • <?xml version="1.0" encoding="UTF-8"?> : déclaration XML standard qui indique la version XML et l’encodage utilisé. Ne pas modifier cette ligne.
  • <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> : C’est l’élément racine du fichier sitemap. Il spécifie la version du protocole sitemap utilisée. Ne pas modifier cette ligne
  • <url> : Chaque URL que vous souhaitez inclure dans le sitemap est encapsulée dans une balise <url>.
  • <loc> : Cette balise indique l’URL de la page. A adapter en fonction de votre url.
  • <lastmod> : Cette balise indique la date de dernière modification de la page au format « AAAA-MM-JJ ». Dans le cas d’un site statique, il faut mettre à jour cette date manuellement à chaque mise à jour de la page.
  • <changefreq> : Cette balise indique la fréquence de changement de la page. Les valeurs possibles sont « always », « hourly », « daily », « weekly », « monthly », « yearly » ou « never ».
  • <priority> : Cette balise indique la priorité relative de la page par rapport aux autres pages du site. La valeur doit être un nombre décimal entre 0.0 et 1.0.

Sachez que vous trouverez aussi sur Internet des générateurs de sitemap. il suffira d’indiquer la liste des urls et l’outil proposera le code associé.

Création du fichier sitemap pour un site dynamique

Création d’un fichier sitemap pour les site utilisant un CMS ou une autre platerforme

Dans le cas de quasiment toutes les plateforme ou CMS, open source ou non, il est possible d’utiliser des outils pour créer automatiquement des fichiers sitemaps.

Dans le cas de WordPress par exemple, il existe de nombreux plugins proposant la création de fichier sitemap. Les plugins Yoast SEO ou AllInOne SEO proposent, parmi leurs fonctionnalité, la création de fichiers sitemap. Si vous souhaitez un plugin qui se contente de créer un fichier sitemap, il existe par exemple Google Sitemap ou encore Better WordPress Google XML Sitemaps.

Capture d'écran de la liste des extensions disponibles pour créer un fichier sitemap sur WordPress
Capture d’écran de la liste des extensions disponibles pour créer un fichier sitemap sur WordPress

Générateur de fichier Sitemap

Il existe aussi en ligne des générateur de sitemap, qui vont dans un premier temps crawler votre site puis vous proposer un fichier sitemap XML à télécharger et placer sur son site. Le site www.xml-sitemaps.com propose notamment cette fonctionnalité.

Soumettre son fichier sitemap aux moteurs de recherche

Après avoir créé votre fichier sitemap, il est nécessaire de soumettre son fichier sitemap aux moteurs de recherche pour que les robots d’indexation puisse s’appuyer sur ce fichier pour découvrir vos pages.

Il existe 2 méthodes pour soumettre son ou ses fichiers sitemaps :

  • Utiliser les outils Google Search Console et Bing Webmaster tool. Ce sont les services gratuits fournis par Google et Microsoft pour aider les propriétaires de sites web à « surveiller et à améliorer la visibilité de leur site dans les résultats de recherche ». Vous pouvez donc dans ces outils renseigner les différentes urls de vos fichiers sitemaps.
  • Renseigner les urls de vos fichiers sitemaps dans votre fichier robots.txt. Voici le code à utiliser
Sitemap: https://www.example.com/sitemap.xml

Il est très vivement conseillé de combiner les 2 méthodes de soumission de ses fichiers sitemaps.

Capture d'écran de l'outil de gestion des fichiers sitemaps sur Lucy SEO
Capture d’écran de l’outil de gestion des fichiers sitemaps sur Lucy SEO

En conclusion sur le fichier sitemap

Comme nous l’avons vus, la présence d’un fichier sitemap est essentiel pour le référencement de son site Internet. Il permet de favoriser l’exploration et l’indexation de ses pages dans les moteurs de recherche. Son utilisation est donc très vivement recommandée.

Afin de maximiser ses effets sur votre référencement, il est nécessaire de soumettre son sitemap aux moteurs de recherche en utilisant à la fois les outils mis à disposition (Google Search Console, Bing Webmaster Tool) mais aussi en renseignant l’url de son sitemap dans son fichier robots.txt.

Gardez cependant toujours à l’esprit qu’avoir l’url d’une page présente dans son fichier sitemap ne signifie pas forcément que votre page se retrouvera dans les résultats de recherche.

Si vous souhaitez en savoir plus sur la façon dont Google gère les fichiers sitemap, vous pouvez consulter la documentation dédiée aux développeurs ici : documentation .