Le plan sitemap
Le protocole Sitemap vous permet d’indiquer aux moteurs de recherche les URL à explorer sur vos sites Web. Dans sa forme la plus simple, un plan Sitemap utilisant le protocole Sitemap est un fichier XML qui répertorie les URL d’un site. Ce protocole a été écrit pour être extrêmement évolutif et s’adapter à des sites de toutes tailles. Il permet également aux administrateurs Web d’inclure des informations complémentaires sur chaque URL (date de dernière modification, fréquence de révision, importance relative par rapport aux autres URL du site), de façon à favoriser une exploration plus intelligente du site par les moteurs de recherche.
Les plans Sitemap sont particulièrement utiles lorsque les internautes ne peuvent pas atteindre toutes les zones d’un site Web à l’aide d’une interface de navigation. Cela se produit généralement lorsque les liens proposés ne permettent pas d’atteindre certaines pages ou zones d’un site. Ainsi, vous avez intérêt à créer un plan Sitemap et à l’envoyer aux moteurs de recherche si votre site contient des pages uniquement accessibles par le biais d’un formulaire de recherche.
Ce document décrit les formats de fichiers Sitemap et explique où vous devez placer ces fichiers pour que les moteurs de recherche puissent les exploiter.
Notez que le protocole Sitemap complète, mais ne remplace pas, les mécanismes fondés sur l’exploration que les moteurs de recherche utilisent déjà pour découvrir des URL. En envoyant un plan Sitemap (ou plusieurs) à un moteur de recherche, vous contribuez à optimiser le fonctionnement de ses robots d’exploration.
Le recours à ce protocole ne garantit pas la prise en compte de vos pages Web dans les index de recherche, (Notez que l’utilisation de ce protocole n’influe pas sur le mode de classement de vos pages par un moteur de recherche.)
Format de plan Sitemap XML [Contenu]
Le format du protocole Sitemap se compose de balises XML. Toutes les valeurs de données d’un plan Sitemap doivent utiliser des caractères d’échappement d’entité. Quant au fichier, il doit être enregistré avec un codage UTF-8.
Vous trouverez ci-après un exemple de plan Sitemap composé d’une seule URL et utilisant toutes les balises facultatives. Ces dernières sont en italique.
 <?xml version=”1.0″ encoding=”UTF-8″?>
 < urlset xmlns=”http://www.google.com/schemas/sitemap/0.84“>
  < url>
   < loc>http://www.example.com/</loc>
   < lastmod>2005-01-01</lastmod>
   < changefreq>monthly</changefreq>
   < priority>0.8</priority>
  </url>Â
 </urlset>Â
Le plan Sitemap doit :
- Commencez par une balise d’ouverture
- Inclure pour chaque URL une entrée
- Inclure une entrée enfant
Définitions des balises XML
Les balises XML disponibles sont décrites ci-après.
<urlset> |
obligatoire | Encadre le fichier et référence le standard de protocole actuel. |
<url> |
obligatoire | Balise parent de chaque entrée d’URL. Les autres balises sont des enfants de cette balise. |
<loc> |
obligatoire | URL de la page. Cette URL doit commencer par l’intitulé du protocole (http, par exemple) et se terminer par une barre oblique si votre serveur Web l’exige. L’URL ne doit pas comporter plus de 2 048 caractères. |
<lastmod> |
facultatif | Date de la dernière modification du fichier. Cette date doit être au format date et heure W3C. Celui-ci vous permet d’omettre l’heure, si vous le souhaitez, et de n’utiliser que le format AAAA-MM-JJ. |
<changefreq> |
facultatif | Fréquence probable de modification de la page. Cette valeur fournit aux moteurs de recherche une information générale et n’a pas nécessairement de rapport avec la fréquence effective d’exploration de la page. Les valeurs acceptées sont les suivantes :
La valeur « always » (toujours) doit être utilisée pour décrire les documents qui changent à chaque accès. La valeur « never » (jamais) doit être utilisée pour décrire les URL archivées. Notez que la valeur de cette balise est considérée comme une indication, et non comme une commande. Même si les robots d’exploration des moteurs de recherche prennent cette information en compte, ils ne l’appliquent pas nécessairement de façon stricte. Ainsi, ils peuvent explorer des pages dont la fréquence de modification est « hourly » (horaire) moins fréquemment que cela ou, à l’inverse, explorer des pages dont la fréquence de modification est « yearly » (annuelle) plus fréquemment. Il est également vraisemblable que les robots exploreront régulièrement les pages associées à la fréquence de modification « never » (jamais), de façon à traiter les modifications non prévues apportées à ces pages. |
<priority> |
facultatif | Priorité de cette URL par rapport aux autres URL de votre site. Les valeurs acceptées sont comprises entre 0,0 et 1,0. Cette valeur est sans effet sur la comparaison de vos pages avec celles d’autres sites. Elle permet uniquement de signaler aux moteurs de recherche les pages que vous jugez les plus importantes de façon à organiser l’exploration de votre site comme vous l’entendez.La priorité par défaut d’une page est égale à 0,5.Notez que la priorité attribuée à une page n’a aucune incidence sur la position de vos URL dans les pages de résultats du moteur de recherche. Les moteurs de recherche utilisent cette information pour hiérarchiser les URL d’un même site lors de leur sélection. Cette balise vous permet donc d’augmenter la probabilité que vos pages les plus importantes figurent dans l’index de recherche.
En outre, notez que l’attribution d’une priorité élevée à toutes les URL de votre site ne vous sera d’aucune utilité. En effet, cette priorité relative n’est utilisée que pour hiérarchiser les URL de votre site lors de leur sélection ; aucune comparaison ne sera établie entre la priorité de vos pages et celle des pages d’autres sites. |
Comme un petit dessin vaut mieux qu’un long discours :-] Voici le sitemap de ce site qui pourra vous servir d’exemple.Â
Si vous n’utilisez pas de CMS (Content Management System) avec générateur de sitemap.xml automatisé, je vous conseille d’utiliser des générateurs de sitemap pour vous éviter des heures de travail.
Une fois votre sitemap génére et copié dans la racine de votre site, vous devez le soumettre aux moteurs de recherche, le plus simple étant les “sitemap submitters” qui vous permettront de soumettre votre site à Google, Yahoo, ask et moreover(msn).



