Avant tout
Le référencement est une science vaste et difficile. Il n’y a pas de remède miracle pour avoir un bon référencement du jour au lendemain, ceci à cause du fait que google ne souhaite pas dévoiler son algorithme. Cependant, pour améliorer le référencement d’un site, il faut suivre tout un tas de préconisations conseillées par Google et par un grand nombre de professionnels en la matière.
Le référencement touche plusieurs domaines. Le codage HTML, la configuration du serveur, la mise en place d’outil technique, l’utilisation d’outil de suivi, et une bonne rédaction.
I. Choix des mots clés
Cette phase est la plus importante de toute et celle à réaliser avant toute autre opérations. C’est elle qui va faire en sorte que le référencement peut être efficace ou pas. Effectivement, il faut chercher des mots clés adaptés au site internet, mais également correspondant au contenu de la page consultée par l’utilisateur. Cette phase est réalisée avant la création d’une page internet car il est très important d’avoir l’ensemble des mots clés lors de la rédaction du contenu d’une page.
Mais une question arrive : Combien de mots clés faut-il pour effectuer un bon référencement ?
Tout d’abord, il faut choisir un grand nombre de mots clés susceptibles d’être efficace dans le référencement. Ensuite il faudra en choisir 10 voire 20 dans cette grande liste par page. Ces mots clés sélectionnés devront apparaître tout au long de la page consultée et ceci sans que l’utilisateur en subisse une surcharge. Nous pourrons retrouver ces mots clefs dans l’ensemble des critères énoncés ci-dessous.
A la fin de cette étape, doit ressortir :
- Une liste de mots clés globale, concernant l’ensemble du site ;
- Pour chaque page il doit y avoir :
- Une liste de mots clés correspondant à la page (entre 5 et 10) ;
- Un titre faisant ressortir les mots clés principaux de la page ;
- Une description faisant ressortir les mots clés secondaires de la page ;
- Le sous-titre de la page (h1) ;
- Une URL.
A la fin de cette étape, chacune des personnes de l’équipe de travail doit pouvoir commencer son travail.
Codage HTML
Le référencement est un domaine vraiment à part entière. Le référencement d’un site peut même être effectué par une personne extérieure, mais celle-ci devra être accompagnée par le développeur du site pour modifier certains critères au niveau du code. Nous allons nous occuper dans de document du référencement sur le moteur de recherche Google utilisé par la majorité des internautes.
Le référencement d’un site est un long et difficile chemin. Effectivement il peut se passer 6 mois à un an avant que le référencement d’un site soit pris en compte. La difficulté du référencement d’un site internet réside en la diversité de critères pris en compte par le moteur de recherche Google. Je vais donc énoncer une liste de préconisations à effectuer pour améliorer son référencement.
Note : Pour séparer les mots clés, dans cette section, notamment dans la partie "Url « propre »" et "Nom fichiers + noms balises CSS" il faut utiliser le caractère « – ». Si on utilise le symbole « _ », google ne séparera pas les mots. Ceci faussera donc le référencement avec des mots clés erronés.
II. Utilisation des titres
Un des critères les plus importants dans le référencement est l’utilisation de la balise <title> sur chacune des pages. Effectivement, cette balise permet de mettre en place un titre à l’ensemble des pages du site internet et permet donc d’informer l’utilisateur quant au contenu de la page.
Pour utiliser au mieux ce critère, il faut faire en sorte que celui soit
- court,
- précis,
- contenant des mots clés,
- unique à chaque page.
Qu’entendons-nous par « court » ? Le nombre de caractère maximum conseillé est de 65 caractères. Même si Google prend en compte environ 100 à 150 caractères, le nombre maximum de 65 caractères est conseillé car les premiers mots d’un titre sont considérés comme plus important que les suivants.
Par conséquent, si nous voulons promouvoir m-preuilh qui est actuellement peu reconnue, il est conseillé de mettre m-preuilh en début du titre, ainsi Google prendra la prendra en compte en tant que mot le plus important.
Ex : « m-preuilh – Portfolio de Mathieu Preuilh. »
Au contraire si m-preuilh est déjà reconnue par un bon nombre de personnes, il est plutôt conseillé de la mettre en fin de titre. Ainsi vous pouvez faire passer des mots plus importants comme le produit que vous vendez sur la page actuelle.
Ex : « Portfolio de Mathieu Preuilh – m-preuilh »
Il est également important que le titre contienne des mots clés. Attention à ne pas mettre uniquement des mots clefs, ce qui rendrait le titre incompréhensible pour l’utilisateur. Je rappelle que le référencement est tout d’abord effectué pour satisfaire l’utilisateur et non pas pour le tromper.
Enfin, il est important d’avoir un titre unique par page du site. Effectivement le référencement est propre à la page en cours et non à la globalité de site.
III. Utilisation des balises métas
Contrairement à ce qui est raconté en général sur internet, les balises méta ne sont plus trop utilisées dans le référencement par le moteur de recherche Google. Effectivement, il y a quelques temps il était nécessaire de bien étudier la balise méta liée aux keywords. A présent, cette balise n’a plus autant d’importance qu’avant, elle a tout de même sa place pour les autres moteurs de recherches tel Yahoo, ou Live Search.
A l’heure d’aujourd’hui, les balises métas les plus importantes pour le moteur de recherche Google sont :
- méta description : description de la page en cours. Elle doit être unique à chaque page tout comme le title. Elle est affiché au niveau de l’affichage des résultants sur les pages Google (pas plus de 200 caractères) ;
- méta author : contenant l’auteur du site internet. Ceci est important, car google n’aime pas lorsqu’une page n’a pas de propriétaire ;
- méta content-type : balise contenant l’encodage de la page ;
- méta content-langage : balise contenant le langage du site. Nous pouvons en mettre deux de la façon suivante : « fr-en » ;
- méta keyword : balise contenant les mots clés, entre 5 et 30 mots clés.
IV. Utilisations des balises HTML <H1>, <H2>, <H3>, …
Le critère suivant est un des plus importants. Il est nécessaire d’avoir la présence d’une balise <h1>, <h2>, <h3>, <h4>, …sur les pages, contenant également des mots clés, présentant la page actuelle. Google favorite les mots placés dans les balises <h1>, à ceux dans <h2> ; favorite les mots placés dans les balises <h2> à ceux dans <h3> et ainsi de suite. Il est donc important de mettre des mots clés dans ces balises, et particulièrement les <h1>, <h2> et <h3>. Attention, Un <h1> doit être, tout comme le titre, unique par page. Ainsi il peut donc qualifier la page actuelle et non le contenu global du site internet. Celui-ci ne doit pas dépasser un certain nombre de caractère. Effectivement, il serait trop simple de mettre tout un paragraphe de notre contenu en h1 dans le but de le promouvoir. Non, un h1 doit avoir une taille maximale de 100 voir 120 caractères. Tout comme le titre, Google prend un compte un nombre plus important de caractères mais ne prête attention qu’aux mots débutants la balise.
Dans notre cas, on pourrait mettre :
<h1>Portfolio de Mathieu Preuilh</h1>
<h2>Article sur le référencement</h2>
<h2>Article sur la formation LAOSI</h2>
<h2>Curriculum Vitae</h2>
<h2>Shootsurf</h2>
<h2>Projet professionnel : directeur technique</h2>
Les titres des sections, qui ne sont pas des mots clés, doivent être mis dans des « div » et non dans des balises <h>. Ainsi, ils n’interviennent pas dans le référencement du site.
V. Url « propres »
Critère ayant toute son importance mais souvent discuté par certaines personnes quant à son utilité dans le référencent. Effectivement, le fait d’avoir des URL « propres », permet à l’utilisateur de bien se retrouver sur le site. Il est normal de préférer être sur :
http://m-preuilh.com/Un-metier/
Que sur :
http://m-preuilh.com/index.php?id=56
Je rappel que le référencement est étudié pour rendre la vie plus facile à l’utilisateur plutôt que pour le tromper ou l’embrouiller. Il est donc normal que ce critère soit pris en compte dans le référencement d’un site internet.
Note : L’URL rewriting est utile pour placer à nouveau des mots clés dans l’URL. Ceci nous permet de situer d’une façon plus précise l’utilisateur sur notre site internet. Nous pouvons même créer des répertoires virtuels dans le but de rajouter de la précision au niveau des mots clés dans l’URL.
Pour effectuer de l’URL rewriting, il suffit de mettre en place un fichier .htaccess à la racine de notre site internet. Dans ce fichier se trouvera toutes les règles de réécriture des différentes URL du site.
Un fichier .htaccess peut également être utile pour faire des redirections, comme les redirections 404, redirection des différentes pages d’accueil (www.m-preuilh.com , http://m-preuilh.com, www.m-preuilh.com/index.php), ou lors d’un changement d’url.
VI. Avoir qu’une seule page d’accueil
Pour le référencement d’un site, et en particulier de la page d’accueil, il est important de réaliser des redirections. Effectivement, sans redirection, le site est disponible depuis :
- http://www.m-preuilh.com
- http://m-preuilh.com
- http://www.m-preuilh.com/index.php
Pour améliorer le référencement, il faudrait qu’une seule url, étant :
http://m-preuilh.com
Il faut donc faire une redirection lorsqu’un utilisateur arrive sans les www devant son url. Et faire une autre redirection pour enlever le « index.php » de l’url. Tout ceci se réalise dans le fichier .htaccess ou dans Typo3, si une telle option est disponible.
Effectivement, si une telle redirection est mise en place nous référençons le nom de domaine et non une page en particulier.
VII. Code HTML « propre »
Le commentaire nuit au référencement. Effectivement, pour avoir un bon référencement, il est nécessaire d’avoir un code HTML « propre ». Cela veut dire qu’il ne doit pas y avoir trop de commentaires dans le code, et que le code soit valide aux standards W3C en CSS et en HTML.
Les balises commentaires (<!-- commentaires -->) servent à guider les développeurs de pages Web dans la lecture du code source des pages et leur permettent de reprendre le code afin de l’améliorer ou le maintenir à jour.
Il s’avère que les balises commentaires ont souvent été utilisées à des fins de « spam » (tricherie) pour tenter d’augmenter la réactivité du site. Si celles-ci se retrouvent en trop grand nombre, cela peut gêner le passage des robots et les empêcher d’atteindre les textes visibles qui sont des éléments importants pour la bonne prise en compte des pages du site.
Dans notre cas, il faut donc :
- Faire du ménage dans les commentaires, qui occupe environ la moitié du code source html ;
- Modifier le code source du site pour qu’il soit valide aux standard W3C. Nous pouvons réaliser ce test depuis la barre de « Web developer » dans Mozilla Firefox.

Validation HTML aux normes W3C
Commentaires page d’accueil
VIII. Remplir champs « alt » et « title »
Ce critère a son importance dans le référencement également. Ceci est dû au fait que google ne lit ni les images, ni le javascript, ni les animations flash. Il n’en tient donc pas compte pour le référencement. Cependant, si nous remplissons le champ « alt » de chaque image, google le prendra en compte et le rajoutera à la liste de nos mots clés.
Il en est de même pour les balises « title » des liens HyperText. Effectivement, un lien HyperText est très utile dans le référencement. Sur ce point, un lien compte plus ou moins dans le référencement suivant la façon dont il est codé.
Exemple de lien comptant peu dans le référencement :
Allez sur le site de mathieu. <a href="http://m-preuilh.com ">Cliquez ici</a>
Note : Dans ce cas, les mots clés pris en compte seront : « Cliquez ici ».
-------------------------------------------------------------------------------------------------------------------
Exemple de lien comptant moyennement dans le référencement :
Allez sur le <a href=" http://m-preuilh.com ">site de mathieu preuilh </a>
Note : Dans ce cas, les mots clés pris en compte seront « site de mathieu preuilh », avec un coefficient de 1.
-------------------------------------------------------------------------------------------------------------------
Exemple de lien comptant beaucoup dans le référencement :
Allez sur le <a href=" http://m-preuilh.com " title="Site de mathieu preuilh">site de mathieu preuilh </a>
Note : Dans ce cas, les mots clés pris en compte seront « site de mathieu preuilh », avec un coefficient de 2. Il est donc normal que le référencement sur « site de mathieu preuilh» soit plus important que précédemment. Nous pouvons voir qu’il est donc préférable d’utiliser du texte plutôt qu’une image sur un lien HyperText, et utiliser le CSS pour faire de la personnalisation graphique.
/p>
IX. Changer noms fichiers css/images + noms balises css
Le robot google parcoure le site internet et ne regarde que le texte. Il s’inspire des noms des différents « div » de la page pour se faire une idée du contenu de la page. Il en est de même pour les noms des fichiers utilisés.
Ex :
Actuellement sur un site se trouve :
<link rel="stylesheet" type="text/css" href="typo3temp/stylesheet_0fd02d0f4a.css" />
<link rel="stylesheet" type="text/css" href="fileadmin/templates/main/css/columns2.css" />
-------------------------------------------------------------------------------------------------------------------
Alors qu’il serait plus parlant d’avoir :
<link rel="stylesheet" type="text/css" href="Portfolio-Mathieu-Preuilh.css" />
<link rel="stylesheet" type="text/css" href="Mathieu-Preuilh-Experience-Professionnel.css" />
Pour ce qui est des balises « div » c’est la même chose, au lieu d’avoir :
<div id="outer-wrapper">
<div id="header">
<div id="header-img>
<div id="top">
Où sont les mots clés ? Nulle part. Il serait donc préférable d’avoir :
<div id="Portfolio-Mathieu-Preuilh">
<div id="Mathieu-Preuilh-menu">
<div id="Portfolio-image>
<div id="curriculum-vitae-mathieu-preuilh">
Et ainsi de suite …
Point de vue Technique
X. Ecriture du contenu
On en entend souvent parler, et pour cause, ceci est l’un des points les plus importants du référencement d’un site internet. Si vous regardez les sites internet ayant un très bon résultat au niveau des recherches Google, ils ont pratiquement tous pour ne pas dire tous, beaucoup de contenu.
Qu’entend-on par « contenu » ?
Le contenu d’un site est le texte qu’il contient. Le contenu d’un site est ce qui va intéresser l’utilisateur. D’autant plus que lorsque Google parcoure le site, il ne voit pas les images, il ne voit que votre texte. Il est donc important de bien étudier le texte contenu sur son site internet.
Pour bien rédiger le contenu du site, il suffit de suivre les règles suivantes :
- Le rédiger en pensant que c’est pour l’utilisateur ;
- Ne pas utiliser du langage trop soutenu ou trop technique (suivant le sujet) ;
- Ne pas faire un grand nombre de répétitions successives de nos mots clés ;
- Utiliser des listes pour casser le rythme de lecture et laisser l’utilisateur respirer (ul,li) ;
- Bien organiser tout le contenu grâce à des titres de chapitres (h2,h3, …) ;
- Ne pas faire de fautes d’orthographe.
Pour améliorer le référencement il faut également ne pas faire de répétitions. En revanche il est conseillé d’écrire un mot sous toutes ses formes tel que:
- écrire
- écrivez
- écriture
- écrit
- rédiger
- texte
- paragraphe
- article
- …
Bien entendu il ne faut pas se limiter à des mots uniques, ceci concerne les expressions de plusieurs mots :
- écrire pour le web
- rédiger pour le web
- écrire pour le référencement
- rédiger pour le référencement
- rédaction web
- …
Pour améliorer un peu plus le contenu du site, il est nécessaire d’utiliser les balises « <b> » et « <em> ». Ceci a pour but de mettre en valeur les zones de textes importantes du contenu. Les bouts de textes mis en gras ou italiques, seront pris en compte par le moteur de recherche google comme mots clés sur la page actuelle. Il est donc important de bien étudier le contenu de chaque page.
Toujours au niveau du contenu, une opération un peu longue certes, mais qui ajouterait de la popularité au site, serait de rajouter une section « Définition » sur le site internet, et donc de mettre des liens HyperText sur chaque mots technique présents sur le site, et de les pointer vers la définition associée. Ceci est dans le but de simplifier la vie à l’utilisateur, dans le cas où il serait un peu perdu. Je rappelle que Google favorise au niveau du référencement les sites qui aident l’utilisateur tout au long de sa navigation. Ce système est d’autant plus intéressant au niveau du référencement, qu’il rajouterait du contenu au site internet.
XI. Rajouter page Erreur 404
Ce critère est présent dans le référencement, car effectivement, il permet de montrer à un utilisateur qu’il se trouve sur une page inexistante, sans pour autant le surcharger de messages d’erreur complexe, affiché sur une page blanche comme on trouve encore fréquemment sur internet.
Démonstration sur un site normal :
Aperçu Page erreur 404
Il est préférable d’avoir un affichage d’une page semblable à l’ensemble du site, expliquant à l’utilisateur, que la page souhaitée n’existe pas. Au même moment, nous pouvons lui proposer de le rediriger vers la page d’accueil du site.
Exemple de page 404 :

Aperçu page erreur 404
XII. Réaliser un fichier Robots.txt
L'usage de « robots.txt » permet d'éviter que des ressources sans intérêt public se retrouvent dans la page de résultats d'un moteur de recherche. En outre, le fait que les robots n'accèdent pas à ces ressources allège le travail du serveur HTTP et le trafic sur le réseau informatique.
Il est important de comprendre qu’il ne s’agit là que d’une indication sur ce que doivent faire les robots bienveillants, ce n’est en aucun cas un élément de sécurité. En effet, certains robots ignorent ce fichier, soit délibérément parce qu’ils cherchent des informations privées (des adresses électroniques par exemple, pour y envoyer du courrier indésirable), soit parce que le robot est trop simple pour gérer ce standard.
Ex :
User-Agent: *
Disallow: /js/
Disallow: /logs/
Disallow: /Tag/
Ce fichier « robots.txt », indique au robot Google, qu’il ne doit pas indexer les pages présentes dans ces répertoires. Effectivement, il n’y a aucun intérêt à ce que le robot parcoure le répertoire « js » ou « log », contenant aucune page html.
XIII. Réaliser un fichier Sitemap.xml
Un site map est, littéralement en anglais, le « plan d'un site web ». Il s'agit d'une représentation de l'architecture du site, qui liste les ressources proposées, en général sous forme hiérarchique. Il s'agissait, il y a quelque temps, en général d'une page web qui permettait à l'internaute d'accéder rapidement à l'ensemble des documents proposés sur le site, et facilitait donc le travail des robots d'indexation.
Google a conçu le protocole Sitemaps qui consiste en une représentation du plan des sites en texte ou en XML, à destination exclusive des moteurs de recherche.
Il existe des solutions à installer sur le serveur (ou non) qui nous génère ce fichier directement. Par la suite il faut juste le soumettre à google pour qu’il prenne la nouvelle version en compte.
Ex de fichier sitemap :
<urlset>
<url>
<loc>http://e-scm.eu/</loc>
<lastmod>2009-02-01</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://e-scm.eu/Un-metier/</loc>
<lastmod>2009-02-08</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://e-scm.eu/Un-metier/Réduire-les-coûts-de-transport.html</loc>
<lastmod>2009-02-08</lastmod>
<changefreq>monthly</changefreq>
<priority>0.5</priority>
</url>
</urlset>
XIV. Mise en place d’un blog
Un blog est un tremplin énorme dans la phase de référencement. Effectivement, il permet à des utilisateurs de venir sur le site régulièrement pour visualiser les dernières modifications, il permet également de mettre en place du contenu et donc d’augmenter la popularité du site.
Etant sur Viadéo, j’ai pu voir que bon nombre de personnes, rédigent des articles de blog sur cette plateforme. Ceci n’a pas grand intérêt, car comme on me l’a souvent dit, il n’y a pas beaucoup d’activité dans cette communauté.
Plutôt que de perdre du temps sur Viadéo, il serait préférable de rédiger ces articles sur le blog du site internet et donc améliorer sa popularité sur internet. Pour que ce blog soit plus efficace, il faut qu’il puisse donner la possibilité aux utilisateurs de s’abonner à des flux RSS contenant les derniers articles du blog, et donc permet à l’utilisateur de recevoir l’actualité en temps réel. Ce blog doit également donner la possibilité aux utilisateurs, de commenter des articles, pour faire vivre le site. Effectivement, plus il y a de vie sur un site, plus il monte niveau référencement.
Pour réaliser un tel blog, il existe des plateformes, tout comme typo3, permettant d’installer un blog tout fait sur notre site internet.
XV. Amélioration Page Rank
Le Page Rank ou PR est une note calculée par Google pour déterminer la pertinence qu’il va accorder à une page web.
En développant le Page Rank, on augmente nos chances d’apparaître dans les résultats de recherche sur les requêtes concurrentielles liées aux mots-clés présents sur notre site.
Cette note est faite en fonction des liens externes (backlinks) pointant vers une page web et des liens faits vers elle-même à l’intérieur du site (liens internes). Pour deux pages au contenu comparable, celle ayant le meilleur Page Rank aura plus de facilité à être bien classée, surtout pour les requêtes très concurrentielles.
Google a instauré des filtres détectant et sanctionnant les campagnes massives de liens artificiels et en intégrant des critères qualitatifs à l’analyse des liens et du contenu de la page web. Pour cela, il faut donc avoir des backlinks de sites ayant la même thématique que notre site. Il ne faut donc pas avoir de backlinks venant par exemple de nos clients, à moins qu’ils aient dédié une page spéciale à notre activité.
L’idéal serait d’avoir des backlinks venant de site de référence dans notre domaine, bien côté sur Google.
Le Page Rank d’une page augmente donc en fonction :
- Le nombre de liens entrants et sortants ;
- de l’importance du Page Rank de ces pages ;
- de la qualité d’écriture de votre page ;
- les ancres présentes sur la page ;
- le trafic associé à la page ;
- le comportement de lecteurs : le choix de la page dans les résultats ;
- le nom de domaine ;
- l'hébergement.
Illustration représentant le fonctionnement du Page Rank
Cette représentation explique, qu’il vaut mieux avoir un backlink venant d’un site ayant un Page Rank élevé, que plusieurs backlinks venant de sites internet ayant un Page Rank faible.
Note : Proposée gratuitement, la barre d’outils Google permet la visualisation du Page Rank des pages de votre site (http://toolbar.google.com/).
XVI. Prévenir google de notre arrivée
Pour informer à google que notre site est prêt et qu’il n’est plus en phase de développement, il faut réaliser deux opération. La première est d’aller sur le site de google à cette adresse :
Et de suivre la procédure pour ajouter le site.
La seconde étape est de rajouter le site dans un annuaire appelé DMOZ. Un annuaire est un site qui classe un grand nombre de sites internet par catégories. Cet annuaire est l’annuaire officiel qu’utilise Google actuellement. Aujourd’hui il est donc nécessaire de s’enregistrer sur cet annuaire.
L'inscription du site dans DMOZ aura deux conséquences :
- Le site pourra être trouvé dans une recherche sur DMOZ ou sur tous les autres sites l'utilisant, dont Google ;
- Le site obtiendra un lien issu d'un site à forte notoriété (aux yeux de Google notamment), ce qui devrait bien aider le référencement.
Pour s'inscrire, il faut parcourir les catégories de l'annuaire, en partant de “World > Français”. Une fois que l’on a trouvé la meilleure catégorie, il faut cliquer sur le lien “Proposez un site” en haut à droite de la page, et suivre les instructions.
Attention à bien respecter les consignes, notamment pour le titre et la description. Il faut bien choisir le titre, sans faire d'accumulation de mots-clés. Idem pour la description qui doit être en français, avec de vraies phrases, sans reprendre le titre ni les mots apparaissant dans le nom de la catégorie.
Dans le cas contraire, le site risque d'être mis de côté par les éditeurs qui préfèrent traiter en priorité les demandes d'inscription respectant les consignes. Il faut surveiller l’orthographe, ne pas mettre de superlatifs du style “le meilleur site de…” et construire une véritable phrase pour la description, qui ne doit pas être une accumulation de mots-clés.
On peut vérifier sur www.dmoz.org si le site a été accepté, puis sur Google si l'annuaire a été mis à jour.
Quel est le délai d'acceptation dans DMOZ?
Le délai varie de quelques minutes à jamais. Différents critères peuvent accélérer l’ajout d’un site dans DMOZ. Dans certaines catégories le délai se chiffre en mois, voire plus. Dans d'autres, le délai est de quelques jours. A noter que plus une catégorie est "concurrentielle", plus il y aura de demandes et plus le délai sera long.
