Comment ne pas référencer une page ?

Comment ne pas référencer une page sur son site internet lorsqu’elle contient des données réservées aux personnes inscrites ou pour une tout autre raison ? Mettre un mot de passe sur la page empêchera Google de la référencer, mais est-ce vraiment la solution dont vous avez besoin ? 

Voyons ensemble nos méthodes dans notre agence de référencement de site web à Colmar comment dé-référencer une page ou tout simplement la bloquer à l’indexation !

Via le robots.txt

comment ne pas referencer une page internet
Comment ne pas référencer une page web ?

Dans votre fichier Robots.txt, vous avez la possibilité d’empêcher l’indexation de vos pages grâce à la fonction Disallow: 

Pour la désindexer, il vous suffit d’éditer votre fichier Robots.txt de cette façon : Disallow:url

Alors, quand est-il intéressant d’utiliser le robots.txt et quand est-ce qu’il faudrait éviter de l’utiliser ? Nos recommandations seraient de privilégier cette méthode lorsqu’il s’agit de tout un répertoire à désindexer, exemple : ndd/repertoire/repertoire-a-desindexer/

Dans ce cas-là, le robots.txt est très intéressant, car en 1 seule ligne, vous parvenez à empêcher l’indexation d’énormément d’url. Cependant, si vous devez empêcher l’indexation de 2000 pages avec des chemins unique, ces Urls pollueront votre fichier et sera moins agréable à gérer de votre côté et moins facilement analysable par Google. Nous vous recommandons donc cette méthode sur un petit échantillon de pages ou sur un sous-dossier complet.

Une préconisation souvent faite pour s’assurer de la bonne désindexation de vos pages est de combiner cette méthode dans le robots.txt et de l’associer au no index. 

No Index, No Follow

Le no-index, no-follow est une méthode utile pour bloquer l’indexation des pages. Bon à savoir, il s’agit d’une recommandation à Google, s’il juge que la page est pertinente à l’indexation, il ne prendra pas en compte votre directive. C’est pourquoi j’ai mentionné précedemment d’associer le blocage via le robots.txt et la fonction no-index est une bonne pratique. 

À savoir, le fichier robots.txt a plus de poids que le no-index, Google écoutera donc davantage le robots.txt et indexera moins de pages de lui-même. 

Donc, dans quel cas de figure privilégier le no-index qu’au robots.txt ? Pour nous, cette méthode est très utile s’il s’agit de quelques pages ciblées ou d’un grand échantillon de pages qui ne sont pas dans le même répertoire. 

Comment désindexer une page ?

Nous sommes maintenant dans le cas de figure où Google a décidé d’indexer des pages non désirée. Que faire ? C’est une question plus difficile lorsqu’il s’agit de revenir en arrière. 

Il est aussi important de peser le pour et le contre, est-ce que cette page me génère plus de CA depuis qu’elle est indexée ? Est-ce qu’elle convertit beaucoup comparé au moment où elle n’était pas indexée ? Est-ce qu’elle est bien positionnée ? Toutes ces questions sont importantes pour s’assurer que cette action sera positive pour votre site !

Désindexer via la Search Console

2 choix sont possibles, la première, utiliser la fonction “Suppression” dans la Google Search Console. Voici les étapes à suivre pour désindexer des pages déjà présentes sur Google :

  1. Cliquez sur “Suppressions” dans l’onglet indexation
  2. Cliquer sur “Nouvelle demande”
  1. Renseigner l’url ou le chemin de l’url en choisissant le bouton radio correspondant

Attention, la désindexation via Google est effective pendant 6 mois. Après cette période, la page se retrouve autorisé à l’indexation. À vous donc de réagir et d’empêcher l’indexation via une des méthodes présentées précédemment. 

Quand utiliser cette astuce ? Dans deux cas de figure. La première, lorsqu’il s’agit de peu d’url à désindexer. La deuxième, lorsqu’il s’agit d’un sous-dossier complet à désindexer. 

Mais, comment faire lorsque l’on doit désindexer des centaines d’url avec un chemin unique ? L’outil de la Google Search Console est bien, mais demande énormément de temps si l’on doit entrer chaque Url à la main. Voyons ensemble une astuce peu connue qui peut vous faire gagner énormément de temps !

Désindexer des pages plus rapidement : Création d’un sitemap.xml

Cette méthode vous permet de désindexer rapidement des centaines, voire milliers de pages le plus rapidement possible. 

  1. La première étape, lister toutes les pages que vous voulez désindexer (dans le cas de figure où elles sont présentes sur Google). 
  2. Deuxième étape, attribuer à toutes ces pages l’attribut “no-index”. 
  3. Troisième étape, créer un sitemap avec uniquement les Url sélectionnée. 
  4. Dernière étape, envoyer le sitemap dans la Search Console dans l’onglet “Sitemap”

Pourquoi suivre ces étapes ? Car Google visitera beaucoup plus rapidement toutes les pages présentes sur le sitemap, verra l’attribut no-index et les désindexera !

Voilà, notre guide touche à sa fin, nous avons rédigé une multitude d’article vous apportant de la valeur, par exemple : pourquoi faire du référencement naturel ? Ou encore .fr ou .com en SEO, lequel choisir ? N’hésitez pas à les lires, nous serions ravis de vous apprendre des astuces SEO !

4.7/5 - (22 votes)