L’opérateur Google « site » : cas concrets de recherches avancées

Google met à notre disposition un ensemble de commandes (appelées “opérateurs”) nous permettant d’affiner notre recherche sur son moteur. Elles s’utilisent de la même manière que n’importe quelle autre recherche classique et vous permettent d’obtenir des réponses sur un grand nombre de problématiques liées au référencement de sites web.
Via cette série d’article, nous allons tenter de vous faire partager notre vision et la façon dont nous utilisons ces outils qui peuvent s’avérer d’une redoutable efficacité.

L’opérateur « site: »

La commande site: permet de lister les pages de votre site web présentes dans l’index Google. Elle s’utilise de la manière suivante :

site:exemple.com

Les informations retournées sont précieuses et permettent d’analyser l’état de santé de votre site web (ou de celui de vos concurrents) mais également de détecter des problèmes internes d’architecture.

Surveiller l’état de santé de votre site internet

Si vous publiez régulièrement du contenu mais que le nombre de vos pages indexées stagne ou diminue, il faut commencer à s’interroger sur la pertinence du maillage interne et/ou la qualité du contenu de votre projet (cf. Google Panda).

À l’inverse, on trouve parfois des sites composés (en apparence) d’une dizaine de pages mais qui, après analyse Google des résultats, possède en réalité des milliers d’éléments dans l’index. Cette problématique est généralement rencontrée lors d’une mauvaise utilisation d’un plugin de pagination ou de navigation à facettes (cf. l’anecdote du calendrier sur l’excellent article de Simon Georges “SEO et indexation de site : théorie et pratique”).

Pour éviter de devoir effectuer une veille manuelle sur cet indicateur, nous vous invitons à utiliser le module “Index status” de la Google Search Console. Ce dernier est très pratique puisqu’il effectue un relevé hebdomadaire de ces données et en conserve un historique présenté sous forme de graphique (et exportable en CSV).

Évaluer la pertinence d’une page aux yeux de Google

Transformer Google en moteur de recherche interne afin d’analyser la pertinence d’une page au sein d’un site web est également une possibilité d’utilisation intéressante.

Imaginons que je possède un site de recettes de cuisine dont chaque page est dédiée à une recette en particulier. J’ai donc une page pour la recette de la tarte aux pommes, une autre pour celle du gâteau au chocolat, etc..

Afin d’espérer être numéro 1, un jour, sur la requête “recette tarte aux pommes”, il faut d’abord que je vérifie que ma page consacrée à la recette de la tarte aux pommes et bel et bien la plus pertinente sur ce mot-clé au sein même de mon site.

site:monsitedecuisine.com “recette tarte aux pommes”

L’utilisation de cet opérateur va ici mettre en concurrence les pages de mon site et lister les plus pertinentes aux yeux de Google sur ce mot-clé. Si ma page traitant de la recette de la tarte aux pommes n’est pas 1ère, il y a encore du travail d’optimisation à faire.

À la recherche du spot perdu

L’opérateur site: ne prend pas nécessairement un nom de domaine pour valeur. Vous pouvez également spécifier un tld (top level domain) et Google vous listera l’ensemble des pages de son index possédant cette extension.

Si vous combinez un tld à forte autorité avec une expression-clé en rapport avec votre thématique, vous trouverez rapidement de potentiels spots intéressants sur lesquels vous pourrez essayer de poser un lien vers votre site afin d’en améliorer la visibilité.

Un allié pour la sécurité

En combinant cette commande avec des mots-clés “borderline”, vous pouvez également détecter les pages des sites qui ne modèrent pas leurs commentaires ou qui se sont fait hackés (et dont la version non-patchée est encore dans le cache de Google).

Nous vous invitons à vérifier pour votre site internet, il y a parfois de sacrées surprises.

Un autre exemple est celui des espaces de pré-production (ou « staging ») qui permettent aux développeurs de vérifier le bon fonctionnement de leur code sur une configuration serveur identique à celle de la production. Dans un grand nombre de cas, cette zone se situe sur un sous-domaine de type :

  • staging.monsite.fr
  • preprod.monsite.fr
  • test.monsite.fr

Via l’opérateur « site », on peut très facilement retrouver les staging non-protégés qui ont été indexés dans Google.

Pensez à sécuriser l’accès à cette zone via un .htaccess afin d’interdire l’accès aux visiteurs humain ET aux robots des moteurs de recherche. Vous éviterez ainsi de dévoiler à vos concurrents les fonctionnalités en cours de développement sur votre site. 🙂

Les exemples d’utilisation ci-dessus ne sont qu’un échantillon de ce qu’il est possible de réaliser avec cet opérateur mais nous espérons qu’ils vous auront permis de (re)découvrir le formidable potentiel de cet outil.

Prêt à travailler avec nous ?

Contactez-nous, ou venez nous rencontrer pour discuter de vos projets.