Google Panda est le nom d’un algorithme développé par Google afin de filtrer les contenus suggérés aux internautes dans les résultats de recherche. Son rôle est d’évaluer la qualité et la richesse des informations délivrées par les pages web qu’il contrôle. La première version de Google Panda sort le 24 février 2011 exclusivement aux États-Unis.

Au mois d’août de la même année, le bot est exporté sur tous les sites du globe indexés par le célèbre moteur de recherche. En janvier 2016, après de multiples mises à jour, Panda se voit intégré à l’algorithme principal et rebaptisé Coati pour l’occasion. google panda La nouvelle appellation restera néanmoins très confidentielle, au point de n’être divulguée qu’à la fin de l’année 2022.

Google Panda : contrainte SEO ou encouragement au contenu de qualité ?

Ce que nous avons expliqué un peu plus haut relève peut-être du bon sens, et pourtant… Avant l’instauration de Google Panda, qui n’a vraisemblablement pas profité à tout le monde, beaucoup de sites très bien référencés ne délivraient que du contenu médiocre. Le phénomène avait pris de l’ampleur après que Caffeine était venu accélérer l’indexation des pages internet en 2009.

À cette époque, les critères pour ranger de l’information dans la catégorie des spams étaient assez flous. Aussi pouvait-on voir prospérer de véritables content farms”, publiant des milliers d’articles par jour sans fond, prétextes uniquement à diffuser de la publicité en continu. En résumé, comme dans beaucoup d’autres domaines, la stratégie du plus prolifique l’emportait sur le plus recherché.

L’expérience utilisateur aux origines de la conception de Google Panda

Il convient de saluer la démarche des développeurs, lesquels se sont renseignés directement auprès de l’utilisateur pour déterminer ce qui atteste de (et non ce qui fait) la qualité d’un site.

Ainsi, pour définir le comportement de leur nouvel algorithme, ils ont envoyé à un groupe test des documents type page web avec un formulaire à remplir. Il y figurait des questions telles que : “Auriez-vous confiance pour enregistrer votre carte de crédit sur ce site ?” ; “Seriez-vous d’accord pour donner à vos enfants des médicaments prescrits par ce site ?”, etc.

De leurs impressions critiques, il en est ressorti une liste de critères qu’Amit Singhal a présentés sous forme de questions pour le moins édifiantes. Nous vous invitons à les lire attentivement, car elles marquent parfaitement la frontière entre le dealer d’infos coupées à la pub, et le marchand de produits frais, fruits d’un labeur sérieux.

23 questions : la grande table des commandements de Singhal

Voici donc le grand miroir que tend Singhal à votre contenu : il ne sera pas inutile de l’affronter de temps à autre.

Et parce que nous appliquons à la lettre les préceptes que l’on vous délivre, nous nous sommes adonnés à un petit classement par catégories.

Sur l’intention derrière l’article ou la page

  • Les thèmes sont-ils motivés par les intérêts réels des visiteurs, ou le contenu a-t-il été généré pour ses chances de se voir bien positionné dans les SERP ?
  • Le site contient-il des articles en double ou redondants, sur des questions similaires voire identiques, avec de légères variations de mots-clés ?
  • Cet article contient-il un nombre excessif de publicités qui détournent l’attention des internautes ou interfèrent avec le contenu principal ?

Sur le soin apporté à la qualité du contenu

  • Le contenu est-il produit en masse par un grand nombre de créateurs, ou réparti sur un vaste réseau de sites, de sorte que les pages ou sites individuels ne reçoivent qu’une attention et un soin limités ?
  • L’article a-t-il été bien édité, ou semble-t-il bâclé ou produit à la hâte ?
  • Les articles sont-ils courts, peu substantiels ou manquent-ils de détails utiles ?
  • Les pages sont-elles produites avec beaucoup de soin et d’attention aux détails?
  • Cet article est-il écrit par un expert ou un passionné chevronné, ou est-il traité superficiellement ?
  • Cet article comporte-t-il des fautes d’orthographe, une pauvreté de style ou des erreurs factuelles ?
  • Cet article fournit-il une description complète ou détaillée de ce qu’il aborde ?
  • Cet article contient-il une analyse perspicace ou des informations intéressantes qui ne sont pas évidentes ?
  • L’article fournit-il des informations originales, sous une forme originale, accompagnée d’une analyse originale ?
  • La page apporte-t-elle une valeur substantielle par rapport à d’autres pages dans les résultats de recherche ?

Sur le degré de confiance et de crédibilité

  • Feriez-vous confiance aux informations présentées dans cet article ?
  • Seriez-vous prêt à donner vos coordonnées de carte de crédit à ce site ?
  • Le contenu fait-il l’objet d’un contrôle de qualité ?
  • L’article est-il impartial, voire multi-point de vue ?
  • Le site est-il une autorité reconnue sur le domaine qu’il traite ?
  • Pour une question relative à la santé, feriez-vous confiance à des informations provenant de ce site ?
  • Reconnaîtriez-vous ce site comme une source faisant autorité lorsqu’il est nommément cité ?
  • Est-ce le genre de page que vous voudriez mettre en signet, partager avec un ami ou recommander ?
  • Vous attendriez-vous à voir cet article plutôt dans un magazine, une encyclopédie ou un livre imprimé ?
  • Les utilisateurs se plaindraient-ils en consultant les pages de ce site ?

Quels sont les contenus ciblés par Google Panda ?

Difficile d’être rigoureusement précis sur les pratiques réprouvées par le bot. En effet, Google ne dévoile pas facilement le fonctionnement exact de ses bots ; ce serait prendre le risque de laisser aux webmasters le moyen d’abuser de ses mécanismes.

En conséquence, les rédacteurs web de tous les pays sont tenus à une même ligne éditoriale, à la fois vague et indicative des bonnes habitudes à prendre. À ce titre, un porte-parole officiel de Google aurait prescrit (je traduis) : « À la fin de la journée, les propriétaires de contenu ne devraient pas se demander combien de visiteurs ils ont eu tel jour, mais plutôt combien de visiteurs ils ont su aider. » ChatGPT et contenus de mauvaise qualité Dans l’esprit, il s’agit de chercher à publier un contenu original, utile et complet. Concrètement, cela revient à éviter, par exemple :

  • le contenu dupliqué, qu’il soit interne ou externe (plus d’explications dans notre définition du duplicate content) ;
  • des normes rédactionnelles d’un faible niveau (fautes et pauvreté de langue) ;
  • de la sous-optimisation ou suroptimisation de mots-clés ;
  • trop d’articles et de pages sur le même sujet ;
  • le fluff content, thin content, etc. c’est-à-dire les sujets traités de manière très superficielle ou lapidaire afin de gonfler son site internet ;
  • les contenus artificiels, rédigés automatiquement par des générateurs de contenu comme ChatGPT, dont les défauts peuvent amplement nuire à l’expérience utilisateur (phrases malhabiles, intox, redondances, etc.) ;
  • un UI design mal géré ;
  • beaucoup de pubs intrusives ;
  • un maillage interne défaillant ;
  • tout ce qui touche aux spams, c’est-à-dire des textes hors-sujet, inutiles et dupliqués des dizaines de fois, dans des commentaires de blog, des forums, des avis, ou même le keyword stuffing pratiqué par les grands impatients débutant en SEO…

Des fondamentaux dont il serait dangereux de s’écarter, car, depuis son lancement, Google Panda reçoit régulièrement des ajustements qui vont toujours plus dans ce sens. En somme, toute négligence sur l’authentique intérêt du contenu peut vous porter préjudice.

Quelles pénalités encoure-t-on avec Google Panda ?

À ses tous débuts, Google Panda supprimait tout bonnement et simplement des résultats de recherches les sites internet qu’il considérait comme étant de piètre qualité, impactant plus de 12% des sites aux États-Unis. En effet, avec les fermes de contenus (sites proposant du contenu médiocre – mais bourrés de mots-clés – servant à générer des revenus via les espaces publicitaires) il y avait du ménage à faire ! Google Panda (1) Heureusement, au gré de ses améliorations, le bot est devenu moins rigide, et l’hécatombe de black listages a laissé place à davantage de déclassements simples, sans intervention humaine. Cela dit, en cas d’infraction sévère aux directives de Google, il peut toujours arriver qu’un site entier se fasse bannir des SERPs, et ce sans ré-indexation possible.

Note Bene : les sites qui perdent seulement quelques places au classement – ce qui est déjà grave en SEO – perdront également en budget crawl. Les mises à jour seront donc indexées moins rapidement.

De Google Panda à Google Coati : quel changement ?

Aucun. Pour l’anecdote, le filtre Panda a fini par intégrer l’algo principal de Google (vraisemblablement autour de 2016). Google Coati En interne, son nom aurait alors évolué en “Coati Optimization Algorithm” en référence à l’intelligence de l’animal.

Comment réduire l’impact Google Coati sur notre site web ?

Un site web mal vu par Google Coati a 60 % de chances de perdre une grande part de trafic organique. Voici donc, sur un plan plus technique, comment ne pas s’attirer les foudres de la mise à jour Panda, et garder la confiance des internautes.

Produire des contenus de qualité

Aujourd’hui, les contenus pertinents rassemblent les critères suivant (voir aussi notre article sur les EEAT de Google) :

  • ils sont fiables et utiles à l’utilisateur qui lance une requête précise ;
  • ils sont meilleurs que ceux de la concurrence ;
  • ils sont originaux, en substance (infos inédites, angle de vue, etc.) comme en apparence (structure pédagogique, style naturel, médias qui enrichissent le propos, etc.).

Mais outre la qualité des contenus, il existe des cas particuliers que nous détaillons ci-dessous.

Sites agrégateurs : entre production de contenu et webographie, il faut choisir

À moins de tenir un annuaire digital, si vos pages de contenus renvoient davantage vers d’autres contenus qu’elles n’en proposent elles-mêmes, alors il y a un souci. En effet, si un contenu pertinent est indexé par Google, il apparaîtra en haut des SERP. Nul besoin, donc, de vous-même vous placer premier si c’est pour rediriger l’internaute vers le second.

Selon John Mueller, c’est un clic supplémentaire pour rien. Ainsi, se contenter de remplir vos pages webs de liens (certes pertinents) autour d’un contenu archi-plat vous expose aux foudres de Google Panda (pour aller plus loin, n’hésitez pas à vous renseigner sur les pénalités Google).

Contenu généré par des utilisateurs : un phénomène à double-tranchant

Bien sûr, les sites interactifs, qui donc appellent à un engagement, font des utilisateurs des contributeurs spontanés. On connaît cependant les travers d’internet : pour une pépite, on trouve 2 trolls, 3 fausses informations et 5 inutiles. Comment peut-on faire vœu de pertinence dans de telles conditions ?

Que faire avec son blog, son forum ou même sa chaîne YouTube pour rester bien classé ? En fait, chaque support nécessite un certain niveau ou type de médiation, surtout afin de valoriser les meilleures contributions d’un site Web.

Pour les forums : quelques tours de passe-passe suffisent

Les internautes viennent échanger sur les forums afin de répondre ensemble à des problématiques communes. Toutefois, le contenu généré par les utilisateurs peut être de qualité très médiocre, voire inclure des spams. L’idéal est de reconnaître rapidement ce type de contenu par des outils automatisés, pour ensuite empêcher leur indexation.

En outre, il faudra que les propriétaires de forum établissent des règles internes strictes et garde la main sur certaines zones d’édition. De la sorte, il lui sera loisible de changer un titre peu évocateur tel que “‘J’y arrive pas ça m’énerve !” et surtout d’indiquer lorsque la solution à un problème figure bien dans le fil de discussion, avec entre crochets, le terme “[RÉSOLU]”, par exemple.

Les commentaires : comment en générer de bons ?

Ce qui est bien avec les commentaires, c’est que pris dans l’ensemble, ils reflètent la qualité d’une chaîne ou d’un site. Un contenu polémique crée la polémique, le bâclé n’attire que l’indifférence, l’amusant amène des smileys, le pertinent amène du construit. Ainsi, le fait d’en voir de très bons incite Google Panda à vous positionner plus haut. Quoi de plus normal, puisque votre contenu a été assez puissant pour “faire des petits”, en faisant germer un autre contenu pertinent !

Toutefois, si votre site est victime de son succès, il est toujours possible de paginer les commentaires ou de ne pas les afficher en HTML. Pour le reste, c’est toute une communauté qu’il s’agit de gérer, et il se peut que la difficulté de répondre laisse place à l’envie de bloquer et de supprimer.

Suppression de pages ? Préférez la noindexation !

Au lancement de Google Panda, la question de la suppression de contenu a obtenu une réponse claire : mauvaise idée! Ou alors, en dernier recours. En effet, Maile Ohye a rapidement donné une solution : si vous n’êtes pas satisfait(e) d’une page, utilisez robots.txt ou NOINDEX pour empêcher qu’elle ne soit indexée. Cela vous laisse le temps pour une mise à jour aux petits oignons. D’ailleurs, ce peut être une occasion de vérifier si des internautes la visitent malgré tout.

Quant aux commentaires, c’est souvent dommage de les supprimer. Certes, on connaît le terrible phénomène de “shit storm”, mais avant d’en arriver là, chaque opinion négative peut révéler un véritable problème avec le contenu. Parfois, c’est dix fois mieux que Google Analytics en termes de retours ! D’autre part, censurer les utilisateurs ternira forcément votre image…

Duplication interne : un facteur mineur facile à améliorer

La duplication interne peut simplement venir d’une mauvaise manipulation, et Google en a conscience. Cela étant, si vous vous apercevez que vous êtes bas dans les SERP et que vos articles ont tendance à beaucoup se citer entre eux, avec des morceaux entiers de contenu, peut-être est-il temps d’en fusionner quelques-uns, et de rediriger les anciennes URL.

Sites multimédias : le format texte n’est pas une obligation

Google Panda a été accusé plusieurs fois à tort de dévaloriser les sites ne proposant pas, ou très peu, de contenu textuel. John Mueller s’est empressé de les démentir, affirmant qu’un site principalement composé d’images peut positionner premier dans les pages de recherche. D’ailleurs, la dimension multimédia est plutôt un indice de qualité, tant qu’il sert l’utilisateur et qu’elle n’augmente pas trop les temps de chargement.

Affiliations et publicités : tout est affaire de dosage

En principe les sites affiliés n’inquiètent pas spécialement Google Panda. Seulement, c’est typiquement le genre de site dont l’administrateur est tenté de fournir un contenu à la va-vite. Ou bien le contenu est de qualité, mais caché ou interrompu par trop de publicités.

Et là, vous pouvez être certains que le professeur Panda ne va pas aimer du tout ! Cela étant, il suffit parfois de bien placer les annonces sur sa page pour s’épargner le courroux du bot. Quant à la stratégie consistant à multiplier les pubs et les liens d’affiliation pour compenser la perte de trafic… c’est du suicide, tout bonnement !

Pour finir…

Google Panda (ou Coati) a beau avoir provoqué la panique chez un très grand nombre de webmasters, il n’est pas à prendre comme une pénalité en soi, mais simplement comme un filtre capable de valoriser les contenus les plus qualitatifs, aidant les internautes à résoudre leurs problèmes, dans une perspective de « people-first content » (qu’on pourrait traduire par “contenu tourné utilisateur”).

Ainsi, plutôt que de le craindre, sans doute vaut-il mieux faire confiance à la sagacité de ce fragment de l’algorithme Google, qui serait aujourd’hui en mesure de mettre en avant l’expertise des spécialistes, la solidité des sources et l’efficacité avec laquelle les infos sont délivrées.

FAQ
D'où vient le nom de Google Panda ?
On attribue le nom de l’algorithme à Biswanath Panda, un ingénieur qui aurait contribué au machine learning appliqué au comportement des utilisateurs.
Google Coati agit-il en temps réel ? 
Depuis le 17 juillet 2015, Coati aurait été incorporé dans l'algorithme de base de Google. Cela signifie que l’algorithme ne joue plus un rôle de filtre, mais intervient dès le classement initial. Cela étant, Google Panda n'agit pas en temps réel.
Google Coati est-il régulièrement mis à jour ?
Si la dernière version de Google Coati remonte à 2016, l’algorithme a connu une série de pas moins de 30 mises à jour depuis 2011. Il semblerait que depuis qu’il a été intégré au cœur du processus de classement, les choses se soient relativement stabilisées.