vendredi 31 juillet 2015

[Référencement & Duplicate Content] Pourquoi Google a-t-il une Sainte Horreur de Voir un Texte en Double sur un ou Plusieurs Sites ?

{ #66 - 31/07/2015 MAJ - 17/09/2015 } : Pourquoi ce cher Google n'aime pas voir du texte en double sur plusieurs pages, ou même pire, sur plusieurs sites différents ?

Il y a fort à parier qu'il y a fort longtemps, dans un lointain Open Space, meublé entre autres, de bureaux, chaises, moquettes, cloisonnages et tapis de souris plus ou moins cheap alors gagnés à la kermesse, les ingénieurs du labo Anti-Spam du "Géant Fou de Montain View" se sont penchés sur la question de la Duplication de Contenu au seing de l'index du moteur.

Un beau jour, après tout un tas de questionnements et de raisonnements hardcores en tous genres, imbuvables pour le commun des mortels, les ingénieurs nous ont pondu au final, un super filtre de la mort qui tue la duplication de contenu. J'ai nommé, notre cher ami :


PANDA
"Serial Quality Content Manager (Google)"


à ne pas surtout pas confondre
avec notre célébrissime (?) ami :

PANDIT G


Assidu de SEO tel que vous l'êtes, vous êtes certainement au courant à propos de la version 4.2 déployée dernièrement. Panda n'aime pas la duplication de contenu ? Voyons voir un peu ce qui peut bien titiller ce bougre bougon lourd, croqueur de bambou noir et blanc...

DES PROBLÈMES RÉCURRENTS...


Un problème de classement :

Il existe pas mal d'activités pour lesquelles la duplication de contenu est répandue sur le web. Je parle ici de textes descriptifs, qui bien souvent se retrouvent tels quels à l'identique sur plusieurs sites et du coup, cela n'arrange pas les bidons de Google (ou des autres moteurs) pour faire le tri entre le meilleur et le moins bon.

Dans un cas comme celui-ci, les moteurs ne peuvent constater que très peu de variation d'une page à l'autre. Cela en réduit largement la qualité et les possibilités de comparaisons. La pertinence du ranking est au final, faussée.



Un problème d'authenticité :

Fermez les yeux et imaginez (ou imaginez que vous fermez les yeux, ce sera mieux) : Avec un texte de plusieurs paragraphes copiés à l'identique sur plusieurs sites, le moteur se trouve face à un problème d'identification.

Le moment où Google 'intègre' les contenus dans l'index ne signifie pas que ces textes ont été créé à ce moment là, un humain peut facilement le comprendre. Par contre, de la même manière, une machine ne peut pas le comprendre d'elle-même. Pour elle, au moment où elle découvre le texte, c'est en quelque sorte le moment de sa naissance, sauf si certains indices sur la page, lui permettent de connaître la date de création du contenu.

Sans moyen particulier pour déterminer la date de création d'un texte, n'importe qui peut s'approprier votre contenu (pas encore indexé) et si il arrive à faire indexer son site (qui vous duplique) avant le vôtre, cela peut être délicat pour vous.




Un problème de qualité de contenu :

La qualité d'un contenu tient principalement à cinq choses : Sa fraîcheur, son ancienneté, sa longueur, son originalité et son authenticité. Dans tous les cas, à partir du moment où les contenus sont identiques mots pour mots (problème sur l'originalité et l'authenticité) leur qualité en est directement pénalisée.

Bien entendu, les sites sur lesquels le même contenu apparaît vont être mis en 'concurrence' et Google va alors devoir faire référence à d'autres critères possibles pour déterminer le vrai de l'usurpation.

Le problème, c'est que cela risque de demander des ressources supplémentaires en analyse profonde. D'où l'intérêt d'avoir un filtre comme Panda qui fait le ménage sur la qualité des données à indexer et leur duplication, avant tout autre traitement analytique pour le ranking final.



QUELQUES EXEMPLES
DE DUPLICATION DE CONTENU :


LES FICHES PRODUITS E-COMMERCE :

Pour beaucoup encore en 2015, le réflexe est de recopier mots pour mots la description du fournisseur sur les fiches produits. Erreur fondamentale !

Avec le filtre Panda, les pages des sites E-commerce dont les descriptions sont identiques, sont de plus en plus pénalisées et ressortent moins facilement en haut des résultats de recherche, en étant refoulé en 2ème ou 3ème page.

L'alternative consiste donc à prendre le temps de rédiger une nouvelle description unique et originale. Il est fréquent de passer par un rédacteur web pour ce genre de tâche et il n'y a aucune honte à cela, si besoin, vous trouverez mes coordonnées en bas d'article.



LES ANNONCES DES SITES EN IMMOBILIER :

Cette pratique est également largement répandue sur les sites d'agences immobilières et les portails en immobilier : la description des biens (en vente ou en location) est généralement la même sur l'ensemble des supports web qui en font la pub.

Ceci vient surtout du fait que les professionnels de l'immobilier disposent de logiciels automatisés qui centralisent sur une base de donnée des biens, définis par de nombreux critères et commentaires.

L'automatisation permet de déployer (bien souvent sur un ensemble de portails définis et partenaires) les critères (ou la fiche) du bien de la même manière partout.

Certains en ont même fait un business, en vendant des liens et des annonces sur une multitude de portails. Cette méthode est interdite à cause du système de transaction pour un ou plusieurs liens, rappelons-le. Pour le coup, non seulement vous achetez des liens (1ère erreur), mais en plus, vous dupliquez partout vos textes de description (2ème erreur).

Pour le moment, ce problème est bien loin des préoccupations des décideurs, car les marketeurs immobiliers sont à peine en train de de s'en rendre compte et qu'il n'ont pas encore pris le temps de structurer la remontée de l'information plus haut pour agir en conséquence (aux dernières nouvelles). Mais cela devrait sans doute s'améliorer avec le temps avec de nouvelles méthodes.



LES DESCRIPTIONS SUR LES ANNUAIRES WEB :

"C'était je pense en 2004, il y a plus de 10 ans. Je bossais en agence web comme référenceur et un collègue avait créé un web-logiciel pour permettre à l'ensemble de l'équipe d'automatiser la création de links depuis les annuaires web et ainsi mieux référencer les sites de nos clients."

"Il y a avait pas loin d'un bonne trentaine d'annuaires différents dans la liste et, une fois la page de soumission ouverte, il ne nous restait plus qu'à cliquer sur des boutons pour copier dans le presse papier les données spécifiques aux inscriptions : titre, url, mots clés, mail, nom et prénom et bien entendu, notre fameuse description, et remplir les formulaires avec un ctr+v.

"Nous pouvions alors automatiser en partie la soumission du site aux annuaires, dont la liste pouvait être complétée. C'était en 2004, il y a plus de 10 ans."

Ce type de logiciel a connu un âge d'or à une certaine époque, mais aujourd'hui, avec le problème de duplication de contenu, les annuairistes demandent des descriptions uniques. Les programmeurs ont dû innover et pour le coup, le content spinning est né, il répondait par la même occasion à d'autres problématiques concernant la création automatique de contenu pour le référencement.

Le content spinning est une dérive (black Hat) qui consiste à copier un texte de base, en le modifiant à l'aide de synonymes ou d'expressions proches pour avoir au final un contenu qui parle de la même chose, mais avec d'autres mots et expressions. C'est avant tout fait pour gagner du temps au détriment de la qualité.




Mais alors ?
Que faire pour éviter la duplication de contenu ?

Il n'y a pas 36 Miracles pour cela. Ce qu'il reste à faire, c'est de s'efforcer à produire du contenu original et de qualité, régulièrement sur vos blogs ou vos sites.

Il n'est pas forcément utile de vérifier phrase par phrase si votre contenu apparaît déjà sur le web. En effet, en partant du principe que vous allez écrire quelque chose d'assez consistant en longueur, il y peu de probabilité que vous répétiez exactement la même chose que quelqu'un d'autre a déjà pu écrire ailleurs, d'autant plus si vous émettez un sens critique ou un avis.

Même en faisant référence à d'autres articles, vous pouvez citer et reprendre dans une certaine mesure ce que vous lisez mais avec des mots différents, tout en faisant un lien vers votre source, c'est incontournable et recommandé. Cela vous évitera d'être pénalisé, même si vous faîtes référence à du contenu et des idées qui existe ailleurs sur la toile.

CONCLUSION :

Voilà un article qui remet les pendules à l'heure. Pour ma part, je suis allergique à la duplication de contenu depuis le début. Ceci dit, j'ai dû m'adapter lors de ma dernière expérience professionnel dans l'immobilier (je référençais des agences immobilières).

Le référencement naturel nécessaire pour ce type de site, c'est le référencement dynamique qui demande des techniques de fusion entre contenu statique et alternatif. Mais ceci est un tout autre sujet...

Si ce contenu vous a plu,
je vous invite à le marquer ou le partager,
bonne fin de journée,
à bientôt,

Pour toute demande pro spécifique :
..........................................................
..........................................................



Aucun commentaire:

Enregistrer un commentaire