L’intelligence artificielle de Google détecte-t-elle la qualité d’un texte ou s’agit-il d’un écran de fumée?
Nous développons toujours la chronique pour un site afin d’amplifier son pouvoir lui-même. Cette fois, nous discuterons plus en détail point 2 de la chronique sur l'amplification naturelle d'un site. Nous parlons de contenu, bien sûr, mais pas nécessairement comme nous en parlons habituellement.
Loin de moi l'idée de dire à mes amis rédacteurs comment écrire. Tout le monde a son ton, son style, son expression. Je n'ai rien à dire à ce sujet.
Par contre, certains tarifs me laissent perplexe. En 2019, vous trouvez des textes à 25 euros HT pour 500 mots. Je ne pense pas que le contenu sera de qualité à ce prix. Ce sera même une dépense inutile, à mon humble avis.
Votre site est précieux pour vous. Par conséquent, donnez-vous les moyens de créer de la valeur ajoutée.
Dans les faits
Oui, avec un peu de bouillie, peut-être que nous irons un peu dans Google. Cependant, n'attendez pas beaucoup de conversions à partir de ces pages. De plus, vous devrez faire beaucoup de pages pour compenser. Au final, votre site sera une immense daube. (Désolé si ma franchise vous surprend dans ces colonnes.)
Honnêtement, nous devons reconnaître que le niveau de textes sur les sites est souvent pitoyable. En abaissant les prix, la gifle bien méritée survient à un moment ou à un autre.
Je fais rarement des affaires d'écriture de contenu. Donc, je suis relativement neutre à ce sujet et je le donne d'autant plus facilement.
Je propose ici une check-list des imperfections à éviter, car, à mon avis, facilement détectable. Leurs corrections peuvent faire la différence. Une page bien écrite deviendra un contenu perçu par la machine comme étant de qualité. Car oui, écrire avec le cœur ou avec les tripes peut ne pas toujours suffire …
Erreurs fréquentes
Liste de contrôle sans classification spéciale …
– Le contenu n'est pas aérien. Il comprend de gros blocs de texte avec des phrases super longues.
=> Faites de petits paragraphes (3-4 lignes) avec des phrases courtes (15 mots maximum). Normalement, cela rétablit l’œil du lecteur. Google a besoin de savoir qu'en agissant de la sorte, vous penserez être lu. Notez que scinder une phrase en deux nécessite souvent une reformulation, pas seulement une pause.
– Le bourrage de mots-clés est en action. Nous le savons, mais nous le voyons tous les jours. Les mots-clés sont regroupés dans un seul bloc. Ils ne sont pas décomposés dans le texte.
=> Il est nécessaire de répartir les mots-clés sur l'ensemble du texte. Ce ne sont pas les seuls impliqués. Il est également valable pour toute expression.
– Répétition abusive des autres termes significatifs du texte. Le même mot utilisé dans les 3 phrases suivantes augmente la lecture.
Il est extrêmement facile pour une machine de détecter cette anomalie.
=> Personnellement, je demande souvent à mon ordinateur de me lire le texte à voix haute. Je ferme les yeux et écoute. Avec l'aide de l'audio, ce type de défaut vous fait sauter! Vous pouvez également vous aider avec un logiciel comme Druide-Antidote.
– Le texte ne correspond pas à son titre. On voit parfois un titre "putaclic" et quand on lit, ça éclabousse … Parfois on aime le sujet, on lit, mais on se demande quand il sera enfin adressé et traité!
=> Le contenu doit expliquer le titre éditorial. Vous devez rester dessus et ne pas vous égarer. Votre visiteur vient vous honorer de sa lecture, tenez la promesse faite par votre titre.
Potentiellement identifiables via les dictionnaires disponibles sur Google, des mots spécifiques sont associés à chaque sujet. S'ils sont absents, c'est curieux. Même si le système n’est pas encore parfait, c’est ce que nous essayons de faire avec les métamots.
– Les titres ne correspondent pas aux paragraphes qu’ils englobent.
=> Les paragraphes développent les titres; Ils sont liés. Nous avons exactement le même problème qu'avant.
Votre rubrique est supposée coller à un problème. Assurez-vous d'y répondre.
Mais pas seulement parce que vous pourriez être tenté d’adresser d’autres points. Demandez-vous s'il est préférable de rédiger un deuxième texte détaillant ces nouvelles idées. Vous ferez alors un lien vers celui-ci.
– Les balises vont par paires sauf le H1 et sont imbriquées.
=> Vous ne mettez pas un seul H2 ou un seul H3, etc. Le H3 doit être inclus dans un H2, le H4 dans un H3 … Qu'est-ce qui est plus facile à vérifier pour un algorithme?
– Le "chapo" est très long. Cela ne correspond pas à la pyramide inversée chère à Isabelle Canivet.
=> Le "chapô" doit faire un et un seul paragraphe et annoncer la couleur. Ou la personne veut lire ensuite, ou pas. Mais ne la trompez pas … Google dispose de plusieurs moyens pour savoir si, depuis le début, vous essayez de mystifier votre lecteur. L'un d'entre eux est le retour au SERP. Mais il existe d'autres méthodes comme la présence de certaines ponctuations, etc.
– Le "titre" et le H1 sont exactement les mêmes.
=> Ils doivent tous deux commencer par l'expression to value, mais être différents. Ils doivent aussi être uniques. De plus, le "titre" doit être limité en nombre de caractères.
Identique, on ressent l'automatisme à plein nez et, au mieux, de paresse. Le "titre" est spécialement destiné à ceux qui lisent un résultat de recherche. Le H1 cible celui qui se trouve déjà sur votre site ou votre page. Ici, je ne parle pas nécessairement du triplé du bourrin de Laurent Bourrelly. Je fais référence au signal d'indifférence que vous envoyez au moteur!
– La "méta description" est trop généraliste.
=> La "méta description" doit encourager la lecture du texte. Il est destiné à réconforter l'utilisateur qui se trouve sur Google. C'est différent du "chapo". N'utilisez jamais de méta-description automatique. Ecrivez-le soigneusement, comme s'il s'agissait d'un texte d'annonce Adwords. Prenez le mot-clé suggéré, car Google essaiera de le mettre en gras.
NOTE: quelque part, "title" et "meta decription" font partie du marketing. Le h1 et le contenu sont plus sur l'écriture. Il y a une subtilité à comprendre ici.
– Le texte est déjà présent en partie ou en totalité sur le net.
=> Vous devez faire un seul texte. Savoir que vous avez écrit votre propre contenu ne suffit pas. Nous sommes souvent influencés par ce que nous avons lu ou entendu. De plus, le hasard fait aussi partie de la vie. Google ne s'intéresse pas à ce qu'il a vu auparavant. Je pense que nous le savons tous, mais nous l'oublions souvent.
– La langue n'est pas adaptée: jargon, argot, etc.
=> vous devez choisir la bonne langue (registre actuel, même pris en charge et inconnu). Je ne me prive pas d'un zeste d'humour dans mes chroniques. Mais vous devez faire attention à certaines expressions qui ne peuvent être utilisées que oralement. Google lit tout. Il peut trébucher sur un terme qu'il considère comme "ennemi" de votre lectorat. Cela réduira le score de qualité. Pour ma part, j'ai remarqué une baisse d'intérêt pour certains contenus lorsque la tonalité retentissait "trop de forum".
– Le texte est plein d'erreurs ou de mots trop rares.
=> Faites un texte sans faute, en français correct avec une bonne ponctuation. En pratique, Google n'est pas un être humain. Les fautes et les mots rares peuvent jouer contre vous.
Vous pouvez utiliser des mots rares. Cependant, ils doivent être utilisés dans votre thème, et passim. Vous prenez un risque autrement.
La ponctuation est également importante. L'analyse se fait par fragments séparés par certains signes. Sur certains sujets, en dehors de smylys, nous avons trouvé beaucoup de ";". Un manque de "; Peut, alors, dégrader l'appréciation que le moteur aura de votre prose. C'est assez curieux.
– Les langues sont mélangées.
=> Vous ferez une page par langue à l’aide de la balise hreflang. En pratique, cela a toujours été une préoccupation pour Google. En conséquence, une pièce en anglais dans un texte français peut passer pour du charabia. Par contre, utilisé entre guillemets, il peut encore être toléré.
=> Ne parlez pas de vous-même, mais mettez-vous à la place de vos lecteurs.
Trop de mixage et il est facile pour une machine de décider que l'auteur n'est pas très bon …
Dans certains cas, vous montrerez que vous êtes "avec" votre utilisateur. Vous pouvez donc utiliser le "nous". Vous pouvez le faire dans un tutoriel par exemple. Vous l’utiliserez ensuite tout au long du didacticiel.
Le "sur" est de bannir autant que possible. L'apprentissage automatique de Google n'a pas nécessairement appris qu'il s'agissait d'un sujet. Est-il utilisé dans votre sujet et pour le profil du lectorat ciblé? Pourquoi l'utilisez-vous? En cas de doute, j'essaie de l'éviter.
– Faites le texte Google.
=> Le contenu doit avant tout être écrit pour l'utilisateur. Cependant, il sera structuré pour être identifié en tant que tel par Google.
Notre objectif, ici, est de faire en sorte que Google distingue la qualité de votre contenu. Malgré cela, il s’agit plutôt d’une forme de référencement. Vous ne devez pas altérer la perception de votre texte par Google. Ce serait dommage d'autant plus que cela a été écrit avec beaucoup d'amour.
– Le texte n'est pas pertinent.
=> Celui-ci doit apporter quelque chose au lecteur, une valeur ajoutée. Ce faisant, l'utilisateur restera plus longtemps sur votre page. Il peut le recommander à d'autres. Google a les moyens de détecter l'intérêt d'un texte par le biais de signaux sociaux, par exemple.
Je vous donne un pourboire, mais vous n'êtes pas obligé de me croire. Au lieu de cela, placez le bouton de partage à la fin du texte. Ce sera probablement plus précieux que d'autres. Je pense en particulier ceux placés juste l'utilisateur sont arrivés sur la page. Si cela peut ne pas être en place maintenant (je ne peux pas le savoir). Mais évidemment, au niveau humain, le partage à la fin de l'article est plus précieux.
– La portée change (niveau de détail).
=> Cela peut déranger l'utilisateur. Exemple, vous commencez un texte. Vous donnez beaucoup d'explications et de clarifications. Soudain, vous réalisez que le texte devient trop long. Vous ne traitez que les choses à la surface. C'est facilement détectable. Cela sent le texte de x mots commandés à un éditeur. En effet, il ne dépassera généralement pas le nombre de caractères achetés. Encore une fois, il s’agit d’un signal visible.
– Plusieurs idées coexistent dans le même paragraphe.
=> Un paragraphe développe une idée, le plus souvent. Vous allez cibler un utilisateur particulier via un paragraphe. Vous ne pouvez pas exécuter plusieurs lièvres à la fois. Est-ce détectable? Dans certains cas, oui, via une anomalie dans certaines associations de mots. Est-ce que Google le fait? Aucune réponse définitive pour le moment à moins que tout le texte ne soit écrit de cette façon.
– Vous n'avez que du texte, mais vos concurrents ont des images.
=> Il faut ajouter, de préférence, des supports (photos, vidéos). Encore une fois, ne perdez pas de pertinence. Faites l'effort d'illustrer vos pages. (Sur cocoon.se, dans la section métamots, le "parfum" vous donne des pistes.)
– De fausses choses sont présentes dans le contenu.
=> Vous devez seulement dire des choses vraies, si possible vérifiables. Tous les domaines ne sont pas adaptés. Beaucoup de travaux sont en cours en ce qui concerne les fausses nouvelles. Mais dans de nombreux domaines également, personne ne peut dire où se trouve la vérité. Tous les domaines ne sont pas nécessairement décidables.
Note personnelle: Où est la vérité? J'ai moi-même récemment été victime d'un site réussi sur lequel aucun Netlinking n'avait encore été réalisé. Mais parce qu'il a réussi, il a naturellement reçu des liens. Les SEO trop habitués aux liens artificiels ont imaginé que c'étaient les liens qui avaient généré le trafic … Sauf que les liens sont arrivés grâce au succès du site, par la suite. Quoi qu'il en soit, il n'y avait pas assez de liens pour expliquer le trafic, mais passons à autre chose. C'est pourquoi j'ai dit que nos opinions étaient influencées par le prisme de nos habitudes.
Si vous vendez un produit lié à la réglementation, datez votre relevé. Si nécessaire, fournissez des liens vers des sources officielles. Méfiez-vous des fausses interprétations que les utilisateurs d'Internet pourraient avoir.
D'une certaine manière, nous sommes dans une forme de traçabilité. Citer une norme ISO, par exemple, est un petit avantage. Cela sera apprécié par le moteur, surtout s’il est accompagné des microdonnées appropriées.
– Les verbes doivent être ceux utilisés dans votre thème.
=> Exemple: "prescrire une agence de communication". Le problème est que "prescrire" ne fait généralement pas partie du vocabulaire de ce thème. C'est un verbe spécialisé. Google peut parfaitement le marquer comme une anomalie.
– Certaines associations de mots malheureuses pourraient vous faire filtrer par Google.
=> Nous avons vu dans le passé un site entier classé comme pornographique. Il avait utilisé une simple blague mal comprise de Google dans un seul ticket. Il y a encore des soucis de ce côté.
de côté
Il existe des algorithmes très pratiques. Ils permettent d'avoir une information globale sur la lisibilité d'un texte. Ils vous indiquent également le niveau requis du joueur.
– La chair
– Chair-Kincaid
– Brouillard
– Colieman-Liau
J'avoue ne pas savoir si Google les utilise pour juger une page. De même, je ne sais pas s'il est utilisé pour évaluer l'utilisateur. Mais si ce n’est pas déjà fait, cela peut arriver. Ce sera fait soit avec un algo à lui ou avec un de ceux-ci.
Il a également ses propres vecteurs qui peuvent rendre les choses très amusantes. Je pense qu'il apprend quand un lien est négatif plutôt que positif. C’est mon avis, même si Google semble dire le contraire …
Autres points, mais que Google ne révèle pas nécessairement aujourd'hui et risque de ne jamais faire
– Il faut éviter d'utiliser des termes pompeux (expert, dirigeant, etc.).
=> Faites attention à ces termes, ils sont réglementés. Par exemple, le leader suppose que vous avez au moins 20% du marché en France. Vous devez pouvoir le prouver.
Ces lexèmes sont dangereux à manipuler. Certains peuvent en particulier vous engager légalement. Là, ce n'est plus nécessairement le référencement. Mais, en réalité, ce n’est que pour vous qu’ils font plaisir.
– L'information était vraie à un moment donné, mais est devenue obsolète.
=> Date les éléments susceptibles de varier dans le temps. De préférence, mettez à jour le texte si les informations sont obsolètes.
Conclusion
Google a crié haut et fort que nous devions créer un contenu de qualité. Pour le moment, la communauté SEO s'est demandée ce qu'elle a appelé un contenu de qualité. Comment Google pourrait-il le déterminer?
Aujourd'hui, nous réalisons au minimum qu'il est capable de détecter ce qui n'est PAS un contenu de qualité. C'est notamment par la forme qu'il réussit. L'apprentissage automatique a été là.
Un texte peut être écrit avec sincérité et talent. Ce que l'utilisateur ressent est impalpable pour un moteur. Mais il dispose de plusieurs moyens importants d’évaluer votre travail:
• le sujet, les métamots montrent qu'il "les comprend" de mieux en mieux,
• le nombre d'anomalies trouvées ci-dessus dans votre texte,
• la réaction des internautes (commentaires, partage).
En soi, nous pourrions également résumer les choses. L'évaluation de la qualité d'un texte est une sorte de licence ponctuelle. Il laisse la marque maximale. Au fil de l’analyse, il accumule constamment des points.
Le trafic est très dépendant de la qualité perçue du moteur.
Vous êtes libre de travailler comme il y a 15 ans. Vous pouvez également évoluer au rythme que Google nous impose. Quoi qu'il en soit, des textes bien rédigés et intéressants attirent naturellement le partage, les liens et surtout les internautes!
C'est entre vos mains: à vous de jouer!