TOP 100 des blogs : Classement selon la pertinence des commentaires

Attention, cet article a été posté en 2008. Il est possible que les informations mentionnées ne soient plus d'actualité, ou que mon opinion ait évolué. Merci d'en tenir compte lors de votre lecture.

La principale différence entre un blog et un magazine est sans nul doute l'intéractivité avec le lecteur, à travers les commentaires notamment. C'est pourquoi, le nombre et la pertinence des messages laissés par les internautes me semble refléter au mieux la qualité d'un article, et par conséquent la qualité d'un blog. J'ai donc décidé d'établir un classement en tenant compte de ces critères.

Ces 100 derniers jours, un script-maison a analysé 157 blogs, soit très exactement 193 116 commentaires répartis dans 27 532 billets. Après des jours et des jours de calcul, je suis en mesure de fournir un premier classement des blogs High-Tech francophones. Sans plus attendre, je vous laisse le découvrir dans la suite du billet. Vous y trouverez également des informations complémentaires concernant l'algorithme utilisé.

Nouveau : Le classement, actualisé, est maintenant chez Blogonet

Vous retrouverez ce classement, actualisé mensuellement, chez Blogonet !.


Blogonet

Le classement des blogs francophones High-Tech

Lire la suite du classement

Quelques précisions

L'algorithme utilisé tient compte du nombre de commentaires, mais aussi et surtout de leur pertinence (longueur des commentaires, diversité des auteurs, nombre de liens, etc.). Une note est ainsi attribuée à chaque commentaire, selon ces critères. La somme de toutes ces notes m'a ensuite permis d'établir ce classement. Le résultat obtenu semble plutôt cohérent avec le top 100 Wikio.

Les 157 blogs utilisés pour réaliser ce classement sont issus du top 200 francophone de la catégorie Technologie de Technoratie. Cette expérience étant concluante, le nombre de blogs analysés devrait être augmenté pour le prochain classement.

Si, pour une raison ou une autre, vous ne souhaitez pas voir apparaître votre blog dans ce classement, merci de me contacter.

Vos réflexions

Beau travail. En effet, ça ne doit pas être si évident que ça. Vu le nombre de plateformes de blogs existantes, réussir à isoler chaque commentaire doit demander un travail de conception préalable assez conséquent. Toutefois, le résultat me semble particulièrement intéressant, prendre en compte le coté participatif des lecteurs est une excellente idée.

Sinon, comme tu le dis, ce classement n'offre pas de grandes surprises, avec un Presse-citron encore et toujours en tête. Par contre, il y a quelques changements dans le reste du top 10, avec notamment un Fubiz particulièrement bien placé.
Beau travail, félicitations! C'est une bonne idée de prendre en compte ce qui fait un blog, les commentaires justement.... Dis nous si tu as des retours de gros classements de type Wikio ;)
Effectivement, joli travail !
Beau boulot !!
je pense en effet comme toi que les commentaires font partie intégrante de la qualité d'un site.
Voilà un classement dont la conception innovante me plait bien ! En tout cas, bravo et félicitations pour ce boulot de longue haleine ... ;)
Superbe travail ...
Bravo à toi d'avoir pensé à faire un classement en te basant sur les commentaires !!
Pour ma part je serais curieux de voir un tel script :)
Beau travail.
Nul doute qu'Ilonet sera dans le prochain classement.
Voilà une analyse intéressante !
Tiens, je me demande dans quel mesure les plugins comme IntenseDebate peuvent perturber le calcul

(Pour ma part, j'ai l'impression d'une belle perte de "masse" de texte, puisque ce qui est affiché est généré par javascript, et donc invisible pour les moteurs aussi... y'a qu'a surfer avec un 'elinks' pour s'en rendre compte qu'il reste que d'étranges bribes de commentaires :-/ )
Jolie travail, il fallait y penser, vous avez du y passer énormément de temps à la conception d'un tel outil.
Tres bonne initiative,
Ce qui permet egalement de faire connaire ce petit blog bien sympa.
Mais je me pause les questions suivantes :
qu'est ce qui pousse un visiteurs a pauser des commentaires ?
Comment un incité ses visiteurs a pauser des commentaires?
"L'algorithme utilisé tient compte du nombre de commentaires, mais aussi et surtout de leur pertinence (longueur des commentaires, diversité des auteurs, nombre de liens, etc.)"

L'algo utilise aussi les mots-clés, tags, etc ?

le contenu de l'article est-il pris en compte ?

Parceque simplement sur ces trois critères, on pourrait penser que le système considèrait comme de qualité des commentaires qui n'ont rien à voir avec l'article commenté !

Bravo en tout cas, l'ensemble paraît cohérent :-)
Prendre en compte les commentaires en tant que facteur de pertinence d'un blog alors là chapeau ! Du bon boulot, j'attends de voir son évolution avec impatience tant ce principe est innovant ! Encore bravo :cool:
Merci à tous.

@frenchbigdog : L'algorithme reste un algorithme, il ne peut pas vérifier l'exactitude des propos tenus dans un commentaire. Cependant, j'ai déjà quelques idées pour tenter de l'améliorer au maximum.
je reviens de Presse-Citron et je ne pense pas, bien que ton travail est intéressant qu'un script algorithmique puisse analyser avec pertinence la sémantique et la qualité des commentaires d'un blog, en son temps, j'ai démontré facilement que n'importe quel blog pouvait y arriver (en tête) il suffit de créer une polémique(pas forcément méchante) mais c'est une considération à ne pas négliger, qui plus est les mots et les mathématiques ne font jamais vraiment bon ménage, je salue donc ton travail mais ne croit pas au concept, qui plus est, c'est le webmaster qui écrit et "fait" la qualité du blog et non les commentaires, je connais nombre de blogs de haute valeur ajoutée qui n'ont aucun commentaire, ou si peu... A méditer je pense
Cordialement
@lelecteur : Évidement, il est possible de tricher. Mais il est également possible de tromper l'algorithme Google, beaucoup ont réussi dans le passé. Certains achètent des liens, d'autres pourraient acheter des commentaires. Mais tôt ou tard, la triche est perçue, comme partout...
Merci pour les réponses que tu apportes Jukien, et bon courage pour la suite ;-)
je me posais la question de comment prend tu en compte la modération nde chacun quand on sait que presse citron laisse les commentaires presque en open bar sur son blog (avant sa petite crise de foi), face à d'autre qui ne laisse passer les commentaires qu'au compte goutte ...
@jukien, je ne parlais pas de triche mais de copinage
Très pertinent et joli travail qui doit quand même prendre pas mal de temps.
Voilà un script qui risque d'interésser pas mal de monde ;) Merci pour le lien.
PS: petit souci sur ta page des commentaires, elle n'accepte pas mon pseudo avec accents
Et comment ajouter un site à ce calcul histoire de voir ? :)

Pour ma part j'ai un blog de niche mais très actifs du côté des commentaires. Ce genre de classement permettrait de le voir listé dans un classement et montrer qu'il draine mine de rien un public pertinent.
Je ne suis pas expert en technique, mais j'aimerais savoir si ce serait applicable pour des blogs politiques ?
Beau boulot! Très intéressant comme analyse.
@lump : L'algorithme se base essentiellement sur la qualité des commentaires, leur nombre est secondaire. Donc un blog laissant passer des commentaires au compte-goutte laissera sans aucun doute passer les meilleurs commentaires. L'un dans l'autre, ça ne changera donc pas grand chose au final.

@lelcteur : Oui, mais mon argument reste valable.

@le blogueur masque : Merci pour le feedback, je vais essayer de voir ce que je peux faire.

@Pierre Ristic : Je pense élargir le nombre de blogs analysé. Mais je ne peux le faire du jour au lendemain, la durée d'analyse doit être la même pour tous les blogs afin de garder un classement cohérent.

@heretique : Oui, sans aucun doute. Cependant, séparer les blogs par groupe me semble important : comparer des blogs High-Tech avec des blogs politiques aurait peu de sens.
Bravo, très beau boulot !

Comptabiliser de manière automatisée le nombre de commentaires est déjà un challenge en soi, mais alors être capable d'y ajouter une notion de qualité c'est encore plus impressionnant !

Au final, est-ce 100% automatisé ou bien te faut-il analyser manuellement chaque blog (hors plateforme évidemment) avant de pouvoir commencer à comptabiliser/analyser automatiquement ses billets+commentaires ?
Impressionnant, bravo Jukien pour ce travail qui comme tous les essais de ce genre a à la fois un côté expérimental et le mérite de faire avancer la réflexion.

Mais comme toute tentative de ce genre, il faut challenger ;-)

Sans avoir l'algorithme que tu as utilisé, difficile d'aller dans le détail. Mais peut-on parler de "pertinence" à partir du moment où le travail n'est pas un travail quali ?

Je suis tout à fait d'accord pour dire que le fait de prendre en compte la longueur des commentaires, la variété des commentateurs, le fait qu'ils contiennent des liens ou non, etc. (curieux de savoir ce qu'il y a dans le etc. d'ailleurs ;-)) va dans le sens d'une analyse plus quali. Mais ça reste du quanti et pour moi pertinence est synonyme d'analyse quali car elle renvoie forcément au contenu.

On peut peut-être parler de "richesse" plutôt que de pertinence ?

Tant que j'y suis, une idée pour automatiser ce que j'avais tenté avec ce classement-ci ?

http://internetetopinion.wordpress.com/2008/05/17/laudience-relative-des-blogs-et-des-medias-en-ligne-une-experience-statistique/
question additionnelle : tu as fait un total des points obtenus pour la totalité des commentaires de tous les billets sur chaque blog ? Pas une moyenne de points par billets ? Ce serait intéressant d'avoir le même classement avec la moyenne de points obtenus par billet, car cela gommerait l'effet qquanti qu'obtiennent les blogs qui publient beaucoup.
@Matt : Cela demande un travail préalable pour chaque type de blog, afin "d'apprendre" au script à extraire correctement chaque commentaire, pour chaque type de plateforme. Ensuite, l'analyse des commentaires est automatisée, et strictement identique pour tous les blogs.
En voilà un classement qui me plait ;) J'aime bien le concept de remettre les lecteurs les plus motivés au centre de l'algorithme. Merci !
@Francois G : Pour reprendre les mots d'Eric, la pertinence est tout sauf scientifique. Ainsi, cette notion s'arrête à la puissance de l'algorithme, déterminer la qualité d'un message est loin d'être évidente pour un ordinateur.

Automatiser le classement que tu proposes est sûrement possible. D'ailleurs, c'est également applicable ici, en prenant les commentaires comme critère : il suffirait alors de diviser le nombre de points obtenus par le nombre de billets postés.
@Francois G : Je vois que ton second commentaire m'a devancé. Cependant, je ne suis pas certain que cela serait très représentatif. Les blogs qui publient énormément reçoivent forcement moins de commentaires par billet. Il suffit de surfer sur les plus gros blogs américains pour s'en convaincre.
super, j'ai de quoi à nourrir mon blog chinois alors!!! lol
Tiens...J'y suis pas... ;-)
Excellent !!
Une question : que vient faire Koztoujours dans un classement High-Tech ?
Le critère est bon mais, comme beaucoup ici, j'ai des doutes sur la capacité d'un script à analyser cela.
Déclencheur est un cas un peu extrème (comme c'est un podcast), tout une partie du dialogue se fait en audio et n'est donc pas, je suppose, à priori analyser par ton script mais même sur des blogs classiques, je me demande comment il peux juger de la pertinence.
@ Jukien : merci de ta réponse. J'insiste donc, il vaut mieux éviter de parler de "pertinence" pour un classement automatisé... Pour moi "richesse" est mieux approprié.

Pour le choix entre la somme des points et la moyenne des points, je comprends bien ton commentaire mais je pense qu'on verrait justement des choses intéressantes en regardant la moyenne.

Etre influent, c'est pas juste écrire beaucoup pour, à force, avoir beaucoup de commentaires ; c'est aussi (surtout ?) produire un contenu qui mobilise les lecteurs (et ça, le classement par la moyenne le montrera bien).
effectivement tous ces indicateurs sont intéressants et on apprécie le côté expérimental de la chose (j'ai hâte d'en savoir plus sur ce fameux algorithme),

par contre, je ne comprends pas bien cette assertion : "le nombre et la pertinence des messages laissés par les internautes me semble refléter au mieux la qualité d'un article, et par conséquent la qualité d'un blog". pardon mais pour moi cette corrélation entre la ""pertinence"" des commentaires et la "qualité" d'un article n'est pas évidente.


les résultats d'une étude quali des commentaires pourraient donner au mieux des indication sur la capacité du blogueur à fédérer une communauté autour de son espace (d'où l'intérêt de cette moyenne qu'évoque François), c'est à dire sa capacité à être un bon animateur.
il aurait fallu que tu rajoutes un peu de contexte...par exemple que Accessoweb dispose de tant de commentaires de manière un peu inhabituelle car il a organisé des concours de cadeau non stop...Dans un mois à mon avis il perdra un paquet de places

Autre point certains bloggeurs répondent à tous les commentaires ou presque ce qui augmente manière un peu artificielle le nombre total d'intéraction.

As tu filtré ces réponses où s'agit il des commentaires de lecteurs uniquement. Car évidemment cela fausse pas mal...

Tiens tu comptes des trackbacks ou du nombre de fois qu'un blog est cité? Car il s'agit là aussi d'une forme d'intéraction

bonne idée sinon
@palpitt : La communauté me semble directement lié à la qualité des articles. Je vois mal comment un blogueur pourrait réunir une communauté sans produire du contenu qui plaît.

@Jean Michel : Ces cas là sont normalement pris en compte dans le calcul de la pertinence (ou richesse) du commentaire. La diversité des auteurs est notamment prise en compte.
@jukien : c'est lié certes, mais à ce moment là tout dépend ce que tu entends par "qualité" (d'ailleurs dans ta réponse cette qualité se transforme plus globalement en "contenu qui plait", ce qui est encore plus subjectif, qualité est un mot que tu devrais définir), c'est pour cela que j'avais du mal à voir le lien "direct", pour réunir une communauté d'autres critères entrent en jeu selon moi : la longévité, la relation du blogueur avec ses lecteurs (qui peut passer par du offline), sa réputation pré-acquise ou son statut, le sujet traité ET la qualité de ses articles (qualités rédactionnelles, le vocabulaire, le ton, le style, etc.)

Est-ce qu'un article de qualité est forcément un article qui génère des commentaires de qualité (ou riches, ou en grand nombre) ? et inversement, est-ce que des commentaires de qualité sont forcément générés par des billets de qualité ? ça mérite discussion
Passons sur le côté ridicule d'un "Top100" se basant sur seulement 157 blogs et attaquons le point qui me semble le plus problématique:

"mais aussi et surtout de leur pertinence (longueur des commentaires, diversité des auteurs, nombre de liens, etc.)"

Si c'est comme ça qu'on évalue la pertinence des commentaires, on est mal barrés: un blog qui laisserait la porte ouverte au spam aurait les meilleures notes. Les commentaires de spammeurs sont longs, les auteurs changent tout le temps, les commentaires des spammeurs sont bourrés de liens...

Tout ça pour dire que la "pertinence" d'un commentaire ne s'évalue pas avec un algorithme.
@palpitt : Ce que je voulais dire, c'est qu'un article "travaillé" et "bien cousu" donnera davantage envie aux lecteurs de commenter. Par commentaire de qualité, je parle des commentaires qui semblent apporter une information utile à l'article en question.

@kwyxz : Pour le faible échantillon, les explications ont déjà été données ; ce premier classement était expérimental.
Pour le reste, je ne suis pas tout a fait d'accord. Les scores obtenus par akismet suffisent à prouver qu'un algorithme est capable d'isoler les commentaires-spams des commentaires pertinents.
De plus j'aimerais qu'on me cite un blogueur qui laisse les spams volontairement dans ses commentaires ? :)
Pilou: un blog à l'abandon depuis quelques mois sur lequel aucun antispam récent n'est installé, comme il en pullule sur Google à la moindre recherche, par exemple.
D'accord avec Palpitt, c'est difficile de préciser la notion de qualité (comme la notion de pertinence).

On a plus de chances d'avoir des commentaires de qualité quand l'article est de qualité ; mais un article de qualité peut donner lieu à des commentaires pourris (plus le site est fréquenté, plus la probabilité est élevée) ; et un article de deux lignes peut ouvrir un débat de très bonne qualité (sur un blog dont l'auteur entretient une relation très quali avec ses lecteurs).

Donc difficile de généraliser, mais partir des commentaires ne me paraît pas être un mauvais biais. On a rarement de bons commentaires sans un bon contenu.

Une fois que l'on part des commentaires, le fait de regarder la taille, la variété des auteurs, la présence de liens fait plutôt sens à mon avis. On peut toujours critiquer mais à un moment il faut déterminer des critères et ceux là me semblent très corrects.

Mais ça reste une mesure quanti et il faut rester humble devant ça : on ne peut pas tout faire avec un algorithme. [D'où le fait que j'insiste sur le choix des mots : ce n'est pas de pertinence qu'il s'agit ici.]

De plus, dans les choix méthodologiques que tu fais, tu conserves des aspects qui alourdissent la charge du quanti : le fait de cumuler les points pour tous les commentaires. Cela favorise les blogs qui publient le plus. D'où le fait que ton classement n'ait pas une tête très différente de celui de Wikio, d'ailleurs, je pense.

En faisant le calcul sur la moyenne (on insiste, avec Palpitt :-)) tu gommeras une partie de l'effet lié à la quantité éditoriale produite et on reviendra je pense davantage sur une notion de qualité de débat (qui est ce qu'on cherche ici non ?)
Je rejoins les autres commentaires: un sacré boulot!

Serait-il possible de savoir combien de commentaires ont chacun des blogs dans le top 100? Ça donnerait une idée de l'activité de chaque communauté et aussi nous donnerait une indication pour savoir quel espoir nous avons de rentrer dans le top 100! (personnellement, c'est un zéro pointé mais bon).
FJ. ;O)
Comme tous les autres, je te félicite pour ce travail. Ca n'a pas dû être evident, et demander énormément de temps. Bravo.
Beau travail!

J'imagine même pas l'effet d'un backlink simultané en première page de tous ces blogs pour un seul et même site! ^^
Mince je suis même pas dans le top 100 (voir mon site) :P Tres bonne idée quand même ce classement, ça montre au moins la pertinence des commentaires et si les gens qui commentent disent des choses intéressantes. M'enfin c'est assez subjectif et je doute que mes lecteurs disent des bêtises... www.blogitouch.fr
Excellent ! Mais quid des auto commentaires que se font certains sous divers noms afin de faire monter la sauce ? ;-))
Autre question, moins vicieuse ;-) y a t il des blogs à la "sethgodin" en France, c'est à dire des blogs "bien" mais sans commentaires ?
@Tubbydev : Les auto-commentaires ne peuvent pas être détectés.
Oui, forcément ; Par exemple, certains bons blogs désactivent les commentaires.
Univers Freebox dans le TOP 10 :-D

Merci pour l'analyse des commentaires :-)

1. Presse-citron
2. Fubiz
3. Blogeee.net
4. Korben
5. Le Journal du Geek
6. GuiM
7. Iphon.fr
8. TechCrunch France
9. AccessOWeb
10. Univers Freebox :-D
Super boulot !