Tag : Blogonet

Exclue : Eric détrôné par Korben !

Départ en vacances ou non, une telle information ne pouvait être laissée sous silence.

Depuis les débuts de Blogonet, mois après mois, classement après classement, Eric de Presse-Citron n’a jamais perdu la tête du classement des blogs francophones, toutes catégories confondues. Jusqu’à aujourd’hui ! Korben, blogueur sur Korben.info, vient en effet de lui faire une légère queue de poisson !

J’ose imaginer que le remue-ménage autour du hack de Twitter a joué dans l’histoire ; la publication d’une partie des documents dérobés par le hacker sur le blog de Korben a entrainé des centaines de liens vers ledit article. Cependant, le combat est rude, l’écart entre les deux protagonistes est infime, la compétition sera passionnante ; et d’ailleurs, vue la progression des deux auteurs ces derniers jours, si le mois de juillet avait compté 48 heures supplémentaires, je pense qu’Eric aurait conservé la tête du classement. Peut-être reprendra-t-il sa place le mois prochain ?

Les paris sont ouverts, faites vos jeux ! En attendant, je retourne en vacances.

A qui la faute ?

- Toi, là-bas, viens donc me voir. Yeux bleus et chemisette violette, je parle bien de toi. D’où viens-tu ?
- J’ai mes papiers m’sieur, j’ai rien fait
- Ne t’inquiète pas, c’est pour un sondage, je me renseigne juste

Depuis hier, cela n’aura pas échappé aux visiteurs fidèles, Blogonet subit de nombreux ralentissements. La raison ? Un pic soudain de trafic, ainsi qu’un accroissement exponentiel du nombre de membres et de blogs soumis. Tout cela semble parfaitement légitime, pas de robot, pas de spam, ce sont bel et bien des humains.

Mais d’où proviennent-ils ? L’analyse des statistiques n’a pour ainsi dire absolument rien donné, ces visiteurs semblent taper directement l’adresse URL dans leur navigateur. D’autres proviennent également de Google, suite à la requête « Blogonet ». Mais cela ne permet pas de remonter à l’origine de ce trafic.

Un blog nous a cités sans donner l’adresse URL du site (obligeant ainsi les lecteurs à taper directement l’adresse dans leur navigateur, ou à nous rechercher sur Google) ? Ou alors, c’est l’œuvre de la presse-écrite, de la radio, voire de la télévision ? Vous avez des informations à ce sujet ? C’est juste par curiosité, nous recherches à ce sujet ne portant par leurs fruits.

Nous avons installé et configuré un nouveau serveur dans la précipitation, pour soulager les autres machines. Malheureusement, cela ne suffit pas pour supporter le nombre de visites, de plus en plus important. Deux nouveaux serveurs ont été commandés, et seront mis en place dans les heures à venir. Espérons que cela suffise.

Mise à jour : [01/07/09 07h17] Les deux nouveaux serveurs ont été reçus, installés, configurés et mis en production. Je remercie Aurelie pour son coup de main (et accessoirement, pour avoir passé une partie de sa nuit dessus). Pour le moment, tout fonctionne bien, nous attendons le pic de trafic (d'ici quelques heures) pour constater le résultat.

Développement : la guerre des thumbnails

Également appelés Snapshots, les thumbnails sont des impressions-écran de votre site web, généralement affichés sous forme de vignettes. Je les utilise notamment sur les fiches des blogs, sur Blogonet. Souhaitant être indépendant, j’ai décidé de développer mon propre programme, qui se charge de les générer automatiquement.

Vu que cela semble susciter beaucoup de questions, je dévoile ici mon secret. Et quel secret ! Alors, comment prendre une impression-écran de manière automatique, avec un script ? La réponse est simple : vous ouvrez votre navigateur, vous affichez la page désirée, et vous prenez une impression écran. Le tout avec un script, bien entendu.

Par là, je veux dire que je n’ai pas inventé la poudre. Vous savez le faire manuellement, la manière de procéder est exactement la même. Les programmes sont juste lancés par un script. Par contre, c’est bien plus problématique au niveau des contrôles :

  • Les navigateurs ne fournissent aucun moyen de vérifier que le chargement de la page est bien terminé. Une solution est de fixer un délai, par exemple 10 secondes, mais ça reste très crade : si la page est chargée en 2 secondes, c’est une perte de temps ; si elle a besoin de 20 secondes, l’impression-écran ne sera pas bonne. Une autre idée : se baser sur une analyse réseau. Mais avec plusieurs tâches en parallèle, ce n’est pas évident.
  • Si le navigateur n’affiche pas la bonne page, ou si, pour une raison ou une autre, il reste bloqué sur l’onglet précédent, l’impression-écran ne captura pas le site désiré. Afficher le thumbnail de Presse-Citron à la place de celui de Fubiz est assez problématique… Et pourtant, c’est ce qu’il s’est passé sur Blogonet ces derniers jours ! D’ailleurs, ce n’est pas le seul, j’estime ce genre d’erreurs à 1% actuellement. Beaucoup trop.

Bien que le principe soit simple, contrôler des logiciels graphiques via un script n’est pas évident pour autant. Pour commencer, aucun écran n’est installé sur nos serveurs (sauf cas de force majeur, quand nous sommes sur place) : cela nous oblige donc à installer un serveur X sur une sortie virtuelle. Et même sur plusieurs, pour prendre plusieurs screenshots en parallèle. C’est buggé, il s’emballe assez régulièrement (toutes les 12 heures environ). C’est buggé, il s’emmêle parfois les pinceaux entre les différentes interfaces. C’est buggé.

Soit je laisse tombe l’idée du navigateur, et me tourne vers une solution utilisant directement webkit. Cela posera problème pour les sites utilisant massivement Javascript ou Flash. Soit je me tourne vers un service externe, spécialisé dans le domaine : ils ont plus de ressources à y allouer, leurs machines ne font que ça. Reste à trouver le service idéal, les limitations de websnapr étant trop fortes pour notre besoin.

Des suggestions ?