Archives de
Category: Web

Newsletters utile ou non ?

Newsletters utile ou non ?

En février dernier, dans la foulée de la relance des Mondes de Cyborg Jeff, j’ai installé un plugin de NewsLetters lié à ce blog. Pendant de nombreuses années, je n’ai été qu’assez peu convaincu par les newsletters et l’impact sur les lecteurs, déjà envahis de très nombreux autres moyens de communication sur le web. Blog, Flux RSS, Messenger, Facebook, Twitter, et bien d’autres outils modernes.

Pourtant, je me suis fait la réflexion suivante. Facebook est clairement en déclin et peu d’utilisateurs utilisent encore les flux RSS. Enfin j’ai pas mal de personne avec qui j’ai vraiment envie de partager ce qui se trouve sur blog qui n’ont pas fait le pas des réseaux sociaux. De ce fait, le mailing en newsletters à donc du sens, et au bout de deux éditions, je constate effectivement que les personnes que j’espérais informer le sont.

Reste encore à parfaire l’outil. WYSIJA est bien foutu, il se base bien entendu sur les derniers articles publiés, et il est possible de peaufiner la mise en forme. J’aurais grandement aimé un système de publication trimestriel plutôt que mensuel. D’une part pour ne pas rabâcher les lecteurs, mais également parce que je n’ai plus la plume aussi légère qu’au par avant.

En tentant d’ailleurs de retarder au maximum la 2° édition de cette newsletters, j’ai d’ailleurs dû faire une fausse manœuvre, puisque j’ai créé deux deuxième éditions différentes !? Vous m’en excuserez.

Enfin, j’aurais aimé un système me permettant d’automatiser la récupération d’adresse email à ajouter à la la mailing list, sur base des utilisateurs aillant laisser un commentaire dans le blog.

Voilà, je suis pour l’instant satisfait de l’outil et de son impact (les statistiques intégrées sont d’ailleurs bien intéressantes). Et vous amis lecteurs et amies lectrices, qu’en pensez-vous ?

La fin de Google Reader

La fin de Google Reader

Illustration promotionnelle  © Feedly, 2013

En fait, c’est un peu cela le monde d’aujourd’hui. On ne nous invente plus des produits et services parce qu’ils sont parfaits, parc qu’ils correspondent à nos besoins,… Mais bien parce qu’ils il y a un marché à prendre, un créneau à combler… du business à faire. Je pourrais me brosser pour trouver une TV aussi parfaite que ma Sony Bravia de 2008 sans 36.000 options inutiles. Inutile de chercher un bon petit PC netbook, tout est remplacé par des tablettes, même si cela n’a au fond aucune similitude hormis la taille.

Or donc, Google en a décidé que son service Google Reader (Google Flux), lancé il y a huit ans ne correspondait plus au marché du web actuel, et qu’il était temps d’en finir. Fermeture du service programmée pour juillet 2013. Google Reader est l’un des outils de syndication de flux RSS le plus utilisé, permettant faire de la vieille sur différents sujets en récupérant l’actualité de tous les sites qui nous intéressent.

Il est bien certains que les réseaux sociaux ont mis à mal l’utilisation un poil complexe des Flux RSS, en offrant un service grosso modo similaire et accessible aux utilisateurs lambda, néanmoins, la pollution de contenu inutile sur cette solution, donne de bien moins bons résultats.

Je n’ai jamais été grand partisan du service Google, que ce fusse avec iGoogle puis Google Reader. Je lui ai toujours préféré Netvibes que je trouvais plus agréable à consulter sur mon ordinateur, mais la force de Google Reader était de pouvoir facilement récupérer ses listes d’articles à lire vers d’autres outils et plateforme, vers Flipboard et mon Smartphone Androïd par exemple, là où Netvibes en version mobile est loin d’être pratique.

Bref, il existe donc une série d’alternative tels que le stockage de Flux RSS dans Flipboard ou l’application Feedly, mais je ne leur trouve pas le coté pratique et ouvert pour être ma solution d’avenir.

Flipboardne fonctionne que depuis un périphérique mobile, alors que c’est depuis un PC que je sélectionne les contenus que je souhaite suivre ou non.

Feedly se présente déjà comme le successeur de Google Reader, prêt à répondre aux attentes des nouveaux venus, à se placer comme ouvert pour se partager avec d’autres outils… mais les autres outils choisiront-ils de fonctionner avec lui ? De plus, la version web de Feedly est une application à installer dans son navigateur et non un site web, ce qui limite tout de même un peu le coté pratique.

Pour l’heure Netvibes et Scoop.it, deux autres de mes outils dans ce domaine restent trop peu intégrés aux tablettes et smartphone.

Voici une liste d’autres outils à investiguer, même si j’en connais déjà la plupart…

The Oldreader : http://theoldreader.com/
Tiny Tiny RSS : http://tt-rss.org/redmine/projects/tt-rss/wiki
Pulse : https://www.pulse.me/
Taptu : https://www.taptu.com/

Une pétition est actuellement en cours pour tenter de faire subsister le service Google Reader : https://www.change.org/petitions/google-keep-google-reader-running

Intégrer Timecop/Phénix Agenda dans Google Agenda.

Intégrer Timecop/Phénix Agenda dans Google Agenda.

Petit sujet plus technique, depuis 2003 maintenant j’ai mis en place un outil d’agenda partagé pour mes collègues et moi : Timecop, devenu Phénix Agenda.

Si l’outil a peu évolué ces dernières années, il reste assez efficace. Cependant, à titre privé, je trouve l’utilisation de Google Agenda plus souple, surtout depuis que je peux l’utiliser en mode Offline depuis mon smartphone. Ceci dit pouvoir y consulter mon agenda du bureau est évidemment bien pratique. Chose tout à fait possible graçe à l’option export ICL (disponible dans les options utilisateurs de TimeCop/Phenix) et en s’abonnant à cet agenda depuis GoogleAgenda…. Le soucis était jusqu’ici qu’un problème de fuseau horaire décalait les notes de deux heures de mon agenda Google…

L’utilisation des smartphones grandissant chez mes collègues, je commençais à ne plus être le seul à avoir utilité de ceci, il fallait donc trouver une solution pour patcher cela… voici donc ce que j’ai trouvé d’efficace :

http://www.phenix.gapi.fr/forum/viewtopic.php?f=10&t=1466

dans agenda_note_export.php remplacer la ligne 154

$subTypeExport = strtoupper(substr($zlTypeFichier,3,strlen($zlTypeFichier)));

par

$subTypeExport = strtoupper(substr($zlTypeFichier,3, 3));
$subTzExport = strtoupper(substr($zlTypeFichier,-1, 1));

et la ligne 195

if ($ckExportTz!="1") {

par

if ($subTzExport!="S") $ckExportTz=1;
if ($ckExportTz!="1") {
Cyborg Jeff vs Robots

Cyborg Jeff vs Robots

MAJ – illustration générée par ChatGPT, 2026

Ok, après de longues soirées, j’ai donc pu faire redescendre à la normal la charge CPU du serveur Infomaniak et rejoindre mes « copains » du serveur mutualisé. Le combat fut long, stressant et dans la mesure où une fois de plus, je me suis retrouvé seul au monde avec mon problème, je vais en profitez pour vous en faire partager les solutions, puisque déjà quelques autres internautes commencent à rencontrer de problèmes similaires.

Rappel des faits, début du mois, mon hébergement chez Infomaniak devait être isolé car quelques choses saturait le serveur web… et à moi d’en trouver la cause et l’éradiquer. Pas de malware, mise à jour de WordPress et plugins, rien n’y fait, je finis par constater un taux anormal d’appel dans les logs sur une seul et unique page du blog, plus de 10x par secondes et venant de serveurs BingBot officiels Microsoft. La raison reste toujours un mystère, mais mes lectures ont pu montrer d’autres cas similaires. Bug de l’outil, tentative de détournement pour saturer les serveurs…

Tout d’abord, j’ai donc installé un plugin de gestion de cache des pages à la demande d’Infomaniak. Celui-ci n’a pas vraiment fait diminuer la charge CPU, et m’enquiquine plus qu’autre chose d’ailleurs.

Après de nombreux tests, j’ai finalement interdit à BingBot et MSNBot de se rendre sur tout le site contenant la page à problème. Radicale, mais le contenu de celui-ci ne souffrira pas de ce nom référencement… Ceci dit cette solution est à mon goût trop agressive.

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^.*(msnbot).* [NC]  # Si le user agent contient la chaine msnbot
RewriteRule ^.* – [F,L]  # On interdit alors l’accès à la page

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^.*(bingbot).* [NC]  # Si le user agent contient la chaine msnbot
RewriteRule ^.* – [F,L]  # On interdit alors l’accès à la page

La solution s’avère efficace, puisque la charge serveur diminue alors de suite, néanmoins les logs restent surchargés, j’adapte donc avec un fichier ROBOTS.TXT qui placé à la racine du site impose aux différents bots ce qu’il peuvent indexer ou non… 24h plus tard, les résultats sont efficaces, mon fichiers LOG de 40mo est passé à 1,5mo !

User-agent: *
Disallow: /wp-*
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*%26layout=
Disallow: /*xoops_url

J’impose donc de ne pas indexer tous répertoires ou fichiers commençant par wp- à savoir des fichiers critiques à WordPress, les fichiers .php, .js ou .css et propre à ce cas les urls contenant la chaine de caractère %26layout= ou xoops_url.

Bon, j’espère être tranquille jusqu’à l’année prochaine mantenant !

Allé, pour vous donner un peu de coeur à l’ouvrage… tout cela me rappelle ce morceau de musique écrit en 2002 : Cyborg Jeff – We are the Bots !

Lire la suite Lire la suite

Saturation serveur

Saturation serveur

Déjà quelques jours que je m’arrache les cheveux et perd un temps précieux sur un sérieux problème d’attaque Web sur mon serveur, un soucis qui semble s’orienter autour d’attaque de BingBot ou d’un bon bug dans celui-ci, le tout causant une charge CPU anormal sur le serveur.

Et c’est de la que le problème a été identifié. Contacté par Infomaniak il y a un moment, mon hébergement avait dû être démutualisé pour cause de surcharge CPU, or ce n’est pas vraiment le genre d’Infomaniak de faire la grimace ! Difficile de mettre la doigt exactement sur ce qui en est la cause, il a donc fallu tenter plusieurs pistes.

J’ai d’abord fait un genre de test malware de mes différents sites avec cet outil : http://sucuri.net/ sans grand résultat, il m’annonçait simplement que mes versions de WordPress n’était pas à jour. Dans la mesure où le passage à Worpdress 3.x impliquait toute une série d’incompatibilité plugins, je m’étais volontairement arrêté à la version 2.9.8.2  J’ai donc mis à jour mes noyaux, mis à jour les nombreux plugins et puis ?

Je me suis souvenu avoir lu qu’il était parfois utile de checker authenticité des thèmes wordpress utilisés. En effet, par exemble, celui de mon blog avait été réalisé au départ d’un thème datant maintenant de 2007…. Cause potentiel ? Pas vraiment sur, mais bon, cela n’aura pas fait de tord de mettre tout cela à jour

J’en ai profité pour faire du nettoyage sur mon serveur, par bloquer via .htaccess certains répertoires,… puis sous les conseilles d’Infomaniak, j’ai installé un outil d’optimisation de cache du site WP Super Cache, qui permet de diminuer les requêtes aux serveurs.

Mais rien à faire, la charge CPU restait toujours assez élevée… Dans les statistiques, je voyais qu’une page d’un de mes blogs était anormalement visitée, plus de 600.000 fois depuis début mai sans aucune raison. La page était plutôt clean, on aurait juste pu lui reprocher un embed de player Jamendo… Un croisement avec les weblog du site me montre effectivement que le problème passe bien par là, on retrouve ce genre de log plusieurs fois par seconde en permanence :

157.55.17.151 - - [16/May/2012:00:00:10 +0200] "GET /cyborgjeff/site/albums/divagation-se-1997/%26layout=button_count%26show_faces=false%26width=250%26action=like%26colorscheme=light%26font=arial%26height=35px/1997/02/24/344-4u2-ethnic-drums-ftl-mix-16/1997/04/10/372-ego/1997/03/23/365-2-3-frutti-dance-classics/1997/02/24/344-4u2-ethnic-drums-ftl-mix-16/1997/04/10/370-introduction-of-dream-part-ii/1996/11/27/279-moon-day/1996/11/27/279-moon-day/1997/04/04/368-deep-house-titanic-mix/1997/04/10/372-ego/1997/04/10/372-ego/1997/04/05/369-i-get-no-sleep-part-2/1997/03/03/351-one-month-but-three-weeks-without-you-mixing/1997/03/16/361-hey-mister-dj/1997/02/12/335-space-del/1997/02/12/335-space-del/ HTTP/1.1" 301 - "-" "Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)"

Plusieurs choses m’intrigue là dedans, d’abord tout le blabla après la page proprement dit et ensuite des appels vers les urls des pages liées à la première, un peu comme si l’appel en question allait ouvrir une dizaine de pages d’un coup, ce qui pourrait évidemment expliquer la surcharge, ensuite à quoi peut bien faire référence ceci : %26layout=button_count%26show_faces=false%26width=250%26action=like%26colorscheme=light%26font=arial%26height=35px

J’ai tout d’abord supprimer ma page temporairement, les appels ont continuer sans soulager le serveur, et pour cause, c’est wordpress qui génère les messages d’erreur type 404 et compagnie, par contre fin de journée, le BingBot a fini par se lassé et la charge CPU est retombée… J’ai réactivé la page, et dès le lendemain, bardouf !

Petit check, les différentes IPs semblent bien provenir de Microsoft (MSNBot et BingBot), j’avais fini par trouver quelques Abus BingBot récent mais qui semble surtout provenir d’adresse IP douteuses, et cibler essentiellement les pages de logins ou de commentaires, ce qui n’est pas le cas ici… J’ai par contre aussi trouvé certaines personnes rapportant des comportements agressif et anormaux des BingBots officiels ces dernières semaines…

Que faire ? Pour l’heure j’ai bloqué l’accès à Bingbot et Msnbot via du code .htaccess

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^.*(msnbot).* [NC] # Si le user agent contient la chaine msnbot
RewriteRule ^.* - [F,L] # On interdit alors l'accès à la page

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^.*(bingbot).* [NC] # Si le user agent contient la chaine msnbot
RewriteRule ^.* - [F,L] # On interdit alors l'accès à la page

Cela soulage le serveur, mais je trouve la parade un peu trop large… j’aimerais bien pouvoir affiner cela, voir comprendre la raison du problème sur ma page bien précise… histoire de pouvoir me prémunir d’autres pertes de temps de ce genre !

>> Ici la solution finale mise en place : https://lesmondesdecyborgjeff.be/2012/05/24/cyborg-jeff-vs-robots/

Lire la suite Lire la suite