Ma vie privée, mes idées, mon oeuvre...

Aller au contenu | Aller au menu | Aller à la recherche

Mot-clé - hébergement

Fil des billets

dimanche, septembre 30 2012

Marre de l'open source mal codé, pas maintenu, oublié par les utilisateurs

J'avais encore un serveur dans les choux ce matin. Un serveur pourtant en parfaite santé, qui fonctionne très bien depuis des années.

Impossible d'accéder à l'OS, la carte réseau répondait bien aux sollicitations par ping, j'ai du forcer une coupure de courant au risque de perdre des données et le bloc d'alimentation. Et là, je suis content d'avoir un Master Switch accessible à distance pour m'éviter un déplacement de deux heures pour une intervention de deux minutes en console !

Il y a quelques jours j'avais déjà repéré des ralentissements liés à des requêtes SQL gourmandes, mais rien de très anormal sur des grosses tables (forcément sans l'index qu'il faut pour les trier...).

Ce serveur est un mutualisé, il contient environ 200 sites de clients sur lesquels je ne suis jamais intervenu et une centaine de sites à moi ou gérés par des collègues freelances.

Pas de chance, c'est une fois de plus un site pas géré qui était touché par un robot utilisant un programme de soumission de formulaires pour bourriner avec des messages de spams.

Le hic n'est pas forcément qu'en quelques mois plusieurs millions d'enregistrements ont été mis dans la base de données inutilement (contenant des liens vers sites pornos, pilules d'extension de pénis et de bandaison ou autres merdouilles), mais plus que ces pages bourrées de spams étaient parfois affichées (car parcourues par des moteurs de recherche) et que par conséquent ça lançait en boucle la construction d'un index temporaire sur une table gigantesque bloquant ainsi les accès à la base de données, et par extension au serveur qui n'avait pas assez de ressources pour tout traiter.

Résultat des courses j'ai passé 3 heures à chercher la source du problème et la circonscrire. Le serveur a été inaccessible pendant près de 12 heures avec les sites présents dessus tous HS. Un samedi soir et dimanche matin, c'est pas la cata vus les sites mais par principe ça me gonfle.

Le logiciel utilisé sur le site concerné par cette attaque était une fois de plus un script open source, trouvé au hasard, non maintenu et sans protection contre ce genre de choses (le minimum étant d'éliminer le HTML de ce qu'on envoi dans un simple commentaire, le mieux étant de s'assurer que ledit commentaire est envoyé par le formulaire du site et non appelé en direct de l'extérieur et pour rappel, les captchas ne servent à rien si ce n'est faire chier les internautes).

Comme à chaque fois depuis que je fais de l'hébergement et perds du temps sur des accès extérieurs non sollicités, c'est un script qui n'a pas été maintenu, qui n'a pas été codé proprement et qui en plus n'était plus censé être utilisé par le site mais a quand même été laissé sur son FTP !

Ce qui est chiant, c'est que quand on me demande pourquoi je fais du personnalisé, développé par moi ou des collègues mais non basé sur de l'open source, on ne comprends pas mes arguments. Si les gens étaient capables d'installer les patchs sur leurs sites ça ne me poserait pas de problème, mais une fois que c'est en place la plupart n'y touchent plus et ne savent même pas qu'il y a des sources d'attaques possibles. De toute façon ils s'en foutent jusqu'à ce que ça se voit sur leurs pages ou que le site soit inaccessible ou qu'ils puissent plus envoyer d'email parce que leur quota est dépassé alors qu'ils n'en envoient pas (mais qu'un bot le fait pour eux sans qu'ils le sachent).

Cet incident est la goutte d'eau qui fait déborder le vase déjà trop plein : j'arrête l'hébergement mutualisé et dégage tout le monde. J'en ai marre de perdre du temps sur ce genre de choses pour 30 euros par an ! A compter de demain je ne renouvelle plus les sites et leur propose de s'héberger ailleurs (avec prestation d'assistance au transfert s'ils n'en sont pas capables eux-mêmes).

mercredi, mai 11 2011

OVH a dépassé les 10 millions de bons de commande

Cette journée est importante pour une petite société informatique de Roubaix. Créée il y a quelques années, devenue leader sur ses marchés et s'étendant désormais à de nombreux pays à travers la mise en place de structures locales, OVH a dépassé cette nuit les 10 millions de commandes.

Bien entendu, ça ne veut pas dire qu'il y a eu 10 millions de ventes, mais c'est un symbole quand même important qui a tenu en haleine les colistier de certaines mailings listes hier, à faire le décompte et estimant l'heure de passage de ce nombre rond.

C'est non seulement un chiffre important quand on l'évoque, mais en plus, 10 000 000 a aussi une signification pour les informaticiens que nous sommes : c'est un joli 128 en binaire ou -0 en entier signé. Bon, ok, vous vous en foutez, mais je trouve qu'il fallait le signaler.

Cette année OVH dépasse les barrières symboliques en nombre de domaines, en nombre de serveurs, en nombre de bons de commandes et continue sa progression. Bravo à l'équipe de Roubaix Valley et à tous les collaborateurs de cette petite entreprise qui fait tant de belles choses pour le web.

mardi, mars 1 2011

Vous avez des serveurs, hébergez ou éditez des sites web ? Archivez tout ce que vous pouvez !

Il y a 7 ans, la loi pour la confiance dans l'économie numérique était votée afin de sécuriser Internet et de cadrer un peu le bordel ambiant sur le réseau. Suite à ce texte tous les sites francophones doivent indiquer qui les héberge, qui les édite et ce qu'ils font des données de leurs utilisateurs, en plus bien entendu de fournir des conditions générales de vente ou d'utilisation (selon les cas).

Normalement les hébergeurs devaient également archiver les historiques de consultation des sites présents sur leurs machines, mais les données à conserver n'étaient pas très précises, du coup, au mieux, on stockait les logs d'accès aux pages web pour reconstituer un historique des accès à un site à partir d'une IP et d'une date ou heure. Ce stockage jusque là n'impliquait pas des données applicatives.

Depuis le décret d'application cadrant la mise en place de cet archivage, ce n'est plus le cas (ou en tout cas c'est comme ça que je l'interprète).

On est désormais obligés de pouvoir reconstituer le parcours d'un internaute sur les sites hébergés, mais également d'indiquer quelles données ont été modifiées par lui (et j'en déduis qu'il faut aussi stocker le contenu des données en question, même lorsqu'elles sont supprimées).

Comme toujours le décret lui-même est imbitable par un non juriste à cause des nombreux renvois vers d'autres décrets et textes de loi. du coup chacun est censé se renseigner pour savoir comment exercer son activité dans les règles de l'art et dans le respect de la législation française.

Ce que j'en ai déduit, c'est qu'il va falloir mettre des extensions "espion gouvernement français" dans tous les CMS et logiciels de blog histoire d'archiver tout ce qui est fait et par qui c'est fait, et que les fournisseurs de services publics devront également stocker les pseudos et les données ajoutées/modifiées/supprimées par les internautes accédant à leurs sites.

Heureusement, ça ne concerne que les sites ayant des interactions avec le public, donc si vous éditez un blog et empêchez toute intervention de vos visiteurs (donc fermez les commentaires), vous n'aurez rien à faire.

En revanche, si vous donnez des actions possibles au public qui pourra ensuite diffuser et modifier des infos (cas des forums de discussion, des plateformes d'hébergement de blogs et des sites de partage de contenu), vous l'avez dans l'os : il vous faut désormais stocker tout un tas de données redondantes durant un an, ce qui va vous forcer à acheter des disques durs pour le stockage et vous assurer qu'ils ne plantent pas car il faut bien entendu faire du stockage sécurisé pour que tout soit montrable à tout moment si les autorités demandent quelque chose.

Une loi de plus qui m'incite à me dire que je vais arrêter de bosser dans ce pays et me barrer élever des chèvres ou des cochons dans un coin paumé de la planète. (même si je comprends l'utilité du flicage dans les données transitant en ligne pour lutter contre les bandits)

Pour consulter le décret, rendez-vous sur le site du Légifrance. Pour une version compréhensible, il y a l'interprétation qu'en a fait Numerama.

vendredi, juillet 23 2010

La France coule ? Mais que font les chantiers navals ?

Dans un sens, je trouve l'histoire du site France.fr assez amusante. Encore un beau projet français, alimenté par des centaines de milliers d'euros qui ferme quelques heures après son ouverture pour cause de succès trop important. a croire que les décideurs et chefs de projets travaillent en se disant qu'il n'y a personne sur Internet. Peut-être comptaient-ils qu'HADOPI démarre en temps et en heure et ai fait coupé 50% des connexions web françaises avant l'ouverture du site ?

Je sais bien que faire des estimations de fréquentation ou des projections dans l'espace ne sont pas chose aisée, mais prendre un hébergement sous dimensionné pour un site qui a une aura mondiale, ouvert dans les langues les plus utilisées, je trouve ça complètement fou (surtout que c'est pas la première fois que ça se produit) !

A croire qu'ils n'apprennent ni des erreurs des autres, ni des leurs.

Quoiqu'il en soit, certain ont des idées pour les aider à avancer, notamment la société OVH, petite entreprise familiale du Nord de la France, qui héberge de nombreux sites francophones et a ouvert des filiales un peu partout dans le monde ces derniers mois. Voici un message de son boss à l'attention des clients d'OVH et des pouvoirs publics :

Bonjour,

Ayant lu, comme vous, sur les problématiques de lancement du site france.fr qui doit représenter quand même ce que c'est la France, Ovh se propose d'apporter son aide et d'héberger ce projet gratuitement durant 1 an avec autant de serveurs, de la bande passante et d'homme qui seront nécessaire pour maintenir le projet en fonctionnement et encaisser toutes les montée en charge qui se présenteront. Vu qu'on héberge plus de 80000 serveurs dans nos 2200 baies sur un réseau d'un peu moins d'1Tbps de capacité, on sait créer des clusters de plus centaines de serveurs de 8, 12 ou 16 cores en quelques heures avec de capacité de stockage de Xx0.5Po puis les faire évoluer à autant qu'on le souhaite en espace de 2 à 4 jours. Remarque: c'est un peu notre métier ... :)

Si ça intéresse les responsables du projet: (note de moi-même : EMAILSUPPRIMEEPOUREVITERLESSPAMMEURS)

Amicalement

Octave

Me demande s'ils prendront cette main tendue ou s'ils persisteront dans leurs erreurs et resteront à héberger le site où ils l'avaient décidé au départ pour se prendre un iceberg dans la tronche !

lundi, juin 7 2010

Changement de machine pour des sites très gourmands

Ce week-end a eu lieu la migration de plusieurs gros sites hébergés par moi. Je les ai changé de serveur après un bon mois de tests. Le basculement d'une machine d'il y a trois ans vers un serveur au top de la technologie moderne (avec notamment un disque dur SSD et assez de mémoire pour contenir entièrement la base de données MySQL) aura eu un gros effet bénéfique sur les temps de réponse.

Bien entendu, au passage, j'en ai profité pour changer quelques petites choses sur le calcul des pages, dans la base de données et dans le fonctionnement global de tout ça pour aboutir à quelque chose de vraiment plus rapide et optimisé. Il y a sans doute d'autres choses à faire, mais j'en recauserai courbes à l'appui car ça peut servir d'exemple à tout développeur de site très fréquenté.

Reste à voir comment se comportera la nouvelle machine maintenant que tout est dessus et que les moteurs de recherche et les internautes piochent dedans.

C'est aussi un peu à vous de me dire ce que vous en pensez : avez vous des temps de réponses idéaux pour le surf ? Parcourrez donc ces deux sites pour me dire.

Le Choix des Libraires Le Choix des Bibliothécaires

Et profitez en pour découvrir les livres choisis par les libraires et les bibliothécaires participants à ces sites.