aerofs , une solution de sauvegarde décentralisée

La sauvegarde est un domaine vaste et complexe qui essaye de répondre à une problématique pourtant simple, sauvegarder ses données. La difficulté qui ne saute pas forcément aux yeux de l’utilisateur lambda étant de résoudre 2 problématiques, garantir la restauration des données et garantir la confidentialité.

La restauration

La restauration dépend bien sûr du support utilisé. On est passé ces dernières années des supports physique sur bande, disque à plateaux et flash à des supports dématérialisés et hébergés sur Internet. Le principal intérêt est bien sûr de se mettre à l’abri d’une destruction ou une disparition du support physique sur des lieux non adaptés à protéger des données d’une grande valeur. L’autre avantage est d’automatiser la sauvegarde et ainsi sauvegarder plus finement l’avancée de ses travaux.

Cependant cette sauvegarde externalisée dépend elle aussi du support physique utilisé. On a supprimé les risques d’une destruction occasionnée par des locaux non adaptés (chute, vol, incendie, inondation, etc) ce qui n’est pas rien, mais quid d’un crash disque sur le serveur distant ?

Il existe d’excellentes solutions externalisées, de type Dropbox. Celle-ci utilise le cloud S3 fourni par Amazon pour stocker les données de leur utilisateur. Ce type de service est censé éviter les problématiques de gestion du stockage et de crash de disque occasionnant une perte de données. Or un récent plantage de plusieurs heures dans un datacenter d’Amazon a rendu indisponible de nombreux site web et certains auraient perdu des données, même si Dropbox n’est semble t-il pas concerné.

La confidentialité

Toujours Dropbox, ils ont récemment modifié leur CGU afin de rappeler qu’ils devaient se conformer à la législation américaine et éventuellement fournir des données de leur client sur demande de la justice. Ce type de contrainte n’est bien entendu pas spécifique à Dropbox mais à toute entreprise qui doit par définition respecter la loi de leur pays. A ce titre des entreprises qui stockent sur leur cloud des données de leur client, tel que Google, Apple, Yahoo ou Microsoft ont elles aussi cette obligation, il est bon de le rappeler.

Cela ne gênera sans doute pas ceux qui, par exemple, acceptent les caméras de surveillance partout, "du moment qu’ils n’ont rien à se reprocher", mais pour les autres il y aura sans doute une gène voir une phobie à sauvegarder ses données dans ces conditions.

Le P2P

Ces récents échec du Cloud, viennent rappeler que celui-ci ne peut être une solution pérenne ni respectueuse de la confidentialité. Ces échecs viennent rappeler que la seule architecture fiable pour les données ne peut être basée que sur la même architecture qu’Internet, le P2P. Internet est une maille composée de noeuds, car il a été intégré dès sa conception l’évidence que rien ne peut garantir définitivement l’intégrité total d’un lieu géographique ou d’un matériel. Ainsi une information atteindra sa destination selon un chemin non pas figé mais selon l’état du réseau au moment de son acheminement.

Il serait intéressant de traiter le stockage et l’accès à ses données de la même manière. A vrai dire cela existe déjà puisque le P2P répond exactement à cette problématique. Or même si celui-ci est entaché d’un usage bien souvent à des fins de contrefaçons, il n’est qu’un outil neutre.

aerofs

Pour revenir au sujet, la sauvegarde a tout intérêt à exploiter les capacités du P2P. Ainsi les données ne sont pas centralisée et elles peuvent être répliquées en de multiple endroits. La startup Air Computing Inc qui a créé le logiciel aerofs a exactement compris cela puisqu’elle fourni ce logiciel. A défaut d’avoir un équivalent libre aussi souple, j’y retrouve les avantages de Dropbox (client natif et multiplateforme), sans la centralisation qui est là optionnelle et payante au delà d’1 Go.

J’ai une instance aerofs sur quelques machines, dont un serveur dédié sur lequel est synchronisé l’ensemble des données stockées dans le logiciel. Pour résoudre la problématique de la confidentialité j’utilise l’excellent encfs qui me permet de chiffrer en userland le contenu d’un répertoire. Un simple lien Aerofs vers ce répertoire chiffré, permet de chiffrer à la volée les données reçues :   (merci à Flink pour la correction) Il suffit donc de stocker le répertoire chiffré de encfs dans Aerofs pour sauvegarder de manière répartie et sécurisée ses données.

Voici une capture de l’interface en train de synchroniser des données vers mon serveur.

Il est bien sur possible de sélectionner les répertoires à synchroniser par client, afin de ne pas stocker sur son ordinateur du boulot des données personnelles. Enfin il est possible de partager un répertoire avec d’autres utilisateurs sélectionnés.

Il existe un vote d’une demande de fonctionnalité afin de rendre l’ensemble libre : http://vote.aerofs.com/forums/67721-feature-requests/suggestions/1728653-open-source-aerofs-and-only-take-payment-for-clou?ref=title

Je pense que si aerofs n’est pas libéré, il existera un jour ou l’autre un équivalent libre, voir même un file system en P2P chiffré. Chacun stockant des morceaux de données répliquées, anonymes et chiffrées.

Pour finir je suis de plus en plus convaincu que l’avenir des applications et des données, du moins dans le Libre, utiliseront de plus en plus le P2P, comme le font Bitcoin et namecoin,  c’est tout notre intérêt et c’est le seul moyen pour lutter contre le Minitel 2.0, et contre l’hégémonie de Google qui compte bien s’étendre à toute sorte de devices : http://fr.techcrunch.com/2011/05/18/google-android-internet-des-objets/  :)

Juick

Après avoir lu l’article de Nÿco sur Juick j’ai couru tester ce surprenant service de blogging (et non pas micro). Et là surprise c’est exactement ce que j’avais imaginé comme alternative à Twitter. En effet pas de stupide limitation à 140 caractères, Juick peut donc faire office de blog. Support des photos intégré et non pas via un autre site (twitterpic). Et surtout support complet du service par Jabber : inscription et post.

Pour compléter l’article de Nÿco je trouve qu’il manque juste une passerelle vers les salons Jabber. Cela serait tout simplement énorme qu’un salon jabber puisse être associé à un groupe Juick. On aurait ainsi tout l’historique du salon sur le groupe. Par contre il manque pour gérer cela, le support des groupes dans Juick et le fait de pouvoir poster via l’interface web. J’avais pensé à ce type de fonctionnalité pour Noumba, mais le profil des utilisateurs ne permettait pas de l’envisager. Le site est très jeune mais comme il est complètement pensé autour de Jabber cela serait stupide de ne pas implémenter les salons.

Autre surprise, le business model. Enfin un site qui ne se base pas sur la pub ! Il est nécessaire de payer 9.95$ afin de pouvoir poster plus d’une image par 24 heures. On espère le support de la vidéo bien sûr. Comme l’indique Nÿco il suffit d’envoyer l’image au bot Juick depuis son client Jabber. Par contre les proxy de transfert par défaut dans Gajim ne fonctionnent pas et j’ai du ajouter celui de jabberfr (proxy.jabberfr.org). Une fonctionnalité qui permet de remplacer imageshack !

A propos de Jabber on peut constater que cela va limiter le service aux connaisseurs. Pour y remédier il faudrait a mon avis pouvoir poster via l’interface web et ouvrir une API (UPDATE : l’API existe bien ici décrite en Russe :p , et on me signale l’existence d’un client Juick , il n’utilise pas une API mais parse simplement un XML des derniers messages, ). Quant aux tags appelés hash tags sur Twitter, ils servent à compenser l’absence flagrante des groupes. J’y vois personnellement l’intérêt que sur des termes génériques. Exemple un groupe juick au lieu d’un simple tag, par contre un tag pour définir une humeur ou décrire un média. De plus sur un groupe ou un salon à la jabber on peut y définir des droits d’accès et de multiples propriétés qu’on ne peut envisager avec un simple tag. De la même manière dans un blog les tags et les catégories sont complémentaires.

D’après Nÿco, Juick est écrit en Perl/C++ et cela se ressent à la réactivité immédiate du bot et du site. Certes le nombre d’inscrit est encore très faible, cela sera à confirmer. Je regrette juste l’aspect propriétaire du site.

Pour résumer, voilà donc un site très prometteur où l’on sent que l’auteur a un peu plus de 2 de QI, car il faut vraiment être stupide pour avoir laissé des services tiers compléter les manques flagrants de Twitter… Pour l’avenir de ce type de service, je me demande juste si Google Wave ne mettra pas tout le monde d’accord, car outre des fonctionnalités étonnantes, il sera OpenSource et permettra à chacun d’utiliser son propre serveur à la manière de Jabber.

Dropbox suite

Je me rend compte que je n’ai pas expliqué ce qui fait l’énorme intérêt de Dropbox par rapport à d’autres produits, hormis d’être natif tri plateforme. Il ne s’agit pas ici de monter un disque déporté façon WebDav ou SSH, car ici on parle de synchronisation. En effet les données placées dans le répertoire de Dropbox ne sont pas déplacées mais copiées sur leurs serveurs ce qui permet de pouvoir y accéder sans connexion Internet. Le démon dropboxd scrute le répertoire et copie les nouveaux fichiers et ceux modifiés. Mon laptop dans lequel j’ai également installé Dropbox peut ainsi récupérer en fond de tâche les modifications faites depuis le PC de bureau.
Donc nul besoin de copier dans ce répertoire les données que l’on souhaite sauvegarder, mais plutôt de les y déplacer. J’ai déplacé dans ce répertoire mes répertoires importants comme “dev” ou “docs”, ou des fichiers de config comme le .emacs avec un simple lien :

/home/fred
ls -al .emacs
lrwxrwxrwx 1 fred fred 21 sep 14 02:07 .emacs -> Dropbox/config/.emacs

Enfin si certains sont prêts à payer l’offre de 50Go à 10$/mois environ il est sans doute envisageable de synchroniser son répertoire home en entier dans le cas ou l’on utilise exactement les mêmes environnements logiciels sur ses différentes machines. Pour les libristes pointus il existe un logiciel libre très proche du fonctionnement de Dropbox, boxbackup. Bien sûr la configuration n’est pas aussi aisée et il n’y a pas d’interface web, mais l’alternative existe et des courageux peuvent peut être développer une offre entièrement libre.

Seesmic via Jabber

Vu sur le blog de Seesmic la possibilité de suivre par un bot Jabber des évènements sur des contenus ou des utilisateurs. Le bot permet de tracker du texte ou des vidéos de la même manière que le bot Jabber de Twitter.

Même si Jabber / Gtalk n’est pas encore l’IM le plus usité sur le Net il n’en reste pas moins que c’est celui le plus implémenté grâce au standard ouvert qu’est XMPP. Sachant que les messageries instantanées sont au moins, sinon plus, autant employées qu’un navigateur web je pense que l’implémentation de quelques XEP tel que la XEP-0071: XHTML-IM qui permet d’envoyer au client du texte riche au format XHTML, comme le fait Gajim, pourrait aider à populariser Jabber. Les wallpapers animés dans le texte c’est le minimum syndical il parait :)

Google owned votre domaine

update : Google Aps entreprise sort à la vente fin janvier 2007

On connaît les pluparts des nombreux services de Google, mais quid pour l’entreprise ou l’association à part le google appliance ?

Google teste plus ou moins discrètement depuis quelques mois un service d’hébergement mail à destination des professionnels.

En effet, gmail, gtalk, google calendar sont sans doute géniaux pour les particuliers, mais quel intérêt pour l’entreprise ? L’entreprise sérieuse possède son propre domaine, et mis à part le plombier du coin qui se trimballe un mail @wanadoo.fr, les autres communiquent via leur propre domaine.

C’est ici que le service en test (comme toujours chez Google :) ) Google Apps pour Votre Domaine intervient. Il propose ni plus ni moins d’offrir les services Gmail, Gtalk, Google agenda et Google Page Creator sur votre domaine !

Quand on connaît la lourdeur pour un administrateur système et réseaux à installer et configurer tout ces services dans l’entreprise il est plaisant d’imaginer faire la même chose en quelques clics de souris ….

Adieu les serveurs à gérer dans tous les sens, les serveurs mails et autre anti-spam à configurer…

Évidement le DSI de base ne pourra s’empêcher de crier : “quoi mes données privées gérées par une entreprise tierce ! (crie de vierge effarouchée)”.

  • C’est vite oublier que les sociétés proposant des services d’externalisation existent depuis bien longtemps déjà et obtiennent un certain succès ;
  • C’est vite oublier que le Net est le Net, c’est à dire qu’un mail envoyé, est potentiellement lisible par tout le monde dès sa sortie du smtp local, au même titre qu’une carte postale ;
  • C’est vite oublier que les procédures de sauvegarde de base ne sont souvent pas déployées au sein de l’entreprise.

Bref, le fantasme du “mes données sont plus en sécurité chez moi” n’est qu’un leurre. Peu importe le lieu du serveur de mail puisqu’il suffit de chiffrer son mail avec une clé gpg pour rendre celui-ci indéchiffrable par une personne autre que le destinataire. Peu importe le lieu du serveur jabber quand il suffit d’activer le chiffrement gpg depuis son client jabber.

Mais combien le font ? Combien utilisent de vrais outils permettant de le faire ?

Google a le mérite de proposer une solution simple, sûre (vous avez plus confiance entre votre serveur ou ceux de Google ? …), et clé en main.

Vous ajoutez ceci permettant de gérer les alias de domaine et vous obtenez une machine à succès.

Par cette offre, Google répond à un besoin énorme, qui était certes rempli par quelques petites sociétés de services. Mais ajoutez y la scalabilité de Google, leur respect des standards ouverts, leur ouverture via des API, l’utilisation massive des logiciels libres. Petit bémol à cette description idyllique, leurs logiciels ne sont pas libre, mais qui peut s’en vanter ?

Ce billet n’est pas une ode à Google, car je conçois qu’il peut être dangereux qu’une entreprise ait autant de bonnes idées …

L’idéal serait que ce type de services soient proposés par une fondation sans but lucratif avec un fonctionnement ouvert et une idéologie forte, comme par exemple la FSF. Mais comment financer les ressources humaines et matériels énormes … ?

En attendant que Google devienne le prochain Goliath à abattre, le vrai l’unique est toujours Microsoft. Et c’est là où le logiciel libre peut avec une collaboration étroite de Google, le faire tomber, ou au moins le ramener à des proportions acceptables.

En effet imaginez les services de Google accessible non plus uniquement via un navigateur web, mais par chacune des applications desktop. Les données gérées au quotidien par des applications natives,quoi que dise le buzz word AJAX, seront toujours plus agréable qu’une interface web. L’interface web permettant l’accès en cas de nécessité.

Cette idée n’est pas vraiment nouvelle, les fumeux Network computer y ressemble. Cependant à une autre époque un autre contexte. L’ADSL a depuis explosé, le grand public utilise quotidiennement Internet, le logiciel libre s’étend toujours plus et Google existe …

Google le prochain Microsoft ? La vaste blague, car tant que nous aurons le choix du moteur de recherche Google sera à la merci de son moindre faux pas. Et il faudrait être niais pour comparer la nuisibilité d’un leader sur les moteurs de recherche à la nuisibilité du monopole sur les systèmes d’exploitation.

En tout cas pour l’instant, l’ennemi de mon ennemi est mon ami :)


Comments

  1. Avatar pouype a dit about 10 hours later:

    Huhu…

    Google : le nouveau Microsoft des années 2000. :-/

  2. Avatar Zifro aka guillaumed a dit 3 days later:

    Il faut qu’ils se dépêchent alors, parce qu’on est bientôt en 2007 :p

    Sinon, oui, c’est intéressant, pour peu que l’on n’ait pas peur de Google.

    Yahoo vaincra (grâce à Randi) !

  3. Avatar fredix a dit 3 days later:

    Yahoo c’est un peu Web 1.0 non ? ;)

  4. Avatar Zifro aka guillaumed a dit 5 days later:

    Rooh, ce troll :)

    Et non, Yahoo! a également bien travaillé sur l’expérience utilisateur (AJAX, tout ça).