La sauvegarde est un domaine vaste et complexe qui essaye de répondre à une problématique pourtant simple, sauvegarder ses données. La difficulté qui ne saute pas forcément aux yeux de l’utilisateur lambda étant de résoudre 2 problématiques, garantir la restauration des données et garantir la confidentialité.
La restauration
La restauration dépend bien sûr du support utilisé. On est passé ces dernières années des supports physique sur bande, disque à plateaux et flash à des supports dématérialisés et hébergés sur Internet. Le principal intérêt est bien sûr de se mettre à l’abri d’une destruction ou une disparition du support physique sur des lieux non adaptés à protéger des données d’une grande valeur. L’autre avantage est d’automatiser la sauvegarde et ainsi sauvegarder plus finement l’avancée de ses travaux.
Cependant cette sauvegarde externalisée dépend elle aussi du support physique utilisé. On a supprimé les risques d’une destruction occasionnée par des locaux non adaptés (chute, vol, incendie, inondation, etc) ce qui n’est pas rien, mais quid d’un crash disque sur le serveur distant ?
Il existe d’excellentes solutions externalisées, de type Dropbox. Celle-ci utilise le cloud S3 fourni par Amazon pour stocker les données de leur utilisateur. Ce type de service est censé éviter les problématiques de gestion du stockage et de crash de disque occasionnant une perte de données. Or un récent plantage de plusieurs heures dans un datacenter d’Amazon a rendu indisponible de nombreux site web et certains auraient perdu des données, même si Dropbox n’est semble t-il pas concerné.
La confidentialité
Toujours Dropbox, ils ont récemment modifié leur CGU afin de rappeler qu’ils devaient se conformer à la législation américaine et éventuellement fournir des données de leur client sur demande de la justice. Ce type de contrainte n’est bien entendu pas spécifique à Dropbox mais à toute entreprise qui doit par définition respecter la loi de leur pays. A ce titre des entreprises qui stockent sur leur cloud des données de leur client, tel que Google, Apple, Yahoo ou Microsoft ont elles aussi cette obligation, il est bon de le rappeler.
Cela ne gênera sans doute pas ceux qui, par exemple, acceptent les caméras de surveillance partout, "du moment qu’ils n’ont rien à se reprocher", mais pour les autres il y aura sans doute une gène voir une phobie à sauvegarder ses données dans ces conditions.
Le P2P
Ces récents échec du Cloud, viennent rappeler que celui-ci ne peut être une solution pérenne ni respectueuse de la confidentialité. Ces échecs viennent rappeler que la seule architecture fiable pour les données ne peut être basée que sur la même architecture qu’Internet, le P2P. Internet est une maille composée de noeuds, car il a été intégré dès sa conception l’évidence que rien ne peut garantir définitivement l’intégrité total d’un lieu géographique ou d’un matériel. Ainsi une information atteindra sa destination selon un chemin non pas figé mais selon l’état du réseau au moment de son acheminement.
Il serait intéressant de traiter le stockage et l’accès à ses données de la même manière. A vrai dire cela existe déjà puisque le P2P répond exactement à cette problématique. Or même si celui-ci est entaché d’un usage bien souvent à des fins de contrefaçons, il n’est qu’un outil neutre.
aerofs
Pour revenir au sujet, la sauvegarde a tout intérêt à exploiter les capacités du P2P. Ainsi les données ne sont pas centralisée et elles peuvent être répliquées en de multiple endroits. La startup Air Computing Inc qui a créé le logiciel aerofs a exactement compris cela puisqu’elle fourni ce logiciel. A défaut d’avoir un équivalent libre aussi souple, j’y retrouve les avantages de Dropbox (client natif et multiplateforme), sans la centralisation qui est là optionnelle et payante au delà d’1 Go.
J’ai une instance aerofs sur quelques machines, dont un serveur dédié sur lequel est synchronisé l’ensemble des données stockées dans le logiciel. Pour résoudre la problématique de la confidentialité j’utilise l’excellent encfs qui me permet de chiffrer en userland le contenu d’un répertoire. Un simple lien Aerofs vers ce répertoire chiffré, permet de chiffrer à la volée les données reçues : (merci à Flink pour la correction) Il suffit donc de stocker le répertoire chiffré de encfs dans Aerofs pour sauvegarder de manière répartie et sécurisée ses données.
Voici une capture de l’interface en train de synchroniser des données vers mon serveur.
Il est bien sur possible de sélectionner les répertoires à synchroniser par client, afin de ne pas stocker sur son ordinateur du boulot des données personnelles. Enfin il est possible de partager un répertoire avec d’autres utilisateurs sélectionnés.
Il existe un vote d’une demande de fonctionnalité afin de rendre l’ensemble libre : http://vote.aerofs.com/forums/67721-feature-requests/suggestions/1728653-open-source-aerofs-and-only-take-payment-for-clou?ref=title
Je pense que si aerofs n’est pas libéré, il existera un jour ou l’autre un équivalent libre, voir même un file system en P2P chiffré. Chacun stockant des morceaux de données répliquées, anonymes et chiffrées.
Pour finir je suis de plus en plus convaincu que l’avenir des applications et des données, du moins dans le Libre, utiliseront de plus en plus le P2P, comme le font Bitcoin et namecoin, c’est tout notre intérêt et c’est le seul moyen pour lutter contre le Minitel 2.0, et contre l’hégémonie de Google qui compte bien s’étendre à toute sorte de devices : http://fr.techcrunch.com/2011/05/18/google-android-internet-des-objets/

Huhu…
Google : le nouveau Microsoft des années 2000. :-/
Il faut qu’ils se dépêchent alors, parce qu’on est bientôt en 2007 :p
Sinon, oui, c’est intéressant, pour peu que l’on n’ait pas peur de Google.
Yahoo vaincra (grâce à Randi) !
Yahoo c’est un peu Web 1.0 non ?
Rooh, ce troll
Et non, Yahoo! a également bien travaillé sur l’expérience utilisateur (AJAX, tout ça).