Projet : Intégration de la solution de Cloud Eucalyptus

Au cours de la deuxième période de stage de mon BTS, j’ai été amené au sein de la société CERBERIS à travailler sur un projet de type Cloud computing.

L’actualité de l’IT en parle énormément. Ce fameux « Cloud computing » ou ordinateur dans les nuages. Afin de suivre dans les meilleurs conditions ce projet, il m’a été demandé de me renseigner sur ce nouveau modèle de consommation de l’informatique qui est le Cloud. Pour en connaître la présentation et ses enjeux, j’ai rédigé un petit article pour vous éclairer sur cette fameuse tendance : ici !

Contrairement à mon 1er stage, j’ai été le seul maître à bord du projet. Le but étant de connaître la faisabilité de créer un espace de Cloud afin de proposer une nouvelle offre pour leur clients en leur permettant de sauvegarder leur sauvegardes dans le Cloud de l’entreprise. Ils souhaiteraient mettre en place un espace en Cloud qui puisse être accessible aussi bien en interne pour les besoins de l’entreprise mais aussi depuis n’importe ou sur internet pour leur client en proposant un volume de données. C’est à dire mettre en place un Cloud Hybride de type IaaS (ou plus précisément DaaS : Data as a Service).

En effet, ils sont spécialisé des solutions d’infrastructure et de gestion des identités et des accès et proposent notamment 2 logiciels de sauvegarde Crash Plan Pro et ARCserve D2D. La différence principale est que l’un fait de la sauvegarde de fichier plat (Crash Plan Pro) sur du multi OS et que l’autre permet une sauvegarde de fichier système uniquement sur les systèmes Windows. ARCserve D2D a dans ses options de configuration la possibilité de faire de la copie de fichiers dans une zone dit en cloud c’est à dire accessible à l’extérieur du réseau local.

Mon maître de stage m’a demandé de tester le logiciel ARCserve D2D avec l’option de copie de fichiers dans un espace de type Cloud avec la solution de Cloud EUCALYPTUS : cette solution qui permet de mettre en place une plateforme en Cloud a été développée par une technique de « reverse engineering » depuis le Cloud d’Amazon S3. (Traduit en français par « rétro-ingénierie ») Cela consiste à étudier le fonctionnement interne afin d’essayer d’en reproduire les mêmes fonctionnalités.

On m’a demandé d’installer et de configurer cette solution et d’en comprendre son fonctionnement afin de réaliser une documentation technique. Après avoir consulté la documentation totalement en anglais j’ai réalisé à l’aide de Microsoft Visio un schéma simplifié de ma compréhension des composoants de la plateforme Eucalyptus :

ou pour le schéma plus développée : ici 

 

La plateforme est composée de 3 parties, le « FRONTEND » (traduit par « façade « ), le « NODE » (traduit par « nœud ») et la partie stockage dans une dernière mesure mais qui n’a pas de composant propre. Je n’ai pas configuré la partie node où se situent les instances*(synonyme de machine virtuelle) de la plateforme car nous n’allons pas installer ce qui n’est pas nécessaire au bon fonctionnement de la partie stockage. Si le projet aurait été de proposer un service hébergé depuis le Cloud c’est à dire faire du SaaS (Software as a Service) ou encore du PaaS (Platform as a Service).

Il y a 5 composants, le Storage Controller, le Cluster Controller, le Cloud Controller, le Walrus Controller et le Node Controller ; c’est-à-dire 5 services qui font fonctionner cette plateforme.

Chaque composant joue un rôle précis, brièvement :

  • Le Cloud Controller : C’est un programme en Java qui permet d’avoir une interface web d’administration qui interagit  avec les différents services de la plateforme. C’est grâce à ce service que j’ai pu configurer facilement la plateforme.
  • Le Cluster Controller : Ce service sert à gérer la mise en place du réseau entre les instances des différents nœuds. C’est lui qui communique l’ensemble des informations au contrôleur du Cloud. Dans notre cas la partie Node n’est pas utilisée donc il n’a pas été nécessaire de configurer ce serivce.
  • Le Node Controller : Le rôle du nœud est d’héberger  l’hyperviseur pour les machines virtuelles (instances) qui sont déployées. Le contrôleur interroge le système  d’exploitation s’exécutant sur le nœud et propage ces données au contrôleur de cluster. Je n’ai pas eu besoin de le configurer.
  • Le Storage Controller : Ce contrôleur fournit un service de stockage persistant pour les instances qui permet d’avoir les données qui persistent indépendamment de la vie d’une instance. Ce service n’a pas été configuré, appartient à la partie « Node ».
  • Le Walrus : C’est le service qui permet de gérer une grande quantité d’informations. C’est par ce service que le logiciel ARCserve D2D atteint la plateforme pour ensuite transférer ces données.

Je me suis donc surtout attardé sur la configuration du Walrus et il n’est pas nécessaire d’installer les composants qui ne sont pas utile à la partie stockage.

Dans un deuxième temps, j’ai pris en main le logiciel de sauvegarde ARCserve D2D afin de le faire interagir avec la zone de Cloud EUCALYPTUS pour dans un dernier temps réaliser une série de tests de performances et de disponibilités.

Voici la topologie logique simplifié de la plateforme de Cloud Eucalyptus intégré au sein de la plateforme de test de l’entreprise. 

J’ai utilisé un ancien serveur physique où j’ai installé l’OS Linux CENTOS afin d’isntaller le FRONTEND de la palteforme. Puis afin de simuler le stockage dans le SAN de l’entreprise j’ai utilisé la virtualisation à l’aide de l’hypervisieur Microsoft Hyper-V où j’ai crée 2 VM (virtual machines) pour simulter 2 serveurs de fichier. Ensuite j’ai utilisé le système de fichier glusterfs afin de faire du RAID logiciel.   

La problématique est claire : Est-ce que les fonctionnalités du logiciel de sauvegarde et celles de la plateforme de Cloud répondent suffisamment aux besoins suivant :

  • Pouvoir copier et restaurer des fichiers à partir d’une zone de Cloud ?
  • Avoir une haute disponibilité de service et des données ?
  • Avoir une certaine performance en lecture et écriture ?

Concrètement, le gros problème de cette solution qui a été découvert est que dans la version actuelle 2.0.3, il n’y a pas de redondances de services. C’est à dire que si le service Walrus tombe en panne, l’accès à la plateforme est impossible. Mais après avoir contacté le support officiel de la solution la prochaine version allait prendre en compte la problématique de la haute disponibilité de la plateforme. Par ailleurs, concernant la haute disponibilité des données, le Walrus peut communiquer et transférer ses données à tout type de stockage sans problème en appliquant les droits nécessaires pour le transfert des données.

Je vous laisse à disposition ma note de synthèse d’une vingtaine de pages afin de vous donner une meilleur idée du projet qui m’a été confié et sa réalisation. Je vous partage aussi la documentation technique qui détail et bien plus encore.

Télécharger la note de synthèse :

Télécharger la doc

Télécharger la documentation technique :

Télécharger la doc - Nicolas Broisin administrateur réseau et système

 

Si vous avez des questions n’hésitez pas à laisser un commentaire

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *