Chefs de projet, administrateurs et toute personne souhaitant stocker des données avec Hbase.
A l’issue de la formation, le stagiaire sera capable d’installer et de mettre en oeuvre une configuration distribuée de données sous la solution HBase. Comprendre le fonctionnement de HBase, savoir mettre en place une configuration distribuée.
|
| Appréhender l’écosystème Hadoop |
Durée : 1h30 Méthodes pédagogiques : exposé/échanges Matériels et moyens : video-projecteur en présentiel, tableau partagé en classe virtuelle | Rappels rapides sur l'écosystème Hadoop. Fonctionnalités. Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce Présentation HBase. Historique. Lien avec HDFS.
|
|
| Comprendre l’architecture et le fonctionnement de HBase |
Durée : 3h Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux | Définitions : table, région, ligne, famille de colonnes,cellules, espace de nommage, ... Fonctionnalités : failover automatique, sharding, requêtage HBase master node, Region Master, liens avec les clients HBase. Haute disponibilité. Consistance des données. Présentation du rôle de Zookeeper.Atelier : définition d'une architecture HBase en fonction de contraintes d'utilisation
|
|
| Identifier les apports d’HBase en termes de stockage distribué des données |
Durée : 3h Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux | Format des données dans HBase. Comparaison avec d'autres bases clés/valeurs. Présentation des différentes interfaces disponibles. Outils HBase : hbase pe et hbase ltt pour les performances, hbase shell pour l'exploitationAtelier : gestion de base avec hbase shell.
|
|
| Mener à bien l’installation |
Durée : 3h30 Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux | Choix des paquets. Vérification des pré-requis. Installation et configuration en mode distribué. Mise en oeuvre avec HDFS dans un environnement distribué. Test de connexion avec hbase shell.Atelier : installation d'une grappe de serveurs HBase en mode distribué
Atelier : interrogations depuis le serveur http intégré.
|
|
| Savoir mettre en place une configuration distribuée |
Durée : 3h30 Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux | Fonctionnement en mode distribué Fonctionnement indépendant des démons (HMaster, HRegionServer, Zookeeper). Gestion de la consistance. Mise en évidence.Atelier : utilisationn des outils d'exploitation : hbck, hfile, ...
Atelier : mise en oeuvre des splits sur un exemple de tables réparties. regionsplitter.
|