Apache : Concevoir des bases de données Cassandra

Formation #1260 - 3 jours

Le volume et la diversité des données traitées par les entreprises modernes obligent ces dernières à s'équiper de bases de données hautement disponibles à faible taux de latence. C'est ce que propose Cassandra en mettant à la disposition des entreprises un système de distribution et de réplication des données permettant d'accélérer le débit des lectures et des écritures. Au cours de cette formation sur le système Cassandra d'Apache, vous apprendrez à modéliser les données afin de profiter de tous les avantages offerts par l'architecture P2P linéaire et évolutive de Cassandra.

  • Structurer et concevoir des bases de données Cassandra pour garder une longueur d'avance sur vos concurrents
  • Appliquer des modèles de requêtes pour modéliser les données de vos bases Cassandra
  • Accéder aux bases de données Cassandra avec CQL et Java
  • Trouver le juste équilibre entre le débit de lecture / écriture et la cohérence des données
  • Intégrer Cassandra à Hadoop, Pig et Hive
  • Mettre en oeuvre les design patterns Cassandra les plus courants

  • Rechercher des données avec CQL, le langage d'interrogation de Cassandra
  • Modéliser et concevoir des tables Cassandra
  • Créer des partitions et des clusters avec des clés primaires composites
  • Choisir le niveau de cohérence des lectures et des écritures
  • Stocker des séries chronologiques dans des wide rows
  • Traiter des données Cassandra avec Hadoop, Pig et Hive

Cette formation s'adresse aux responsables des bases de données, techniciens, scientifiques des données, ainsi qu'aux analystes et commerciaux cherchant à intégrer Cassandra dans leur environnement actuel.

Des connaissances des principes fondamentaux des bases de données et de SQL, ainsi que du langage de programmation Java, sont fortement conseillées.

NoSQL : Vue d'ensemble

  • Pourquoi utiliser des entrepôts de données non relationnels
  • Les différentes catégories d'entrepôts de données NoSQL

Structure des bases Cassandra

  • Définir des entrepôts de données avec des familles de colonnes
  • Interroger Cassandra
  • Examiner les principaux composants de l'architecture de Cassandra

Interrogation des bases Cassandra

  • Définir le langage CQL (Cassandra Query Language)
  • Énumérer les différents types de données CQL
  • Manipuler les données depuis l'interface cqlsh

Structures et types de données Cassandra

  • Faire un parallèle avec le modèle relationnel
  • Organiser les données avec les keyspaces, les tables et les colonnes
  • Créer des collections et des compteurs

Modélisation des données avec les requêtes

  • Créer des tables axées sur les modèles (patterns) d'accès
  • Créer des clusters avec des clés primaires composites
  • Améliorer la distribution des données avec les clés de partition composites

Optimisation de la cohérence

  • Identifier les différents niveaux de cohérence
  • Choisir les niveaux de cohérence en lecture / écriture des données
  • Différencier les fonctionnalités d'ajustement des niveaux de cohérence

Équilibre entre cohérence et performances

  • Comprendre le lien entre cohérence et facteurs de réplication
  • Sacrifier la cohérence au profit de la disponibilité
  • Développer la cohérence linéaire avec Compare-And-Set

Les types de collections Cassandra

  • Regrouper les éléments dans des ensembles
  • Classer les éléments dans des listes
  • Cartographier les relations
  • Imbriquer les collections

Stockage des données pour faciliter leur récupération

  • Mapper les données avec des tuples et des types définis par l'utilisateur
  • Comprendre le frozen keyword
  • Appliquer le pattern Valueless Columns
  • Mise en œuvre stratégique des colonnes de cluster

Contrôle de la durée de vie des données

  • Expiration des données temporelles avec time-to-live
  • Utiliser des tombstones pour les suppressions distribuées
  • Exécuter ultérieurement des instructions DELETE et UPDATE

Création de vues matérialisées et de séries chronologiques

  • Modéliser les séries chronologiques
  • Améliorer les requêtes avec les vues matérialisées
  • Maintenance des vues matérialisées dans l'application
  • Analyser les données à partir des vues matérialisées

Gestion des triggers

  • Créer des triggers avec ITrigger
  • Associer des triggers à des tables
  • Gérer les vues matérialisées avec des triggers

Interrogation des données Cassandra avec le pilote Java Datastax

  • Se connecter à un cluster Cassandra
  • Exécuter des instructions CQL via le pilote Java
  • Traiter les instructions préparées par lots
  • Paginer les requêtes volumineuses

Persistance des objets Java avec Kundera

  • Définir la JPA (Java Persistence Architecture)
  • Configurer Kundera pour Cassandra
  • Générer des schémas automatiquement
  • Gérer les transactions JPA dans Kundera

Connecteurs Cassandra intégrés

  • Charger les données dans Hadoop MapReduce avec la fonction Cassandra InputFormat
  • Utiliser l'outil de chargement Cassandra pour créer des relations avec Pig
  • Convertir une table Cassandra en table Hive avec la sérialisation / désérialisation Cassandra

Sessions planifiées inter-entreprises

Inscrivez-vous à une de nos sessions en sélectionnant un mode de suivi :

8 novembre 2017 - 1770 € - À Paris ou À distance

Aucune session ne vous convient ? Faites-nous part de vos disponibilités dans votre demande de devis.

Demander un devis

Intra-entreprise

Organisez cette formation Learning Tree sur votre lieu de travail avec notre solution intra-entreprise.

Demander un devis

Financez votre formation

  • Programmes Visa Société et Passeport
  • Réduction Return to Learn

Pour en savoir plus, cliquez ici.

Votre formation à distance et en direct

Sans frais supplémentaires, depuis tout lieu possédant une connexion Internet, connectez-vous en temps réel et en direct à une session dispensée par nos formateurs grâce à AnyWare™, la plateforme de formation en distanciel de Learning Tree.

Notre catalogue

Vous souhaitez parcourir toute notre offre de formation ultérieurement ?

Téléchargez notre catalogue

Suivez une formation Learning Tree et profitez des avantages de SUPINFO International University !

Pour toute formation que vous aurez suivi chez Learning Tree, SUPINFO International University vous offre pendant un an le statut Advanced Member d'une valeur de 250€.
Ce statut privilégié vous permettra de profiter de ressources pédagogiques sélectionnées par SUPINFO :

* Services disponibles prochainement.