Analyse du Big Data : Introduction à la Data Science (R et Hadoop)

Formation #1253 - 5 jours

À propos de cette formation :

L'analys du Big Data permet aux entreprises de prendre de meilleures décisions. Au cours de cette formation Big Data, vous obtenez les compétences pour élaborer des stratégies concurrentielles axées sur l'analyse des données. Vous apprenez à utiliser une approche globale articulée autour du cycle de vie des données en appliquant des méthodes de modélisation des données sophistiquées à vos projets d'analyse du Big Data.

Vous apprendrez à :

  • Appliquer des techniques d'exploration des données pour améliorer la prise de décisions métier à partir de sources de données internes et externes
  • Prendre une longueur d'avance sur vos concurrents avec l'analyse des données structurées et non structurées
  • Prédire un résultat en utilisant des techniques d'apprentissage automatique supervisé

Travaux Pratiques :

  • Analyser différents ensembles de données avec un environnement de programmation R et RHadoop
  • Traitement préliminaire et préparation des données pour une analyse plus approfondie
  • Analyse par clustering, classification et régression des ensembles de données
  • Définir des règles d'association à partir de données transactionnelles

À qui s'adresse cette formation ?

Aux techniciens, professionnels des bases de données, managers, analystes de données, data scientists et assistants à maîtrise d'ouvrage. Cette formation est très utile pour les professionnels chargés de gérer les prévisions et les tendances.

Prérequis :

Des connaissances en matière de programmation et de statistiques sont utiles sans toutefois être obligatoires.

Contenu de cette formation :

Exploration et analyse des données avec R

  • Charger, interroger et manipuler des données avec R
  • Nettoyer les données brutes avant la modélisation
  • Réduire les dimensions avec l'analyse en composantes principales (ACP)
  • Développer les fonctionnalités de R avec les packages définis par l'utilisateur

Faciliter la pensée analytique avec la visualisation des données

  • Explorer les caractéristiques d'un ensemble de données à travers la visualisation
  • Représenter graphiquement la distribution des données avec des boîtes à moustaches, des histogrammes et des diagrammes de densité
  • Identifier les valeurs hors normes

Explorer les données non structurées pour les applications métier

  • Traitement préliminaire et préparation des données non structurées pour une analyse plus approfondie
  • Décrire un ensemble de documents avec une matrice termes-documents

Difficultés supplémentaires liées au Big Data

  • Examiner les architectures de MapReduce et Hadoop
  • Intégrer R et Hadoop à RHadoop

Estimer les valeurs avec les règles de régression linéaire et logistique

  • Modéliser la relation entre une variable de sortie et plusieurs variables d'entrée
  • Interpréter correctement les coefficients des données continues et qualitatives

Techniques de régression pour manipuler le Big Data

  • Traiter les ensembles de données volumineux avec RHadoop
  • Créer des modules de régression pour RHadoop

Identification automatique de chaque nouvel élément de données

  • Utiliser des arbres de décision pour prédire les valeurs cible
  • Appliquer des règles de probabilité pour prédire les résultats avec le modèle Naive Bayes
  • Combiner les variables de prédiction des arbres et les forêts aléatoires dans RHadoop

Évaluer les performances des modèles

  • Visualiser les performances des modèles avec une courbe ROC
  • Évaluer les modèles de classification avec des matrices de confusion

Identifier des groupes encore inconnus dans un ensemble de données

  • Segmenter le marché client avec l'algorithme K-Means
  • Trouver des similarités avec les mesures des distances
  • Créer des clusters en forme d'arbres et des mises en cluster hiérarchiques
  • Mettre en cluster les tweets et les fichiers texte pour mieux les comprendre

Mettre à jour les connexions avec l'analyse des associations

  • Identifier les connexions importantes avec l'analyse des réseaux sociaux
  • Comprendre l'utilisation des résultats de l'analyse des réseaux sociaux à des fins marketing

Définir et évaluer des règles d'association

  • Identifier les préférences réelles des clients à partir d'un ensemble de données transactionnelles pour améliorer l'expérience utilisateur
  • Calculer les indices de support et de confiance et le lift pour différencier les bonnes règles des mauvaises

Crédits ECTS : 10

Formation éligible aux parcours diplômants de SUPINFO International University.

Sessions planifiées

Appelez le 01 49 68 53 00 ou inscrivez-vous en ligne en sélectionnant une date ci-dessous :

13 mars 2017 - 2640 €
Paris - AnyWare
15 mai 2017 - 2640 €
Paris - AnyWare
28 août 2017 - 2640 €
Paris - AnyWare
20 novembre 2017 - 2640 €
Paris - AnyWare

Inscription sans risque : pas de paiement à l'avance, réglement jusqu'à 30 jours après la formation, satisfaction garantie ou vous ne payez pas la formation.

Financez votre formation

Le financement de votre formation ne doit pas être un obstacle. Nos conseillers vous aiderons dans vos démarches avec les OPCA par exemple.
Profitez également de la réduction Return to Learn qui récompense les participants ayant déjà suivi une formation Learning Tree.<
Pour en savoir plus, cliquez ici.

Votre formation à distance et en direct !

Sans frais supplémentaires, depuis tout lieu possédant une connexion Internet, connectez-vous en temps réel et en direct à une session dispensée par nos formateurs grâce à AnyWare™, la plateforme de formation en distanciel de Learning Tree.

Intra-entreprise

Organisez cette formation Learning Tree sur votre lieu de travail avec notre solution intra-entreprise.

Demander un devis

Suivez une formation Learning Tree et profitez des avantages de SUPINFO International University !

Pour toute formation que vous aurez suivi chez Learning Tree, SUPINFO International University vous offre pendant un an le statut Advanced Member d'une valeur de 250€.
Ce statut privilégié vous permettra de profiter de ressources pédagogiques sélectionnées par SUPINFO :

* Services disponibles prochainement.