Python pour la data science : Exploration de données – PY2

Durée de la formation

3 jours – 21 heures

Effectifs

6 à 15 personnes

Objectifs de la formation

  • Comprendre les étapes de l’exploration de données :
    • Lecture/écriture des données dans différents formats
    • Mise en forme, transformation et manipulation des données
    • Analyse descriptive des données (univariée, multivariée, statistiques, etc.)
    • Présentation/visualisation des données
  • Connaître la principale bibliothèque de manipulation de données en Python (Pandas)
  • S’initier à l’utilisation d’un outil Big Data (PySpark)
  • Connaitre les principaux types de graphiques (histogrammes, etc.) et leur utilisation en analyse descriptive
  • Comprendre l’influence de la nature des variables (catégorielles, continues, etc.) sur les représentations utilisées.
  • Connaître des outils de générations de graphiques interactifs
  • S’initier à la représentation de données cartographiques

Atouts - Bénéfices de la formation

  • Formation articulée autour de jeux de données réalistes
  • Un parcours complet pour pouvoir mener des analyses et en présenter les résultats
  • Un support de cours exploitable et personnalisé

Parcours de formation possible

  • Machine Learning – Tronc commun 1 – MLTC1
  • Machine Learning – Tronc commun 2 – MLTC2

Moyens pédagogiques

  • Alternances entre exposés théoriques et mises en pratique
  • Etude de plusieurs jeux de données fils rouges
  • Utilisation des notebooks Jupyter pour rassembler explications et exercices pratiques dans un même document

Dispositif de suivi et d'évaluation de la formation

  • Feuille de présence
  • Mise en situation
  • Formulaire d’évaluation de la formation

Formateur

Alexis Mignon est docteur en informatique spécialisé en vision par ordinateur et apprentissage automatique. Il travaille depuis 7 ans chez Probayes en tant qu’ingénieur recherche et développement et chef de projet sur des sujet d’apprentissage automatique. Il utilise Python dans le cadre de son travail et de ses projets personnels depuis plus de 15 ans.

Programme détaillé

  • Lecture / écriture de données dans les formats de données courants (csv, excel, …)
  • Sélections et transformations de colonnes
  • Analyses univariées (descriptions statistiques et visualisations avec matplotlib, pandas, seaborn, plotly)
  • Groupements, agrégations, jointures, tableaux croisés
  • Analyses multivariées (mesures d’association des variables, visualisation, projections)
  • Cartographie (visualisation de données géographiques)
  • Visualisation interactive dans le notebook (utilisation de ipywidgets)
  • Création de Dashboards (Voilà)
  • Premiers pas avec PySpark

Publics

Toute personne ayant un profil technique et souhaitant s’initier à la manipulation et à l’exploration de données et ayant une expérience avec le langage Python et l’utilisation des Notebooks Jupyter.

Prérequis

  • Lecture de l’anglais technique
  • Utilisation de Python et des Notebooks Jupyter ou avoir suivi la formation « Python pour data science : Le langage Python – PY1 »
  • Notions de statiques (moyennes, écart-types, médiane, etc.)

Méthode d'évaluation

Feuille de présence / Formulaire d’évaluation de la formation
Feuille de présence / Formulaire d’évaluation de la formation
La formation se déroule sur 3 journées (7h chaque jour) de 9h30 à 12h30 et de 14h à 18h / Les formations sont accessibles à tous handicaps. Merci de nous contacter pour adapter la formation à vos besoins spécifiques.
Inter : 2990€* / Intra : dur devis *Prix HT par stagiaire. Repas non compris

Prix par stagiaire. Repas du midi non inclus.

Non renseigné

Téléchargez le détail de la formation en PDF

Cette formation vous intéresse ?

Cette formation n’est actuellement pas ouverte aux inscriptions

Les données vous concernant font l’objet d’un traitement informatique destiné à la gestion des candidatures soumises à Probayes. Ces données sont traitées de manière confidentielle. Seules les personnes habilitées de notre société pourront accéder à vos données à des fins strictement internes. Vos données sont conservées pour une durée maximale de 24 mois après la date de notre dernier contact. Conformément à la réglementation applicable en matière de protection des données personnelles, entrée en application le 25 mai 2018, vous disposez d’un droit d’accès, de rectification, d’opposition, de limitation du traitement, de portabilité et d’effacement. Ces droits peuvent être exercés aux adresses suivantes (veillez à préciser vos nom, prénom, adresse postale et à joindre une copie recto-verso de votre pièce d’identité à votre demande) :

– rgpd@probayes.com– Probayes – 53 Avenue Kuntzmann – 38330 Montbonnot

Dans le cadre de la politique de protection des données personnelles de La Poste, vous pouvez contacter Madame la Déléguée à la Protection des Données, CP C703, 9 rue du Colonel Pierre Avia 75015 PARIS. En cas de difficulté dans la gestion de vos données personnelles, vous pouvez introduire une réclamation auprès de la CNIL.

Contactez-nous

Logo Probayes

N° SIRET : 45053883000073
Code NAF : 6202A
TVA : FR72 450 538 830
Déclaration d’activité enregistrée sous le numéro 84 38 06761 38 auprès du préfet de la région Auvergne-Rhône-Alpes. Cet enregistrement ne vaut pas agrément de l’Etat.

Ces formations peuvent également vous intéresser

Machine Learning – Tronc commun 1 – MLTC1

Cette formation permet de comprendre les principales tâches d’apprentissage automatique et les algorithmes associés. Vous saurez utiliser la bibliothèque scikit-lean et mettre en place une chaîne de traitement complète.

Machine Learning – Tronc commun 2 – MLTC2

A venir

Pas de prochaines sessions à venir
Cette formation est la troisième d’une série de formations autour de la data science et du langage Python. Alors que la précédente formation présentait la manipulation de données en Python, cette formation présente les principaux outils et concepts utilisés en apprentissage automatique. Elle s’articule autour de deux projets d’apprentissage automatique ou toutes les étapes habituelles sont abordées : • Analyse exploratoire des données • Préparation des données • Modélisation (apprentissage automatique) • DéploiementLes supports de formation sont rédigés en anglais, toutefois les sessions sont données en français.
Pas de prochaines sessions à venir
Cette formation est la première d’une série de formations autour de la data science et du langage Python. Cette première formation a pour but de présenter les bases du langage Python.Les supports de formation sont rédigés en anglais, toutefois les sessions sont données en français.Cette formation n’est pas une initiation à la programmation (nous supposons que les participants connaissent déjà les concepts de base de la programmation), ni une formation au développement en Python (nous n’aborderons pas les notions de tests unitaires, tests fonctionnels, intégrations continue, etc.).