Cette formation vous permettra d’effectuer une analyse de données de base, du chargement des données dans Python à une visualisation finale. Pour ce faire, vous découvrirez notamment les bibliothèques Pandas et une bibliothèque de visualisation telle que Matplotlib ou Plotnine.
L’analyse des données se limite à la sélection de certaines entrées, à la transformation temporaire des données, au calcul de statistiques simples et à l’automatisation de tout ce processus d’analyse.
Plan de cours:
Jour 1 (24 novembre, 9h-12h)
- Pandas et les DataFrames (jeux de données) en Python;
- Indexation, découpage et sélection de jeux de données;
- Type et format des données;
- Combiner des jeux de données.
Jour 2 (25 novembre, 9h-12h)
- Automatisation d’analyses;
- Visualiser vos données avec Matplotlib ou Plotnine;
- Accéder à des bases de données SQLite avec Python et Pandas.
Prérequis techniques:
- Une connaissance de base en programmation, préférablement en Python ou un langage similaire est fortement suggérée. Référez-vous à la formation PYT101 Introduction à la programmation en Python.
- Nous utiliserons Zoom comme plateforme. Comme il s’agit d’un atelier pratique, il est utile d’avoir deux écrans afin de pouvoir afficher l’écran de l’instructeur d’un côté et votre propre écran de l’autre.
- Nous utiliserons aussi l’interface Jupyter Notebook. Assurez-vous d’avoir un navigateur Web moderne tel que Google Chrome, Firefox, Edge ou Safari.