• Enrichir sa boîte à outils pour la Data Science.
• Manipuler les librairies Python permettant de faire de l’exploration de données et du calcul scientifique.
• Produire du code Python robuste et de qualité.
• Développeurs
• Data Scientists
• Présentation du langage, premier script en Python.
• Présentation des environnements de développement (Anaconda).
• Jupyter notebook : un environnement efficace pour la présentation et la reproductibilité de résultats scientifiques.
Les bases de la programmation avec Python
• Les structures de données de Python (listes, tuples, dictionnaires).
• Parcours et génération de listes (itertools, itérateurs, générateurs et les comprehension lists).
• Les bonnes pratiques (utilisation des exceptions, vérification du typage, etc.).
Organisation et amélioration du code
• Commentaires et propreté (docstring, linters, pep8…).
• Modularité et réutilisabilité du code (import de fichiers, POO et polymorphisme).
• Algorithmes et complexité.
Distribution, isolation et gestion de paquets
Introduction à la programmation scientifique
• Vocabulaire de la programmation scientifique et analyse statistique.
• Principaux algorithmes de machine learning (analyse supervisée, analyse non supervisée, classification et régression).
• La stack scientifique : Numpy, Scipy, Scikit-learn, pandas, Sympy, matplotlib.
Statistiques descriptives et structures de données
• Gestion de données avec pandas : import, dataframes, slicing, mapping (lecture, formats, gestion de dates).
• Visualisation avec matplotlib.
Modélisation statistique avec Scikit-learn
• Présentation, modélisation linéaire et prévision, classification avec Scikit-learn.
Calcul scientifique avec Numpy
• Présentation, structure de données, indexing, slicing, iterating.
Calcul scientifique avec Scipy
• Présentation, algèbre linéaire, application.
3 jours
81 rue Saint Lazare – 75009 Paris – France
Intéressé par cette formation ? Inscrivez-vous !