> Formations > Technologies numériques > Développement logiciel > Python, C, C++ > Formation Python pour la data science > Formations > Technologies numériques > Formation Python pour la data science
Nouvelle formation

Python pour la data science

La science des données avec l'écosystème Python - certification TOSA® à distance en option

Python pour la data science

La science des données avec l'écosystème Python - certification TOSA® à distance en option
Télécharger au format pdf Partager cette formation par e-mail 2


La science des données est un domaine multidisciplinaire en constante expansion. Elle s’appuie sur des méthodes scientifiques, des algorithmes et des processus que Python a su maîtriser grâce à un écosystème particulièrement riche. Il est devenu aujourd’hui le langage de référence pour l’analyse de données, quels qu’en soient les formats. Notre formation vous permet la prise en main des outils, bibliothèques et modules Python pour obtenir de rapides compétences en data science avec ce langage.


Inter
Intra
Sur mesure

Cours pratique en présentiel ou en classe à distance

Réf. IYT
Prix : 2290 € H.T.
  4j - 28h
Pauses-café et
déjeuners offerts
En option :
Dynamique.Model.Bean_FormationOption
Certification : 80 € HT




La science des données est un domaine multidisciplinaire en constante expansion. Elle s’appuie sur des méthodes scientifiques, des algorithmes et des processus que Python a su maîtriser grâce à un écosystème particulièrement riche. Il est devenu aujourd’hui le langage de référence pour l’analyse de données, quels qu’en soient les formats. Notre formation vous permet la prise en main des outils, bibliothèques et modules Python pour obtenir de rapides compétences en data science avec ce langage.

Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
  • Posséder une vue d’ensemble de l’écosystème scientifique de Python
  • Connaître les librairies scientifiques incontournables pour la science des données
  • Être capable de manipuler des données volumineuses avec Python
  • Comprendre l’intérêt de la datavisualisation
  • Savoir visualiser des données avec Python

Public concerné
Ingénieur, développeur, chercheur, data scientist, data-analyst et toute personne désireuse de se former à l'univers scientifique de Python.

Prérequis
Pratique du langage Python.
Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en faisant  ce test.

Programme de la formation

Présentation de l'écosystème Python scientifique

  • Panorama de l’écosystème scientifique de Python : les librairies incontournables.
  • Savoir ou trouver de nouvelles librairies et juger de leur pérennité.
  • Les principaux outils et logiciels open source pour la data science.
  • Pourquoi utiliser une distribution scientifique, Anaconda.
  • Comprendre l’intérêt d’un environnement virtuel et savoir l’utiliser.
  • L’interpréteur IPython et le serveur Jupyter.
  • Les bonnes pratiques pour bien démarrer votre projet de data science avec Python.
  • Les formats de fichiers scientifiques et les librairies pour les manipuler.
Travaux pratiques
Mise en place de l’environnement de développement : installation d’Anaconda, création d’un environnement virtuel, export et duplication d’un environnement, utiliser les notebooks Jupyter.

La SciPy Stack

  • Le socle de librairies scientifiques incontournables sur lequel sont basées toutes les autres : la SciPy Stack.
  • Numpy : calcul numérique et algèbre linéaire (les vecteurs, matrices, images).
  • SciPy, basée sur Numpy pour : les statistiques, les analyses fonctionnelles, géo spatiales, le traitement du signal...
  • Pandas : l’analyse de données tabulaires (csv, excel...), statistiques, pivots, filtres, recherche…
  • Matplotlib : la librairie de visualisation de données incontournable.
Travaux pratiques
Mesurer les performances du numpy installé par votre Linux et celui d’Anaconda. Traitement d’images avec Numpy. Premiers tracés. Analyses statistiques de fichiers CSV. Premiers éléments de cartographie. Transformées de Fourier.

Les librairies de visualisation

  • Panorama des librairies de visualisation de Python : 2D/3D, desktop/web, statistiques, cartographie, big data...
  • Les librairies orientées desktop : Matplotlib, Pandas, Seaborn.
  • Les librairies orientées web : Bokeh, altair, Plotly...
  • Les librairies pour la 3D : Plotly, pythreejs, ipyvolume...
  • Les librairies cartographiques : Cartopy, folium, ipyleaflet, Bokeh, cesiumpy…
  • Les librairies big data : datashader, Vaex...
Travaux pratiques
Réalisation de multiples exercices avec chacune des librairies présentées. Visualisation big data, cartographique, 2D et 3D. Création de tableaux de bord.

La datavisualisation

  • L'intérêt de la datavisualisation
  • Utiliser les écosystèmes PyViz et HoloViz.
  • Utiliser les outils SuperSet, Mayavi, Paraview et VisIt.
Travaux pratiques
Poursuivre l'utilisation des librairies de visualisation et manipulations des outils.

Les formats de fichiers scientifiques et la manipulation de données volumineuses

  • Panorama des principaux formats de fichiers scientifiques : NetCDF, HDF5, GRIB, JSON, PARQUET, MATLAB, CGNS...
  • Manipuler des données volumineuses avec Dask, Vaex et Xarray.
Travaux pratiques
Manipulation de données dépassant les Go, lecture et écriture de fichiers NetCDF/HDF5. Visualisation de données climatiques, images satellites, création de vidéos/animations graphiques.


Certification en option
Cette formation aborde des compétences évaluées par le référentiel de certification professionnelle TOSA® Python atteste pour une durée de 3 ans des compétences de l’apprenant sur une échelle de 1 000 points. La souscription à l’option de certification s’effectue au moment de l’inscription et engage l’apprenant à passer son examen en ligne dans les 4 semaines qui suivent le début de sa session. L’examen dure 1 H 30 et se présente sous la forme d’un QCM de 35 questions dont la difficulté s’adapte selon les réponses de l’apprenant. Sans demande spécifique, il est dispensé par défaut en français. La surveillance est faite par un logiciel et est enregistrée à des fins de contrôle de conformité. Une fois l’examen réalisé, l’apprenant peut consulter en direct ses résultats et reçoit par e-mail une attestation, une restitution détaillée de ses compétences ainsi que son diplôme.

Modalités pratiques
Travaux pratiques
De nombreux exercices sont réalisés pour illustrer les sujets.
Méthodes pédagogiques;
Pédagogie active, retours d'expérience, des démonstrations sont mises en œuvre par le formateur pour une mise en pratique plus rapide par les participants.

Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Parcours certifiants associés
Pour aller plus loin et renforcer votre employabilité, découvrez les parcours certifiants qui contiennent cette formation :

Options
Certification : 80 € HT
Certifiez-vous pour faire reconnaître vos compétences sur le marché et booster votre carrière.

Solutions de financement
Pour trouver la meilleure solution de financement adaptée à votre situation : contactez votre conseiller formation.
Il vous aidera à choisir parmi les solutions suivantes :
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • Pôle Emploi sous réserve de l’acceptation de votre dossier par votre conseiller Pôle Emploi.
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • Pôle Emploi sous réserve de l’acceptation de votre dossier par votre conseiller Pôle Emploi.

Avis clients
4,2 / 5
Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.
SÉBASTIEN D.
29/11/22
5 / 5

Formation technique de qualité, qui a couvert les éléments promis. Les sujets ont été abordés en profondeur et en adéquation avec les demandes et les compétences de chacun, avec une attention particulière donnée aux attentes spécifiques des étudiants. Les exercices étaient variés, pertinents et agréables à réaliser. Audrey a été très à l’é
SADAKALY SHAHINA I.
29/11/22
3 / 5

Professeur top qui connait son métier , rien à dire, il va falloir pratiquer !
CHARLINE C.
29/11/22
3 / 5

Le contenu de la formation est très intéressant et présente beaucoup de librairies. Cela nous permet d’avoir une vue d’ensemble mais nous n’avons pas le temps de pratiquer tout et de maîtriser. A mon goût, il serait plus pertinent de passer plus de temps sur les librairies incontournables comme Numpy, Pandas, Matplotlib. Peut être scinder en deux le programme de cette formation ?




Horaires
En présentiel, les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
En classe à distance, la formation démarre à partir de 9h.
Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 15h30 le dernier jour.

Dates et lieux
Sélectionnez votre lieu ou optez pour la classe à distance puis choisissez votre date.
Classe à distance