Automatiser les processus métiers avec Python et l'IA
Objectifs :
- Automatiser le traitement de fichiers Excel, CSV et PDF avec Python
- Concevoir des pipelines d'automatisation robustes (collecte, traitement, export, alertes)
- Créer des agents IA capables d'interagir avec des fichiers et des API métier grâce à LangChain
- Orchestrer des workflows d'automatisation complexes avec LangGraph
- Développer un agent IA pilotant un processus métier de bout en bout
Objectifs :
- Automatiser le traitement de fichiers Excel, CSV et PDF avec Python
- Concevoir des pipelines d'automatisation robustes (collecte, traitement, export, alertes)
- Créer des agents IA capables d'interagir avec des fichiers et des API métier grâce à LangChain
- Orchestrer des workflows d'automatisation complexes avec LangGraph
- Développer un agent IA pilotant un processus métier de bout en bout
Public visé
- Responsables métiers souhaitant automatiser leurs processus et traitements de données
- Chefs de projet et data analysts manipulant régulièrement des fichiers Excel, CSV et PDF
- Développeurs souhaitant intégrer l'IA dans leurs pipelines d'automatisation
- Administrateurs système cherchant à automatiser des tâches répétitives
Objectifs pédagogiques
- Écrire des scripts Python pour automatiser le traitement de fichiers Excel (openpyxl, pandas)
- Extraire, transformer et générer des documents PDF avec Python
- Manipuler et nettoyer des données issues de sources multiples (CSV, JSON, Excel, PDF)
- Planifier et orchestrer l'exécution automatique de scripts
- Comprendre les fondamentaux des agents IA et du framework LangChain
- Créer des outils personnalisés permettant à un agent IA d'interagir avec des fichiers et des API
- Concevoir des workflows d'automatisation complexes avec LangGraph
- Développer un agent IA capable d'automatiser un processus métier de bout en bout
Prérequis
- Notions de base en programmation Python : variables, conditions, boucles, fonctions
- Aisance minimale avec l'outil informatique (naviguer dans des dossiers, utiliser un terminal)
- Une connaissance de base des fichiers Excel et PDF est un plus
- Disposer d'un ordinateur avec Python 3.x et accès internet
Méthodes pédagogiques
- Alternance de théorie (30%) et de pratique (70%)
- Exposés interactifs, démonstrations live sur des cas métiers réels
- TP individuels et collaboratifs avec pandas, openpyxl, LangChain, LangGraph
- Pédagogie active : résolution de problèmes, débogage collaboratif, revue d'architecture en groupe
- Supports de cours numériques et fichiers d'exercices (accès pérenne)
Programme détaillé
JOUR 1 — Automatisation du traitement de fichiers Excel et CSV
- Rappels Python : types de données, structures de contrôle, fonctions, gestion des fichiers
- Introduction à pandas : Series, DataFrame, lecture de fichiers CSV et Excel
- Nettoyage de données : valeurs manquantes, doublons, types incorrects
- Filtrage, tri, regroupement : loc, iloc, groupby(), sort_values()
- Jointures entre DataFrames : merge(), concat()
- Module openpyxl : lecture et écriture de fichiers .xlsx
- Manipulation de cellules, feuilles, formules et mise en forme conditionnelle
- Génération automatique de rapports Excel avec graphiques
- Traitement par lots : automatiser le traitement de dizaines de fichiers Excel
- Gestion des erreurs et logging pour les scripts d'automatisation
■ Travaux pratiques :
→ TP1 : Nettoyage et consolidation de données commerciales multi-fichiers avec pandas
→ TP2 : Génération automatique d'un rapport Excel de synthèse avec graphiques (openpyxl)
→ TP3 : Script de traitement par lots de fichiers Excel d'un répertoire
JOUR 2 — Automatisation du traitement de PDF et orchestration de scripts
- Extraction de texte depuis des PDF : pdfplumber, pypdf
- Extraction de tableaux depuis des PDF vers DataFrames pandas
- OCR sur PDF scannés : pytesseract, pdf2image
- Génération de PDF : reportlab (rapports, factures, attestations)
- Manipulation de PDF : fusion, découpage, rotation, filigrane
- Remplissage automatique de formulaires PDF
- Manipulation de fichiers et dossiers : os, pathlib, shutil
- Envoi d'e-mails automatiques avec pièces jointes : smtplib, email
- Interaction avec des API REST : requests, authentification, pagination
- Planification de tâches : cron, Planificateur de tâches, schedule (Python)
- Architecture d'un pipeline d'automatisation : entrées, traitement, sorties, alertes
■ Travaux pratiques :
→ TP1 : Extraction de données depuis des factures PDF et export vers Excel
→ TP2 : Génération automatique d'attestations PDF personnalisées à partir d'un fichier Excel
→ TP3 : Pipeline complet : collecte de données API → traitement → rapport Excel + PDF → envoi par e-mail
JOUR 3 — Introduction aux agents IA et LangChain
- Concept d'agent IA : différence entre chatbot, assistant et agent autonome
- Boucle perception-décision-action : architecture d'un agent
- Introduction à LangChain : philosophie, composants, installation
- Modèles de langage dans LangChain : configuration, paramètres, API keys
- Prompt templates : création, variables, composition
- Chains : enchaînement d'opérations, LLMChain, SequentialChain
- Mémoire conversationnelle : types de mémoire, persistance
- Function calling : principe, définition de fonctions, JSON Schema
- Création d'outils personnalisés pour manipuler des fichiers Excel et PDF
- Agents ReAct : raisonnement et action, boucle d'exécution
- Gestion des erreurs d'outils et stratégies de fallback
■ Travaux pratiques :
→ TP1 : Configuration de LangChain et création de chains de traitement de texte
→ TP2 : Création d'outils personnalisés (lecture Excel, extraction PDF, appel API)
→ TP3 : Agent ReAct capable d'analyser un fichier Excel et de répondre à des questions sur les données
JOUR 4 — LangGraph, workflows d'automatisation et projet final
- LangGraph : graphes d'exécution, nœuds et arêtes
- États et transitions : gestion du flux de données entre étapes
- Branchements conditionnels : routage dynamique selon les données
- Boucles et itérations dans les graphes
- Human-in-the-loop : validation humaine dans le workflow d'automatisation
- Persistence de l'état : checkpoints, reprise d'exécution en cas d'erreur
- Cadrage du projet final : identification d'un processus métier à automatiser
- Développement du workflow LangGraph avec outils personnalisés
- Intégration des traitements Excel et PDF dans le workflow
- Tests, débogage et optimisation du pipeline
■ Travaux pratiques :
→ TP1 : Workflow LangGraph de traitement automatisé de factures (PDF → extraction → Excel → alerte)
→ TP2 : Agent IA avec validation humaine pour la génération de rapports
→ TP3 (Projet final) : Pipeline d'automatisation métier complet — collecte, traitement, génération de documents et notification, piloté par un agent IA
Évaluation
- Test de positionnement en début de formation
- Évaluations formatives : exercices pratiques corrigés, revue d'architecture, débogage en groupe, QCM intermédiaires
- QCM mi-parcours de 20 questions (Jour 2)
- QCM final de 30 questions (Jour 4) — critère de réussite : 60%
- Soutenance du mini-projet final
- Attestation de fin de formation délivrée
Public visé
- Responsables métiers souhaitant automatiser leurs processus et traitements de données
- Chefs de projet et data analysts manipulant régulièrement des fichiers Excel, CSV et PDF
- Développeurs souhaitant intégrer l'IA dans leurs pipelines d'automatisation
- Administrateurs système cherchant à automatiser des tâches répétitives
Objectifs pédagogiques
- Écrire des scripts Python pour automatiser le traitement de fichiers Excel (openpyxl, pandas)
- Extraire, transformer et générer des documents PDF avec Python
- Manipuler et nettoyer des données issues de sources multiples (CSV, JSON, Excel, PDF)
- Planifier et orchestrer l'exécution automatique de scripts
- Comprendre les fondamentaux des agents IA et du framework LangChain
- Créer des outils personnalisés permettant à un agent IA d'interagir avec des fichiers et des API
- Concevoir des workflows d'automatisation complexes avec LangGraph
- Développer un agent IA capable d'automatiser un processus métier de bout en bout
Prérequis
- Notions de base en programmation Python : variables, conditions, boucles, fonctions
- Aisance minimale avec l'outil informatique (naviguer dans des dossiers, utiliser un terminal)
- Une connaissance de base des fichiers Excel et PDF est un plus
- Disposer d'un ordinateur avec Python 3.x et accès internet
Méthodes pédagogiques
- Alternance de théorie (30%) et de pratique (70%)
- Exposés interactifs, démonstrations live sur des cas métiers réels
- TP individuels et collaboratifs avec pandas, openpyxl, LangChain, LangGraph
- Pédagogie active : résolution de problèmes, débogage collaboratif, revue d'architecture en groupe
- Supports de cours numériques et fichiers d'exercices (accès pérenne)
Programme détaillé
JOUR 1 — Automatisation du traitement de fichiers Excel et CSV
- Rappels Python : types de données, structures de contrôle, fonctions, gestion des fichiers
- Introduction à pandas : Series, DataFrame, lecture de fichiers CSV et Excel
- Nettoyage de données : valeurs manquantes, doublons, types incorrects
- Filtrage, tri, regroupement : loc, iloc, groupby(), sort_values()
- Jointures entre DataFrames : merge(), concat()
- Module openpyxl : lecture et écriture de fichiers .xlsx
- Manipulation de cellules, feuilles, formules et mise en forme conditionnelle
- Génération automatique de rapports Excel avec graphiques
- Traitement par lots : automatiser le traitement de dizaines de fichiers Excel
- Gestion des erreurs et logging pour les scripts d'automatisation
■ Travaux pratiques :
→ TP1 : Nettoyage et consolidation de données commerciales multi-fichiers avec pandas
→ TP2 : Génération automatique d'un rapport Excel de synthèse avec graphiques (openpyxl)
→ TP3 : Script de traitement par lots de fichiers Excel d'un répertoire
JOUR 2 — Automatisation du traitement de PDF et orchestration de scripts
- Extraction de texte depuis des PDF : pdfplumber, pypdf
- Extraction de tableaux depuis des PDF vers DataFrames pandas
- OCR sur PDF scannés : pytesseract, pdf2image
- Génération de PDF : reportlab (rapports, factures, attestations)
- Manipulation de PDF : fusion, découpage, rotation, filigrane
- Remplissage automatique de formulaires PDF
- Manipulation de fichiers et dossiers : os, pathlib, shutil
- Envoi d'e-mails automatiques avec pièces jointes : smtplib, email
- Interaction avec des API REST : requests, authentification, pagination
- Planification de tâches : cron, Planificateur de tâches, schedule (Python)
- Architecture d'un pipeline d'automatisation : entrées, traitement, sorties, alertes
■ Travaux pratiques :
→ TP1 : Extraction de données depuis des factures PDF et export vers Excel
→ TP2 : Génération automatique d'attestations PDF personnalisées à partir d'un fichier Excel
→ TP3 : Pipeline complet : collecte de données API → traitement → rapport Excel + PDF → envoi par e-mail
JOUR 3 — Introduction aux agents IA et LangChain
- Concept d'agent IA : différence entre chatbot, assistant et agent autonome
- Boucle perception-décision-action : architecture d'un agent
- Introduction à LangChain : philosophie, composants, installation
- Modèles de langage dans LangChain : configuration, paramètres, API keys
- Prompt templates : création, variables, composition
- Chains : enchaînement d'opérations, LLMChain, SequentialChain
- Mémoire conversationnelle : types de mémoire, persistance
- Function calling : principe, définition de fonctions, JSON Schema
- Création d'outils personnalisés pour manipuler des fichiers Excel et PDF
- Agents ReAct : raisonnement et action, boucle d'exécution
- Gestion des erreurs d'outils et stratégies de fallback
■ Travaux pratiques :
→ TP1 : Configuration de LangChain et création de chains de traitement de texte
→ TP2 : Création d'outils personnalisés (lecture Excel, extraction PDF, appel API)
→ TP3 : Agent ReAct capable d'analyser un fichier Excel et de répondre à des questions sur les données
JOUR 4 — LangGraph, workflows d'automatisation et projet final
- LangGraph : graphes d'exécution, nœuds et arêtes
- États et transitions : gestion du flux de données entre étapes
- Branchements conditionnels : routage dynamique selon les données
- Boucles et itérations dans les graphes
- Human-in-the-loop : validation humaine dans le workflow d'automatisation
- Persistence de l'état : checkpoints, reprise d'exécution en cas d'erreur
- Cadrage du projet final : identification d'un processus métier à automatiser
- Développement du workflow LangGraph avec outils personnalisés
- Intégration des traitements Excel et PDF dans le workflow
- Tests, débogage et optimisation du pipeline
■ Travaux pratiques :
→ TP1 : Workflow LangGraph de traitement automatisé de factures (PDF → extraction → Excel → alerte)
→ TP2 : Agent IA avec validation humaine pour la génération de rapports
→ TP3 (Projet final) : Pipeline d'automatisation métier complet — collecte, traitement, génération de documents et notification, piloté par un agent IA
Évaluation
- Test de positionnement en début de formation
- Évaluations formatives : exercices pratiques corrigés, revue d'architecture, débogage en groupe, QCM intermédiaires
- QCM mi-parcours de 20 questions (Jour 2)
- QCM final de 30 questions (Jour 4) — critère de réussite : 60%
- Soutenance du mini-projet final
- Attestation de fin de formation délivrée