Automatiser les processus métiers avec Python et l'IA

Objectifs :

  • Automatiser le traitement de fichiers Excel, CSV et PDF avec Python
  • Concevoir des pipelines d'automatisation robustes (collecte, traitement, export, alertes)
  • Créer des agents IA capables d'interagir avec des fichiers et des API métier grâce à LangChain
  • Orchestrer des workflows d'automatisation complexes avec LangGraph
  • Développer un agent IA pilotant un processus métier de bout en bout
Tarif inter / participant
2 500 € HT
📄 Programme (PDF) 📅 Voir les dates

Public visé

  • Responsables métiers souhaitant automatiser leurs processus et traitements de données
  • Chefs de projet et data analysts manipulant régulièrement des fichiers Excel, CSV et PDF
  • Développeurs souhaitant intégrer l'IA dans leurs pipelines d'automatisation
  • Administrateurs système cherchant à automatiser des tâches répétitives

Objectifs pédagogiques

  • Écrire des scripts Python pour automatiser le traitement de fichiers Excel (openpyxl, pandas)
  • Extraire, transformer et générer des documents PDF avec Python
  • Manipuler et nettoyer des données issues de sources multiples (CSV, JSON, Excel, PDF)
  • Planifier et orchestrer l'exécution automatique de scripts
  • Comprendre les fondamentaux des agents IA et du framework LangChain
  • Créer des outils personnalisés permettant à un agent IA d'interagir avec des fichiers et des API
  • Concevoir des workflows d'automatisation complexes avec LangGraph
  • Développer un agent IA capable d'automatiser un processus métier de bout en bout

Prérequis

  • Notions de base en programmation Python : variables, conditions, boucles, fonctions
  • Aisance minimale avec l'outil informatique (naviguer dans des dossiers, utiliser un terminal)
  • Une connaissance de base des fichiers Excel et PDF est un plus
  • Disposer d'un ordinateur avec Python 3.x et accès internet

Méthodes pédagogiques

  • Alternance de théorie (30%) et de pratique (70%)
  • Exposés interactifs, démonstrations live sur des cas métiers réels
  • TP individuels et collaboratifs avec pandas, openpyxl, LangChain, LangGraph
  • Pédagogie active : résolution de problèmes, débogage collaboratif, revue d'architecture en groupe
  • Supports de cours numériques et fichiers d'exercices (accès pérenne)

Programme détaillé

JOUR 1 — Automatisation du traitement de fichiers Excel et CSV

  • Rappels Python : types de données, structures de contrôle, fonctions, gestion des fichiers
  • Introduction à pandas : Series, DataFrame, lecture de fichiers CSV et Excel
  • Nettoyage de données : valeurs manquantes, doublons, types incorrects
  • Filtrage, tri, regroupement : loc, iloc, groupby(), sort_values()
  • Jointures entre DataFrames : merge(), concat()
  • Module openpyxl : lecture et écriture de fichiers .xlsx
  • Manipulation de cellules, feuilles, formules et mise en forme conditionnelle
  • Génération automatique de rapports Excel avec graphiques
  • Traitement par lots : automatiser le traitement de dizaines de fichiers Excel
  • Gestion des erreurs et logging pour les scripts d'automatisation

■ Travaux pratiques :
→ TP1 : Nettoyage et consolidation de données commerciales multi-fichiers avec pandas
→ TP2 : Génération automatique d'un rapport Excel de synthèse avec graphiques (openpyxl)
→ TP3 : Script de traitement par lots de fichiers Excel d'un répertoire

JOUR 2 — Automatisation du traitement de PDF et orchestration de scripts

  • Extraction de texte depuis des PDF : pdfplumber, pypdf
  • Extraction de tableaux depuis des PDF vers DataFrames pandas
  • OCR sur PDF scannés : pytesseract, pdf2image
  • Génération de PDF : reportlab (rapports, factures, attestations)
  • Manipulation de PDF : fusion, découpage, rotation, filigrane
  • Remplissage automatique de formulaires PDF
  • Manipulation de fichiers et dossiers : os, pathlib, shutil
  • Envoi d'e-mails automatiques avec pièces jointes : smtplib, email
  • Interaction avec des API REST : requests, authentification, pagination
  • Planification de tâches : cron, Planificateur de tâches, schedule (Python)
  • Architecture d'un pipeline d'automatisation : entrées, traitement, sorties, alertes

■ Travaux pratiques :
→ TP1 : Extraction de données depuis des factures PDF et export vers Excel
→ TP2 : Génération automatique d'attestations PDF personnalisées à partir d'un fichier Excel
→ TP3 : Pipeline complet : collecte de données API → traitement → rapport Excel + PDF → envoi par e-mail

JOUR 3 — Introduction aux agents IA et LangChain

  • Concept d'agent IA : différence entre chatbot, assistant et agent autonome
  • Boucle perception-décision-action : architecture d'un agent
  • Introduction à LangChain : philosophie, composants, installation
  • Modèles de langage dans LangChain : configuration, paramètres, API keys
  • Prompt templates : création, variables, composition
  • Chains : enchaînement d'opérations, LLMChain, SequentialChain
  • Mémoire conversationnelle : types de mémoire, persistance
  • Function calling : principe, définition de fonctions, JSON Schema
  • Création d'outils personnalisés pour manipuler des fichiers Excel et PDF
  • Agents ReAct : raisonnement et action, boucle d'exécution
  • Gestion des erreurs d'outils et stratégies de fallback

■ Travaux pratiques :
→ TP1 : Configuration de LangChain et création de chains de traitement de texte
→ TP2 : Création d'outils personnalisés (lecture Excel, extraction PDF, appel API)
→ TP3 : Agent ReAct capable d'analyser un fichier Excel et de répondre à des questions sur les données

JOUR 4 — LangGraph, workflows d'automatisation et projet final

  • LangGraph : graphes d'exécution, nœuds et arêtes
  • États et transitions : gestion du flux de données entre étapes
  • Branchements conditionnels : routage dynamique selon les données
  • Boucles et itérations dans les graphes
  • Human-in-the-loop : validation humaine dans le workflow d'automatisation
  • Persistence de l'état : checkpoints, reprise d'exécution en cas d'erreur
  • Cadrage du projet final : identification d'un processus métier à automatiser
  • Développement du workflow LangGraph avec outils personnalisés
  • Intégration des traitements Excel et PDF dans le workflow
  • Tests, débogage et optimisation du pipeline

■ Travaux pratiques :
→ TP1 : Workflow LangGraph de traitement automatisé de factures (PDF → extraction → Excel → alerte)
→ TP2 : Agent IA avec validation humaine pour la génération de rapports
→ TP3 (Projet final) : Pipeline d'automatisation métier complet — collecte, traitement, génération de documents et notification, piloté par un agent IA

Évaluation

  • Test de positionnement en début de formation
  • Évaluations formatives : exercices pratiques corrigés, revue d'architecture, débogage en groupe, QCM intermédiaires
  • QCM mi-parcours de 20 questions (Jour 2)
  • QCM final de 30 questions (Jour 4) — critère de réussite : 60%
  • Soutenance du mini-projet final
  • Attestation de fin de formation délivrée

Retour en haut