Étudiant : Léandre Thébaud – NEOMA BS (Programme TEMA 1)
Période : 15 juin 2025 → 15 août 2025
Lieu : La Défense (Altiplano)
Tuteurs : Olaf Kouamo & Quentin Fierling
Ce stage de deux mois au sein de l'équipe Data Science et Intelligence Artificielle de SUEZ a représenté une immersion complète dans le monde de l'intelligence artificielle appliquée à l'industrie. Intégré à la branche Digital Solutions, j'ai eu l'opportunité de travailler sur des projets concrets visant à optimiser la gestion des déchets et des réseaux d'eau à travers des solutions innovantes basées sur la data science et le machine learning.
La première phase de mon stage a été consacrée à une formation intensive sur les outils et technologies essentiels. J'ai ainsi pu me familiariser avec Python et ses bibliothèques clés comme Pandas et NumPy, tout en approfondissant mes connaissances en machine learning et en vision par ordinateur. Cette formation m'a permis de développer une compréhension solide des enjeux techniques et de participer activement aux discussions avec les ingénieurs de l'équipe, malgré mon profil initialement orienté business.
Par la suite, j'ai été impliqué dans trois projets concrets où j'ai :
Réalisé du data tagging sur plus de 24 000 images et vidéos pour alimenter les modèles d'intelligence artificielle.
Contribué à l'organisation et à la vérification des datasets sur la plateforme Microsoft Azure, en collaboration avec les membres de l'équipe.
Testé des modèles sur Hugging Face pour évaluer leurs performances et identifier des axes d'amélioration.
Documenté les processus pour faciliter le travail des futurs stagiaires.
Cette expérience a été extrêmement formatrice, me permettant non seulement de développer des compétences techniques solides, mais aussi de comprendre les défis et les opportunités liés à l'application de l'intelligence artificielle dans un contexte industriel. Elle a également renforcé mon intérêt pour les métiers situés à l'intersection de la technique et du business, où la data joue un rôle clé dans la transformation des processus opérationnels.
1. Présentation de SUEZ
SUEZ est un groupe international de premier plan dans le domaine de la gestion de l'eau et des déchets, alliant innovation technologique et durabilité environnementale. Fondé en 1858, le groupe a su évoluer pour devenir un acteur majeur de l'économie circulaire, présent dans plus de 40 pays avec un effectif dépassant les 80 000 collaborateurs. La branche Digital Solutions, basée au cœur du quartier d'affaires de La Défense, incarne parfaitement cette dynamique d'innovation en développant des solutions technologiques avancées pour moderniser la gestion des ressources.
Les activités de SUEZ s'articulent autour de quatre axes principaux :
L'optimisation des processus industriels : À travers des outils d'intelligence artificielle, le groupe automatise des tâches autrefois manuelles, comme le tri des déchets, pour gagner en efficacité et en précision.
La réduction des coûts opérationnels : Les solutions développées permettent de limiter les dépenses liées à la gestion des déchets et des réseaux d'eau, tout en prévenant les incidents coûteux.
La sécurisation des installations : Les technologies de détection et de monitoring en temps réel contribuent à renforcer la sécurité des sites industriels.
L'exploitation stratégique des données : SUEZ transforme les données collectées en insights actionnables, permettant une prise de décision éclairée et une amélioration continue des performances.
Mon stage s'est déroulé au sein d'une équipe pluridisciplinaire de 15 personnes, composée de data scientists, d'ingénieurs et de chefs de projet. Cette équipe, dédiée à l'innovation technologique, travaille sur des projets à fort impact opérationnel et financier pour le groupe. L'environnement de travail, à la fois exigeant et stimulant, m'a permis de développer une vision concrète des enjeux industriels et des solutions apportées par la data science.
L'approche de SUEZ se distingue par son engagement en faveur de la transformation digitale des secteurs traditionnels. Avec un budget annuel de 200 millions d'euros consacré à la recherche et développement, le groupe investit massivement dans l'innovation pour répondre aux défis environnementaux et économiques contemporains. Cette stratégie s'inscrit dans une vision à long terme, où la technologie et la durabilité sont indissociables.
2. Missions et Projets
Projet Autodiag – Optimisation du tri des déchets
Contexte et enjeux
Le projet Autodiag vise à automatiser la reconnaissance et le tri des déchets dans les centres de traitement de SUEZ. Dans un contexte où la gestion des déchets représente un enjeu majeur à la fois environnemental et économique, ce projet stratégique cherche à améliorer l'efficacité des processus tout en réduisant les coûts opérationnels. L'objectif est de développer un modèle d'intelligence artificielle capable d'identifier et de classifier automatiquement différents types de déchets (plastique, métal, carton, etc.) à partir d'images, afin d'optimiser leur tri et leur valorisation.
Les défis associés à ce projet sont multiples. D'une part, la variabilité des déchets en termes de forme, de taille et de matériau complexe la tâche de classification. D'autre part, la qualité des données d'entraînement est cruciale pour garantir la précision du modèle. Enfin, l'intégration de cette solution dans les processus existants doit se faire sans perturber les opérations en cours.
Mes contributions
En tant que stagiaire au sein de l'équipe Data Science, j'ai contribué à ce projet à plusieurs niveaux. Mon rôle principal a consisté à participer à la préparation et à l'annotation des données d'entraînement, une étape essentielle pour garantir la qualité des résultats finaux. Plus précisément, j'ai :
Annoté manuellement 4 000 images de déchets selon des protocoles stricts, en utilisant des outils professionnels comme CVAT pour délimiter les objets et les classifier par catégorie.
Vérifié la cohérence des annotations en collaboration avec les ingénieurs de l'équipe, afin de garantir l'uniformité et la précision des données.
Testé les premières versions du modèle YOLOv5 pour identifier des axes d'amélioration, en analysant les erreurs de classification et en proposant des ajustements.
Documenté les processus pour faciliter le travail des futurs stagiaires et assurer la pérennité des connaissances acquises.
Ce travail m'a permis de développer une compréhension approfondie des enjeux liés à la qualité des données dans les projets d'intelligence artificielle. J'ai notamment pris conscience que des erreurs même minimes dans les annotations peuvent avoir un impact significatif sur les performances du modèle, soulignant l'importance d'une approche rigoureuse et méthodique.
Apprentissages et résultats
Cette expérience a été particulièrement enrichissante, tant sur le plan technique que sur le plan humain. J'ai pu observer directement comment une solution d'IA peut transformer un processus industriel traditionnel, en apportant des gains significatifs en termes d'efficacité et de précision.
Projet UVE – Prévention des incidents industriels
Contexte et enjeux
Les unités de valorisation énergétique (UVE) de SUEZ jouent un rôle crucial dans le traitement des déchets, en transformant les déchets non recyclables en énergie. Cependant, ces installations sont régulièrement confrontées à un problème majeur : le blocage des fours par des objets volumineux et non conformes (matelas, barres métalliques, etc.), entraînant des arrêts de production coûteux et des risques pour la sécurité. Chaque incident de ce type peut coûter jusqu'à 100 000 euros à l'entreprise, sans compter les retards dans le traitement des déchets et les impacts environnementaux.
Le projet UVE vise donc à développer un système de détection précoce de ces objets à risque, avant qu'ils n'atteignent les fours. Ce système repose sur l'analyse d'images en temps réel, couplée à des algorithmes de machine learning capables d'identifier et de classifier les objets en fonction de leur dangerosité potentielle. Les défis techniques sont nombreux, allant de la variabilité des formes et des tailles des objets à la nécessité d'une détection rapide et fiable pour éviter les faux positifs.
Mes contributions
Dans le cadre de ce projet, j'ai été amené à participer à plusieurs tâches clés, sous la supervision des ingénieurs de l'équipe. Mon rôle a principalement consisté à :
Annoter 12 000 images représentant des objets critiques, en les classifiant par type et par niveau de dangerosité pour alimenter le modèle de détection.
Participer à l'organisation des données sur Microsoft Azure pour un traitement automatisé.
Observer et analyser les tests du système de détection en conditions réelles, pour évaluer son efficacité et identifier les axes d'amélioration.
Ce projet m'a permis de découvrir les enjeux de sécurité dans un environnement industriel, ainsi que l'importance d'une approche collaborative entre data scientists et opérateurs terrain.
Apprentissages
Bien que mon impact en tant que stagiaire ait été nécessairement limité, cette expérience m'a apporté des enseignements précieux sur plusieurs plans :
La compréhension des enjeux de sécurité dans un contexte industriel, où chaque incident peut avoir des conséquences majeures.
L'importance de la détection précoce des risques, et le rôle que peut jouer l'IA dans ce domaine.
La nécessité d'une collaboration étroite entre les data scientists, les ingénieurs et les opérateurs terrain pour développer des solutions adaptées.
Projet IA-Inspect – Maintenance des réseaux d'eau
Contexte
Le projet IA-Inspect s'inscrit dans la stratégie de SUEZ visant à moderniser la gestion des réseaux d'eau souterrains. Ces infrastructures, souvent vieillissantes et difficiles d'accès, nécessitent une maintenance régulière pour prévenir les fuites et les pannes. Traditionnellement, cette maintenance repose sur des inspections manuelles, coûteuses et chronophages. L'objectif du projet est donc de développer une solution basée sur l'intelligence artificielle et l'analyse d'images 360° pour automatiser une partie de ce processus.
Les caméras 360° utilisées pour filmer l'intérieur des conduits permettent de capturer des images complètes des réseaux, incluant les regards, les raccordements et les éventuelles anomalies (fissures, obstructions, etc.). Le défi consiste à analyser ces images pour détecter automatiquement les éléments critiques et les localiser précisément, afin de faciliter la planification des interventions de maintenance. Cette approche promettante pourrait réduire significativement les coûts et les temps d'inspection, tout en améliorant la précision des diagnostics.
Mes contributions
Mon rôle dans ce projet a consisté à :
Annoter 8 000 images issues des vidéos 360°, en identifiant et en géolocalisant les regards et les points d'accès, ainsi que les anomalies potentielles.
Apprendre à utiliser des outils spécialisés pour le traitement et l'analyse d'images panoramiques.
Contribué à l'organisation des données pour l'entraînement des modèles.
Ce projet m'a offert une vision concrète des applications de l'IA dans le domaine de la maintenance industrielle. J'ai pu voir comment une technologie comme la vision par ordinateur peut transformer des processus traditionnellement manuels, en apportant des gains significatifs en termes de temps, de coûts et de précision.
3. Compétences Développées
Ce stage chez SUEZ Digital Solutions a été une expérience extrêmement enrichissante, me permettant de développer un large éventail de compétences techniques, opérationnelles et transversales. Voici un bilan détaillé des compétences que j'ai pu développer pendant ces deux mois.
Python & Data Science
J'ai significativement amélioré ma maîtrise de Python, en particulier des bibliothèques essentielles pour la data science. Grâce à une formation intensive et à une pratique quotidienne, j'ai acquis une bonne compréhension de Pandas pour la manipulation de données, ou NumPy pour les calculs scientifiques. Ces compétences me permettent désormais de nettoyer, transformer et analyser des données de manière efficace.
Data Tagging
L'annotation de données a été au cœur de mon stage, avec plus de 24 000 images et vidéos traitées pour alimenter les modèles d'IA. J'ai appris à utiliser des outils professionnels comme CVAT pour créer des bounding boxes précises et classifier les objets selon des critères stricts.
Microsoft Azure
J'ai développé des compétences solides dans l'utilisation de Microsoft Azure pour le stockage, l'organisation et la sécurisation des datasets. Travailler sur cette plateforme cloud m'a permis de comprendre les bonnes pratiques en matière de gestion des données et de collaboration à distance.
Vision par Ordinateur
Ce stage m'a offert une immersion complète dans le domaine de la vision par ordinateur. J'ai appris les principes fondamentaux des modèles de détection d'objets comme YOLO et Faster R-CNN, ainsi que les techniques de prétraitement des images pour améliorer la qualité des données d'entraînement.
Travail d'Équipe
La collaboration avec les ingénieurs et les autres membres de l'équipe a été une composante essentielle de mon stage. J'ai développé ma capacité à communiquer clairement sur les avancées techniques et à m'adapter aux feedbacks pour améliorer continuellement la qualité de mon travail.
Gestion de Projet
Participer à plusieurs projets simultanément m'a permis de développer des compétences en gestion de projet. J'ai appris à prioriser les tâches, à respecter les deadlines et à documenter les processus pour assurer la pérennité des connaissances acquises.
Bilan des Compétences
Compétence
Avant le Stage
Après le Stage
Programmation Python
Connaissances de base, limitées aux boucles et conditions simples.
Maîtrise intermédiaire des bibliothèques essentielles (Pandas, NumPy) pour la manipulation et l'analyse de données complexes.
Compréhension de l'IA
Notions théoriques uniquement, sans expérience pratique.
Expérience pratique du data tagging, des tests de modèles et de l'analyse de performances.
Travail en équipe technique
Aucune expérience de collaboration avec des profils techniques.
Collaboration quotidienne et efficace avec des ingénieurs et data scientists.
4. Chronologie du Stage
Semaine 1 – Intégration et formation
La première semaine a été consacrée à mon intégration au sein de l'équipe et à une formation intensive sur les outils et technologies utilisés par SUEZ. J'ai ainsi pu :
Découvrir l'organisation de l'équipe et les différents projets en cours.
Me familiariser avec les outils de base comme Python, Pandas et NumPy.
Comprendre les enjeux spécifiques des projets d'IA dans le secteur industriel.
Rencontrer mes tuteurs et les autres membres de l'équipe pour établir une relation de travail collaborative.
Semaine 2 – Premières missions
Dès la deuxième semaine, j'ai commencé à contribuer activement aux projets, en commençant par des tâches de data tagging pour le projet Autodiag. Cette phase m'a permis de :
Apprendre les protocoles d'annotation et les bonnes pratiques pour garantir la qualité des données.
Découvrir les outils spécialisés comme CVAT pour le traitement des images.
Comprendre l'importance de la rigueur et de la précision dans le travail d'annotation.
Commencer à interagir avec les ingénieurs pour valider mon travail et recevoir des feedbacks constructifs.
Semaine 4 – Approfondissement technique
À mi-parcours, j'ai pu approfondir mes compétences techniques et prendre plus d'autonomie dans mes missions. Cette période a été marquée par :
Ma participation active au projet UVE, avec l'annotation d'images pour la détection d'objets dangereux.
Une meilleure compréhension des enjeux de sécurité industrielle et des contraintes opérationnelles.
L'apprentissage de l'utilisation avancée de Microsoft Azure pour le stockage et l'organisation des datasets.
Une collaboration plus étroite avec les opérateurs terrain pour adapter les solutions techniques aux réalités du terrain.
Semaine 6 – Autonomie et contributions
À ce stade, j'ai gagné en autonomie et ai pu contribuer de manière plus significative aux projets. J'ai notamment :
Pris en main les outils de manière indépendante, sans avoir besoin d'une supervision constante.
Testé des modèles sur Hugging Face pour évaluer leurs performances et proposer des améliorations.
Documenté les processus et les bonnes pratiques pour faciliter le travail des futurs stagiaires.
Participé activement aux réunions techniques pour discuter des avancées et des défis rencontrés.
Semaine 8 – Bilan et restitution
Les dernières semaines ont été consacrées à la finalisation des rapports et à la préparation de la restitution de mon travail. J'ai ainsi pu :
Synthétiser les résultats de mes missions et les compétences acquises.
Préparer une présentation claire et structurée pour restituer mon travail aux tuteurs et à l'équipe.
Faire un bilan personnel de cette expérience et identifier les axes d'amélioration pour mes futures expériences professionnelles.
Recevoir des feedbacks constructifs de la part de mes tuteurs et des membres de l'équipe.
5. Analyse et Réflexions
Ce stage chez SUEZ Digital Solutions a été l'occasion de développer une réflexion approfondie sur le rôle de la data science dans l'industrie, ainsi que sur les défis et les opportunités associés à son application. L'analyse critique de mon expérience m'a permis de tirer des enseignements précieux, tant sur le plan technique que sur le plan humain, et de mieux comprendre les enjeux de la transformation digitale dans un secteur traditionnel comme la gestion des déchets et des réseaux d'eau.
Compréhension du rôle de la data
Avant ce stage, ma perception du data tagging était assez limitée. Je le considérais comme une tâche secondaire, presque accessoire, dans le développement de projets d'intelligence artificielle. Mon expérience chez SUEZ m'a cependant permis de prendre conscience de son importance cruciale. En effet, j'ai réalisé que :
Les annotations représentent environ 80% du travail nécessaire pour obtenir des résultats fiables, alors qu'elles ne constituent souvent que 20% des efforts visibles.
Une erreur même minime dans les annotations, de l'ordre de 5%, peut entraîner une chute significative de la précision du modèle, pouvant atteindre 30% dans certains cas.
La qualité des données d'entraînement est le facteur déterminant de la performance finale des modèles, bien plus que les algorithmes eux-mêmes.
Cette prise de conscience a profondément modifié ma vision de la data science. J'ai compris que le succès d'un projet d'IA ne repose pas uniquement sur des algorithmes sophistiqués, mais avant tout sur la qualité et la pertinence des données utilisées pour l'entraînement. Cette leçon sera précieuse pour mes futures expériences professionnelles, où je saurai accorder une attention particulière à cette étape souvent sous-estimée.
Transformation digitale chez SUEZ
SUEZ incarne parfaitement les enjeux et les opportunités de la transformation digitale dans un secteur traditionnel comme la gestion des déchets et des réseaux d'eau. L'entreprise a su anticiper les mutations technologiques et investir massivement dans l'innovation pour rester compétitive et répondre aux défis environnementaux et économiques contemporains. Trois axes principaux structurent cette transformation :
L'automatisation des processus industriels : À travers des projets comme Autodiag, SUEZ automatise des tâches autrefois manuelles, comme le tri des déchets, pour gagner en efficacité et en précision.
L'intégration de l'IA dans les métiers : Les solutions développées par la branche Digital Solutions s'intègrent progressivement dans les processus métiers existants, transformant les méthodes de travail et les compétences requises.
L'optimisation continue des performances : SUEZ mise sur l'analyse des données pour identifier en permanence des axes d'amélioration, que ce soit en termes de coûts, de qualité ou de sécurité.
Cette stratégie de transformation digitale s'inscrit dans une vision à long terme, où la technologie et la durabilité sont indissociables. En investissant 200 millions d'euros annuellement dans la recherche et développement, SUEZ se positionne comme un acteur clé de l'innovation dans son secteur, tout en répondant aux enjeux environnementaux et sociétaux actuels.
6. Vidéo Explicative
Cette vidéo permet de visualiser concrètement les processus de data labeling et d'intelligence artificielle que j'ai contribué à développer chez SUEZ.
Cliquez ci-dessous pour regarder la vidéo :
Note : Cette vidéo a été réalisée dans le cadre de mon rapport de stage pour illustrer de manière visuelle les concepts techniques et les missions que j'ai accomplies.
7. Conclusion et Perspectives
Ce stage chez SUEZ Digital Solutions a été bien plus qu'une simple expérience professionnelle : il a constitué une véritable immersion dans le monde de la data science industrielle, où la technologie rencontre des enjeux concrets et opérationnels. Ces deux mois intenses m'ont permis de développer des compétences techniques et transversales précieuses, tout en renforçant ma capacité à travailler en équipe et à m'adapter à des environnements complexes.
Bilan du stage
Plusieurs aspects de cette expérience ont été particulièrement formateurs et marquants :
La découverte concrète des applications de l'IA dans l'industrie : J'ai pu voir comment des technologies comme la vision par ordinateur ou le machine learning peuvent transformer des processus traditionnels, en apportant des gains significatifs en termes d'efficacité, de précision et de sécurité.
Le développement de compétences techniques solides : Maîtrise de Python et de ses bibliothèques (Pandas, NumPy), utilisation professionnelle d'outils comme CVAT pour le data tagging, ou encore gestion des données sur Microsoft Azure.
La compréhension des enjeux industriels : J'ai acquis une vision réaliste des défis et des opportunités liés à la gestion des déchets et des réseaux d'eau, ainsi que des contraintes opérationnelles spécifiques à ce secteur.
L'importance de la qualité des données : J'ai pris conscience que le succès d'un projet d'IA repose avant tout sur la rigueur et la précision du travail d'annotation, souvent sous-estimé mais crucial.
La collaboration en équipe pluridisciplinaire : Travailler aux côtés d'ingénieurs, de data scientists et d'opérateurs terrain m'a appris l'importance de la communication et de la coordination pour mener à bien des projets complexes.
En tant que stagiaire, j'ai contribué à mon échelle à des projets significatifs, tout en prenant conscience des limites de mon impact, liées à la durée courte de mon stage et à mon niveau d'expérience encore débutant. Cette humilité m'a permis d'apprécier davantage les compétences et l'expertise des membres de l'équipe, tout en identifiant les axes sur lesquels je dois encore progresser.
Perspectives professionnelles
Cette expérience a confirmé mon intérêt pour les métiers à l'intersection de la data et du business, où la technologie a un impact concret sur les opérations et les performances. À la lumière de cette expérience, j'ai défini plusieurs objectifs pour la suite de mon parcours professionnel :
À court terme : Approfondir mes compétences en analyse de données et en data science, en me formant sur des outils complémentaires comme TensorFlow ou PyTorch pour le deep learning.
À moyen terme : Trouver un poste de Data Analyst dans le secteur industriel, où je pourrai appliquer mes compétences à des problèmes concrets et mesurables.
À long terme : Évoluer vers des rôles hybrides, comme Data Product Manager, où je pourrai faire le pont entre les équipes techniques et les métiers, pour développer des solutions data-driven ayant un impact réel sur les performances opérationnelles.
En conclusion, ce stage a été une expérience déterminante qui a façonné ma vision de mon futur parcours professionnel. Il m'a permis de découvrir un domaine passionnant, où l'innovation technologique rencontre des enjeux industriels et environnementaux majeurs. Je suis désormais convaincu que les compétences acquises pendant ces deux mois me seront précieuses pour relever les défis de demain dans le domaine de la data science industrielle.