
Contexte et objectifs pédagogiques
Cette formation en présentiel constitue l’aboutissement du parcours « La science des données pour la mobilisation des recettes et la lutte contre la fraude ». Elle vise à consolider les acquis techniques développés à distance et à les mettre en application à travers des cas concrets, sur des données réelles.
Organisée autour de cours magistraux, d’ateliers pratiques et d’échanges avec des expert·es du secteur public et privé, elle permet aux participant·es de maîtriser les méthodes avancées de modélisation statistique, de prévision, et d’apprentissage automatique (supervisé et non supervisé), en lien avec les enjeux de fraude, de recettes et d’éthique des données.
Un cycle préparatoire de webinaires vient enrichir cette montée en compétence.
La formation se conclut par la réalisation d’un projet appliqué, tutoré, ancré dans une problématique concrète de l’administration d’origine du participant, et constitue l’étape-clé vers l’autonomie professionnelle dans l’usage stratégique de la data.
Cette formation est la dernière formation du parcours « La science des données pour la mobilisation des recettes et la lutte contre la fraude ». Les formations de ce parcours peuvent être suivies indépendamment les unes des autres. Pour être éligible à la session présentielle de regroupement qui clôture le parcours, il est nécessaire d’avoir obtenu le certificat des trois formations à distance suivantes :
- « La science des données dans les administrations : potentiels et enjeux organisationnels»
- « Premier pas sur le logiciel R avec des données douanières »
- « Mener une analyse exploratoire avec des données douanières sur le logiciel R».
Publics concernés
Cette formation s’adresse exclusivement aux agents francophones des administrations fiscales et douanières.
- Classe virtuelle n°1 : Introduction à la science des données
- Classe virtuelle n°2 : Comment identifier les données disponibles au sein de son administration ?
- Classe virtuelle n°3 : Les enjeux du partage des données entre services et administrations
- Classe virtuelle n°4 : La gestion des connaissances
- Classe virtuelle n°5 : Les technologies open source
- Classe virtuelle n°6 : Technologies connexes à la datascience et/ou outils et sources d’informations en ligne
Modalités du volet à distance
Le volet à distance s’organise autour de 6 classes virtuelles de 2 heures étalées sur 2 semaines, organisées en synchrones et obligatoires pour l’ensemble des participants.
Le volet en présentiel s’organise autour de cours magistraux, de travaux pratiques menés sur des données fiscales et douanières et d'ateliers permettant de discuter avec des experts du secteur public ou privé sur des sujets propres à la mobilisation de la science des données dans les administrations.
- Semaine 1 : savoir mettre en œuvre les méthodes statistiques univariées, bivariées, et multivariées pour explorer, visualiser, clusteriser des données douanières et/ou fiscales
- Semaine 2 : savoir mettre en œuvre les méthodes de modélisation linéaire, régression linéaire multiple, ANOVA, régression logistique sur des données douanières et/ou fiscales
- Semaine 3 : découvrir l'apprentissage supervisé : introduction, concepts importants, protocole expérimental, méthodes classiques et application à la détection de la fraude
- Semaine 4 : approfondir l'apprentissage supervisé : méthodes d’ensemble, réseaux de neurones, problème d'apprentissage déséquilibré et applications à la détection de la fraude et à la prédiction de séries temporelles
- Semaine 5 : apprentissage profond et IA générative : modèles avancés en deep learning, grands modèles de langue/LLM et cas d'usage dans l'administration fiscales et douanières
- Semaine 6 : apprentissage non-supervisé pour la détection de fraude et éthique, anonymisation et génération de données synthétiques pour le partage de données préservant la confidentialité.
Cette période de formation en présentiel sera clôturée par le «Défi DATAFID». Ce défi est une mise en situation au cours de laquelle les participants devront mobiliser les compétences acquises et résoudre une série de challenges visant à renforcer l'efficacité d'une administration fictive pour la mobilisation de recettes fiscales et douanières.
La délivrance du certificat repose sur le rendu d’un projet rédigé par le participant sur la base d’une problématique rencontrée par l’administration du participant et sur les données internes (anonymisées) et/ ou externes de l’administration. Le sujet du projet doit idéalement être choisi conjointement par le/la participant.e et sa hiérarchie afin de l’aborder comme un cas d’usage supervisé par les tuteur.rices participant à cette formation.
Modalités du volet en présentiel
Le volet présentiel se déroule sur 6 semaines dans les locaux de l’École nationale supérieure de statistique et d’économie appliquée d’Abidjan.
Validation of acquired knowledge
Cette formation donne lieu à un certificat délivré conjointement par l'IHEDD au nom de la Ferdi, reconnue organisme de formation professionnelle, et l’École nationale supérieure de statistique et d’économie appliquée d’Abidjan, sous condition de validation par le jury des évaluations prévues dans le parcours et des résultats de soutenance du projet de fin de formation.
History of previous sessions
Session : du 16 octobre 2023 au 18 juin 2024
Nombre de participant·es : 21
Taux de réussite : 95 %
Session : du 20 janvier au 11 juillet 2025
Nombre de participant·es : 19
Taux de réussite : 50 %
Practical information
- Next session: January 19, 2026 > April 03, 2026
- Registration deadline: November 18, 2025
- Payment deadline: January 12, 2026
- Duration: 12 heures de classes virtuelles + 6 semaines en présentiel
- Place: Abidjan, Côte d'Ivoire
- The training is delivered in français
- Equipment: Il est indispensable de disposer d'un ordinateur portable et d'une connexion internet
- The training is accessible to people with disabilities.
- Prerequisites: être certifiée des formations à distance : “Premier pas sur R avec des données douanières" et “Mener une analyse exploratoire des données douanières sur le logiciel R", ou démontrer un niveau équivalent en programmation R ou Python ; avoir des connaissances de base des statistiques (moyenne, variance, corrélation, régression simple) ; autonomie dans la manipulation des jeux de données
- Capacity: 25
Participation in training costs
Thanks to the support of our partners (Agence française de développement (AFD) and Expertise France), both full (covering transportation, accommodation, and training costs) and partial (covering transportation and accommodation) scholarships are available. These awards are granted based on the quality of the applications and the applicant's expressed motivations.
The scholarship application should be completed within the main application form. Candidates are also encouraged to explore securing funding from other sponsors from the moment they submit their application.
Training supervisors
- Nathaniel GBENROÉcole nationale supérieure de statistique et d’économie appliquée d’Abidjan
- Julien AH-PINEMaître de conférences HDR
Trainers
- Nathaniel GBENROÉcole nationale supérieure de statistique et d’économie appliquée d’Abidjan
- Julien AH-PINEMaître de conférences HDR
- Mourad ARFAOUITechnical attaché (World customs organization)
- François CHASTELDatascientist (Numéricité)
- Romaric COULIBALYEnseignant-chercheur et responsable de la filière des ingénieurs statisticiens économistes (ENSEA)
- Richard Kouamé MOUSSAAssociate professor (ENSEA)
- Fréjus-Ferry HOUNDOGAEnseignant-chercheur (ENSEA)
- Goualo Victorien BOBETExpert data (IA & Cloud)
- Kia Jokthan GONDOEnseignant chercheur (ENSEA)
- Kouadio Jean-Stéphane N’ZIEnseignant-chercheur (ENSEA)
- Franck MIGONEIngénieur Economiste Statisticien à l'Agence Nationale de la Statistique (ANSTAT) de Côte d’Ivoire