
Contexte et objectifs pédagogiques
Cette formation en présentiel constitue l’aboutissement du parcours « La science des données pour la mobilisation des recettes et la lutte contre la fraude ». Elle vise à consolider les acquis techniques développés à distance et à les mettre en application à travers des cas concrets, sur des données réelles.
Organisée autour de cours magistraux, d’ateliers pratiques et d’échanges avec des expert·es du secteur public et privé, elle permet aux participant·es de maîtriser les méthodes avancées de modélisation statistique, de prévision, et d’apprentissage automatique (supervisé et non supervisé), en lien avec les enjeux de fraude, de recettes et d’éthique des données.
Un cycle préparatoire de webinaires vient enrichir cette montée en compétence.
La formation se conclut par la réalisation d’un projet appliqué, tutoré, ancré dans une problématique concrète de l’administration d’origine du participant, et constitue l’étape-clé vers l’autonomie professionnelle dans l’usage stratégique de la data.
Cette formation est la dernière formation du parcours « La science des données pour la mobilisation des recettes et la lutte contre la fraude ». Les formations de ce parcours peuvent être suivies indépendamment les unes des autres. Pour être éligible à la session présentielle de regroupement qui clôture le parcours, il est nécessaire d’avoir obtenu le certificat des trois formations à distance suivantes :
- « La science des données dans les administrations : potentiels et enjeux organisationnels»
- « Premier pas sur le logiciel R avec des données douanières »
- « Mener une analyse exploratoire avec des données douanières sur le logiciel R».
Publics concernés
Cette formation s’adresse exclusivement aux agents francophones des administrations fiscales et douanières.
- Classe virtuelle n°1 : Introduction à la science des données
- Classe virtuelle n°2 : Comment identifier les données disponibles au sein de son administration ?
- Classe virtuelle n°3 : Les enjeux du partage des données entre services et administrations
- Classe virtuelle n°4 : La gestion des connaissances
- Classe virtuelle n°5 : Les technologies open source
- Classe virtuelle n°6 : Technologies connexes à la datascience et/ou outils et sources d’informations en ligne
Modalités du volet à distance
Le volet à distance s’organise autour de 6 classes virtuelles de 2 heures étalées sur 2 semaines, organisées en synchrones et obligatoires pour l’ensemble des participants.
Le volet en présentiel s’organise autour de cours magistraux, de travaux pratiques menés sur des données fiscales et douanières et d'ateliers permettant de discuter avec des experts du secteur public ou privé sur des sujets propres à la mobilisation de la science des données dans les administrations.
- Semaine 1 : savoir mettre en œuvre les méthodes statistiques univariées, bivariées, et multivariées pour explorer, visualiser, clusteriser des données douanières et/ou fiscales
- Semaine 2 : savoir mettre en œuvre les méthodes de modélisation linéaire, régression linéaire multiple, ANOVA, régression logistique sur des données douanières et/ou fiscales
- Semaine 3 : découvrir l'apprentissage supervisé : introduction, concepts importants, protocole expérimental, méthodes classiques et application à la détection de la fraude
- Semaine 4 : approfondir l'apprentissage supervisé : méthodes d’ensemble, réseaux de neurones, problème d'apprentissage déséquilibré et applications à la détection de la fraude et à la prédiction de séries temporelles
- Semaine 5 : apprentissage profond et IA générative : modèles avancés en deep learning, grands modèles de langue/LLM et cas d'usage dans l'administration fiscales et douanières
- Semaine 6 : apprentissage non-supervisé pour la détection de fraude et éthique, anonymisation et génération de données synthétiques pour le partage de données préservant la confidentialité.
Cette période de formation en présentiel sera clôturée par le «Défi DATAFID». Ce défi est une mise en situation au cours de laquelle les participants devront mobiliser les compétences acquises et résoudre une série de challenges visant à renforcer l'efficacité d'une administration fictive pour la mobilisation de recettes fiscales et douanières.
La délivrance du certificat repose sur le rendu d’un projet rédigé par le participant sur la base d’une problématique rencontrée par l’administration du participant et sur les données internes (anonymisées) et/ ou externes de l’administration. Le sujet du projet doit idéalement être choisi conjointement par le/la participant.e et sa hiérarchie afin de l’aborder comme un cas d’usage supervisé par les tuteur.rices participant à cette formation.
Modalités du volet en présentiel
Le volet présentiel se déroule sur 6 semaines dans les locaux de l’École nationale supérieure de statistique et d’économie appliquée d’Abidjan.
Validation des acquis
Cette formation donne lieu à un certificat délivré conjointement par l'IHEDD au nom de la Ferdi, reconnue organisme de formation professionnelle, et l’École nationale supérieure de statistique et d’économie appliquée d’Abidjan, sous condition de validation par le jury des évaluations prévues dans le parcours et des résultats de soutenance du projet de fin de formation.
Historique des sessions précédentes
Session : du 16 octobre 2023 au 18 juin 2024
Nombre de participant·es : 21
Taux de réussite : 95 %
Session : du 20 janvier au 11 juillet 2025
Nombre de participant·es : 19
Taux de réussite : 50 %
Infos pratiques
- Prochaine session : 19 janvier 2026 > 3 avril 2026
- Date limite d’inscription : 18 novembre 2025
- Date limite de paiement : 12 janvier 2026
- Durée : 12 heures de classes virtuelles + 6 semaines en présentiel
- Lieu : Abidjan, Côte d'Ivoire
- La formation est délivrée en français
- Matériel : Il est indispensable de disposer d'un ordinateur portable et d'une connexion internet
- La formation est accessible aux personnes en situation de handicap.
- Prérequis : être certifiée des formations à distance : “Premier pas sur R avec des données douanières" et “Mener une analyse exploratoire des données douanières sur le logiciel R", ou démontrer un niveau équivalent en programmation R ou Python ; avoir des connaissances de base des statistiques (moyenne, variance, corrélation, régression simple) ; autonomie dans la manipulation des jeux de données
- Nombre de places : 25
Participation aux frais de formation
Des bourses totales (transport, hébergement et frais pédagogiques) ou partielles (transport et hébergement) pourront être accordées grâce au soutien de nos partenaires (Agence française de développement (AFD) et Expertise France) sur le fondement de la qualité des candidatures et de l’expression des motivations.
La demande de bourse est à renseigner directement dans le formulaire de candidature. Les candidat.e.s sont invité.e.s à prospecter la prise en charge de leur participation aux formations auprès d’autres sponsors dès le dépôt de leur candidature.
Responsables de formation
- Nathaniel GBENROÉcole nationale supérieure de statistique et d’économie appliquée d’Abidjan
- Julien AH-PINEMaître de conférences HDR
Formatrices et formateurs
- Nathaniel GBENROÉcole nationale supérieure de statistique et d’économie appliquée d’Abidjan
- Julien AH-PINEMaître de conférences HDR
- Mourad ARFAOUITechnical attaché (World customs organization)
- François CHASTELDatascientist (Numéricité)
- Romaric COULIBALYEnseignant-chercheur et responsable de la filière des ingénieurs statisticiens économistes (ENSEA)
- Richard Kouamé MOUSSAAssociate professor (ENSEA)
- Fréjus-Ferry HOUNDOGAEnseignant-chercheur (ENSEA)
- Goualo Victorien BOBETExpert data (IA & Cloud)
- Kia Jokthan GONDOEnseignant chercheur (ENSEA)
- Kouadio Jean-Stéphane N’ZIEnseignant-chercheur (ENSEA)
- Franck MIGONEIngénieur Economiste Statisticien à l'Agence Nationale de la Statistique (ANSTAT) de Côte d’Ivoire