Algorithme de contrôle fiscal DGFiP : grille de lecture du praticien

Q: Sur quelles sources peut-on fonder une analyse du ciblage algorithmique ?

Les arrêtés portant création des traitements (CFVR, GALAXIE), les délibérations de la CNIL, le rapport sénatorial Carcenac-Nougein de 2020, les annexes annuelles du projet de loi de finances et la doctrine universitaire (RFFP n° 153, Revue de droit fiscal) permettent de reconstituer la grille des signaux exploités par les modèles.

Q: Quelle proportion des contrôles fiscaux est aujourd'hui issue du ciblage algorithmique ?

D'après les rapports d'activité de la DGFiP, la part des contrôles fiscaux des entreprises programmés par l'analyse de données a progressé de 13 pour cent en 2018 à plus de 50 pour cent à partir de 2023. Les rendements financiers du datamining sont passés de 785 millions d'euros en 2019 à plusieurs milliards d'euros en cumul aujourd'hui.

Reconstituer la logique algorithmique du contrôle fiscal à partir des sources publiques : grille de lecture pour le contribuable et son conseil.

Par Antoine Gouin et Hugo Marchadier, Avocats au Barreau de Paris — Alphard Law 18 mai 2026 18 min de lecture

Plus d'un contrôle fiscal sur deux est désormais issu d'un ciblage algorithmique. La proportion progresse chaque année depuis 2018, où elle n'était que de treize pour cent, et la Direction générale des Finances publiques (DGFiP) revendique aujourd'hui un objectif supérieur à cinquante pour cent des opérations programmées par le datamining pour le contrôle des entreprises. Ce déplacement du centre de gravité du contrôle, de l'intuition du vérificateur vers l'analyse statistique centralisée, modifie en profondeur la manière dont un contribuable et son conseil doivent appréhender l'exposition au risque fiscal.

Une question revient régulièrement en consultation : peut-on connaître l'algorithme qui sélectionne les dossiers contrôlés ? La réponse est négative. Le code source de l'outil Ciblage de la fraude et valorisation des requêtes (CFVR), comme celui des applications connexes GALAXIE, Foncier innovant ou PILAT, n'est pas public et ne le sera vraisemblablement jamais, l'administration invoquant à juste titre les exceptions de l'article L. 311-5 du code des relations entre le public et l'administration (CRPA) tenant à la sécurité publique et à la recherche d'infractions. Mais l'absence de publication du code ne signifie pas absence d'information : les arrêtés portant création des traitements, les délibérations de la CNIL, les rapports parlementaires et la doctrine académique permettent de reconstituer avec une précision raisonnable les variables exploitées et la logique d'atypie qui structure le scoring de risque.

Notre propos est de proposer une grille de lecture pratique, fondée exclusivement sur des sources officielles ou doctrinales publiquement accessibles. Nous examinons d'abord le cadre juridique et technique du contrôle fiscal algorithmique tel qu'il ressort des textes et des autorisations CNIL (I), puis nous cartographions les signaux d'atypie exploités par les modèles à partir des trois grandes catégories de données mobilisées (II), avant de tirer les conséquences pratiques de cette grille pour la revue préventive et la rectification spontanée (III).

I. Le cadre algorithmique du contrôle fiscal en France : ce que les sources publiques permettent de savoir

A. La méthode : un scoring de risque alimenté par onze bases de données

Le projet CFVR et son architecture. Le projet de Ciblage de la fraude et valorisation des requêtes a été créé par arrêté du 21 février 2014, modifié notamment par l'arrêté du 28 août 2017 qui en a étendu le périmètre aux personnes physiques. Ce traitement automatisé, désormais piloté par le bureau SJCF-1D du Service juridique et du contrôle fiscal, ne procède pas à la caractérisation automatique d'une fraude : il établit un classement probabiliste des dossiers par niveau d'atypie, à charge ensuite pour les services opérationnels d'analyser les pistes proposées et de décider de l'engagement d'un contrôle. Comme l'a souligné la Cour des comptes dans son rapport public 2018 et plus récemment le rapport sénatorial Carcenac-Nougein (Sénat, n° 668, 22 juillet 2020), l'objectif explicite est de porter à 50 pour cent la part des opérations programmées par l'analyse de données, objectif que la DGFiP indique avoir dépassé pour le contrôle des entreprises dès l'exercice 2023.

Les sources de données mobilisées. Les onze bases agrégées dans le silo CFVR sont identifiées par les arrêtés successifs et par les délibérations CNIL accompagnant chaque évolution du traitement (notamment délibération n° 2014-049, n° 2017-249 et n° 2022-025). On y retrouve les applications déclaratives internes (déclarations IR, IS, TVA, IFI, droits d'enregistrement), les bases patrimoniales (PATRIM, FIDJI, BNDP), les fichiers bancaires (FICOBA, FICOVIE), les données sociales (DSN transmise par les organismes de sécurité sociale), les sources économiques externes (BODACC, registre des bénéficiaires effectifs, INSEE) et les flux internationaux d'échange automatique (CRS, DAC 2, DAC 6, DAC 7 et désormais DAC 8 pour les actifs numériques). Le projet GALAXIE, autorisé par arrêté du 11 mars 2022 après avis favorable de la CNIL (délibération n° 2022-025 du 17 février 2022), ajoute à cet ensemble une fonction de visualisation graphique des liens capitalistiques et personnels, permettant au vérificateur de reconstituer en quelques secondes une chaîne de participations ou un réseau d'associés communs.

La méthode statistique. Le traitement combine, selon les indications fournies par la DGFiP elle-même dans ses rapports d'activité, deux approches complémentaires. La première, dite supervisée, entraîne le modèle à partir de dossiers de fraude antérieurement caractérisés, pour identifier dans la population des contribuables actuels les profils qui présentent les mêmes traits statistiques. La seconde, non supervisée, recherche directement les atypies par rapport au comportement modal d'une population de référence, sans préjuger de la nature de l'anomalie. C'est cette seconde approche qui produit l'essentiel des dossiers nouveaux orientés vers les services de contrôle, car elle permet de détecter des schémas inédits que l'apprentissage supervisé ignorerait.

B. Les sources publiques exploitables pour reconstituer la grille

Les textes réglementaires. Sans donner accès au code, les arrêtés portant création des traitements précisent, conformément aux exigences de la loi Informatique et Libertés et du Règlement général sur la protection des données, les finalités poursuivies, les catégories de données traitées, les destinataires et les durées de conservation. Ces textes constituent la première source d'information sur les variables exploitées. L'arrêté du 14 septembre 2017 a notamment marqué l'extension du CFVR aux personnes physiques en listant expressément les catégories de données examinées pour la détection des « comportements présentant un risque de fraude », y compris en matière de domiciliation fiscale. L'arrêté du 11 mars 2022 portant création du traitement GALAXIE détaille pour sa part les catégories d'informations cartographiées : liens capitalistiques, mandats sociaux, comptes bancaires, biens immobiliers et mobiliers.

Les délibérations CNIL. L'autorité de contrôle des données personnelles examine systématiquement les projets d'arrêté avant publication et rend ses observations publiques. Les délibérations successives sur le CFVR, sur l'expérimentation de l'article 154 de la loi de finances pour 2020 (collecte automatisée de données publiques sur les plateformes en ligne) et sur le traitement GALAXIE sont autant de sources qui décrivent, en termes accessibles, les contours techniques et les garanties associées. La CNIL a notamment relevé, dans sa délibération n° 2019-114 sur l'article 154, que le dispositif ne portait que sur des contenus librement accessibles et excluait les contenus à accès restreint ainsi que les messageries privées, précision utile au praticien pour calibrer ses conseils.

Les rapports parlementaires et de la Cour des comptes. Le rapport d'information du Sénat n° 668 du 22 juillet 2020 sur les moyens du contrôle fiscal, présenté par les sénateurs Thierry Carcenac et Claude Nougein, constitue à ce jour la synthèse publique la plus exhaustive sur l'organisation et les outils de la programmation algorithmique. Il est complété chaque année par les annexes du projet de loi de finances relatives à la lutte contre l'évasion fiscale, qui livrent des indicateurs précis sur les rendements, les méthodes et les évolutions du dispositif. La Cour des comptes a également publié plusieurs référés et rapports sur la matière (notamment référé du 6 décembre 2018 sur la fraude aux prélèvements obligatoires).

La doctrine académique. L'article de Stéphane Créange paru à la Revue française de finances publiques (RFFP n° 153, 2021, p. 21) reste la référence universitaire sur le datamining à la DGFiP, écrit par un acteur direct du dispositif. Il est utilement complété par les contributions de Mohamed Kimri et Pierre Legros (Revue de droit fiscal, n° 5, 4 février 2021, § 122) sur le régime juridique du contrôle fiscal algorithmique, ainsi que par les chroniques régulières des Petites affiches et de la Revue de droit fiscal. Cette doctrine, croisée aux textes réglementaires, suffit à reconstituer les principales familles de signaux exploités par les modèles.

II. Cartographie des signaux d'atypie et seuils institutionnels de surveillance

La logique du scoring n'est pas binaire. Chaque variable contribue, avec une pondération propre, à un score global qui classe les dossiers par ordre décroissant de risque. La détection ne porte pas sur des seuils absolus mais sur des écarts statistiques par rapport à un groupe de référence (peer group) défini par le secteur d'activité, la taille, l'ancienneté et la zone géographique. Trois grandes familles de signaux structurent l'analyse : les incohérences intra-déclaratives, les écarts entre déclarations et données détenues par des tiers, et les indices issus de sources externes ouvertes.

A. Les incohérences intra-déclaratives et les ruptures temporelles

Les ruptures temporelles dans le dossier d'un même contribuable. Les modèles non supervisés détectent prioritairement les variations atypiques d'un exercice à l'autre. Une variation supérieure à trente pour cent du revenu déclaré, à la hausse comme à la baisse, sans justification apparente tirée d'un changement de situation familiale ou professionnelle déclaré par ailleurs, constitue un signal de premier rang. Il en va de même de la disparition soudaine d'une catégorie de revenus (bénéfices non commerciaux, revenus fonciers, dividendes) sans cessation d'activité ou cession déclarée, de l'apparition durable de déficits après une période de bénéfices stables, ou encore de la bascule d'un foyer dans une tranche marginale d'imposition très inférieure à celle des exercices antérieurs. Ces signaux n'ont rien de pathognomonique en eux-mêmes : ils ne font qu'orienter le modèle vers un examen plus approfondi du dossier.

Les incohérences entre déclarations corrélatives. La DGFiP exploite systématiquement la cohérence interne du dossier déclaratif. La déclaration 2047 de revenus de source étrangère sans déclaration 3916 des comptes étrangers correspondants, ou inversement, constitue une discordance immédiatement identifiable. La déclaration d'impôt sur la fortune immobilière (IFI) qui ne se reflète pas dans la 2044 sous forme de revenus fonciers proportionnés au patrimoine déclaré, le mécénat (articles 200 et 238 bis du Code général des impôts) significatif sans capacité contributive apparente, les crédits d'impôt récurrents pour services à la personne ou garde d'enfants sans composition du foyer cohérente, sont autant de configurations que le modèle relève automatiquement. Le rapport sénatorial précité confirme que ces croisements intra-déclaratifs constituent l'épine dorsale du scoring pour les particuliers.

Les atypies de structure pour les sociétés et les détenteurs de holdings. Pour les entités, le modèle examine les ratios financiers et leur position par rapport au secteur. Le ratio compte courant d'associé sur capitaux propres, le ratio charges financières sur résultat d'exploitation, le ratio rémunération du dirigeant sur résultat, la marge brute par rapport au peer group sectoriel, le délai moyen de paiement clients et fournisseurs, le taux de récupération de TVA déductible par rapport au chiffre d'affaires, font partie des indicateurs classiques de la requête statistique. Un ratio extrême ne caractérise aucune anomalie en lui-même : il existe des justifications économiques parfaitement légitimes à toutes ces configurations (crédit-vendeur dans le cadre d'une cession, phase de démarrage, holding patrimoniale, OBO récent). Mais le ratio extrême déclenche une vérification de la documentation justificative que le contribuable doit pouvoir produire.

B. Les écarts entre déclarations et données tiers-déclarantes

Le pilier bancaire et patrimonial. Les bases FICOBA (comptes bancaires) et FICOVIE (contrats d'assurance-vie au-delà de 7 500 euros) permettent une comparaison directe entre les comptes effectivement détenus et ceux qui transparaissent des déclarations de revenus. Un compte créditeur dont les flux cumulés annuels excèdent significativement les revenus déclarés, un contrat d'assurance-vie dont les rachats partiels ne donnent pas lieu à imposition en revenus de capitaux mobiliers, sont des signaux de premier ordre. Les bases PATRIM et FIDJI, dérivées des actes notariés, permettent en outre de rapprocher les acquisitions immobilières des capacités de financement déclarées : une acquisition dont le prix excède plusieurs fois le revenu annuel sans financement bancaire visible constitue un signal d'examen au titre des examens de situation fiscale personnelle (ESFP) de l'article L. 12 du Livre des procédures fiscales.

Le pilier social et professionnel. La déclaration sociale nominative (DSN) transmise mensuellement par les employeurs à l'URSSAF est rapprochée des traitements et salaires déclarés en 2042. Toute différence significative, qu'elle traduise une sous-déclaration salariale ou inversement une déclaration de revenus sans rattachement à un employeur identifié, déclenche un signal. Les honoraires reportés en DAS 2 par les sociétés versantes sont rapprochés des bénéfices non commerciaux déclarés par leurs bénéficiaires. Pour les professions libérales et les indépendants, la décorrélation entre la chronologie des encaissements bancaires et la chronologie déclarative est l'un des indicateurs les plus mobilisés.

Le pilier patrimonial externe. Le cadastre, à travers le fichier MAJIC, est désormais croisé systématiquement avec les déclarations IFI et les déclarations de revenus fonciers. Le projet Foncier innovant, autorisé par arrêté et déployé depuis 2021, exploite les prises de vue aériennes de l'Institut national de l'information géographique et forestière (IGN) pour détecter les piscines et les bâtis non déclarés ; les premiers résultats publiés par la DGFiP, qui font état de plus de 140 000 piscines redressées sur la période 2022-2023, témoignent de l'efficacité de l'approche. Le registre des bénéficiaires effectifs (RBE), tenu par l'Institut national de la propriété industrielle, est également mobilisé pour identifier les détentions indirectes non reflétées dans les déclarations patrimoniales.

Le pilier international. Les échanges automatiques d'informations constituent aujourd'hui la source la plus dynamique du ciblage. La directive 2014/107/UE (DAC 2) transposée en droit interne et la norme commune de déclaration (CRS) de l'OCDE imposent aux administrations partenaires de transmettre annuellement les informations relatives aux comptes financiers détenus par les résidents fiscaux français : soldes au 31 décembre, intérêts, dividendes, produits de cession, bénéficiaires effectifs. Selon les chiffres communiqués par la DGFiP, plus de sept millions de comptes étrangers ont fait l'objet d'une déclaration entrante au titre de l'exercice 2023. La directive 2018/822/UE (DAC 6) impose aux intermédiaires la déclaration des dispositifs transfrontières comportant certains marqueurs ; la directive 2021/514/UE (DAC 7) étend l'obligation aux plateformes en ligne ; la directive 2023/2226/UE (DAC 8), entrée en application au 1er janvier 2026, complète le dispositif pour les actifs numériques. Chacune de ces sources alimente directement le score de risque lorsqu'une discordance est constatée avec la déclaration 3916, 3916-bis ou 2042.

C. Les signaux issus de sources externes ouvertes et la dimension internationale

La collecte automatisée sur les plateformes en ligne. L'article 154 de la loi de finances pour 2020, prorogé puis pérennisé, autorise la DGFiP et l'administration des douanes à collecter automatiquement les contenus librement accessibles sur les plateformes en ligne. Cette collecte, encadrée par la CNIL et par le Conseil constitutionnel (décision n° 2019-796 DC du 27 décembre 2019), cible spécifiquement la lutte contre l'activité occulte (annonces de vente répétées sans déclaration d'activité), les fausses déclarations de domicile et les discordances ostentatoires entre revenus déclarés et signes extérieurs de richesse. Le dispositif a fait l'objet d'un bilan d'étape par la CNIL en 2024, dont les conclusions sont publiquement accessibles.

La mobilité internationale comme champ d'application parmi d'autres. Les sources publiques montrent que la mobilité internationale constitue un champ d'application des modèles, sans pour autant qu'il soit le plus important quantitativement. Les indicateurs exploités sont ceux qui résultent des dispositions de l'article 4 B du Code général des impôts (foyer, séjour principal, activité professionnelle à titre principal, centre des intérêts économiques) recoupés avec les données détenues par l'administration : maintien d'abonnements ou d'utilités au nom du contribuable, scolarisation des enfants en France, durée et fréquence des séjours reconstituée à partir des données disponibles, mandats sociaux conservés, perception de revenus de source française disproportionnés par rapport aux revenus étrangers déclarés. L'article 61 de la loi de finances pour 2025 a porté à dix ans le délai de reprise en cas de fausse domiciliation pour l'impôt sur le revenu, l'impôt sur la fortune immobilière et les droits de mutation à titre gratuit, sans pour autant modifier les critères algorithmiques sous-jacents. Il s'agit d'un domaine technique parmi d'autres, dont le traitement obéit aux mêmes règles d'atypie statistique que les autres champs du contrôle.

Les signaux de fiabilité de la déclaration. Au-delà des signaux d'anomalie substantielle, le modèle exploite également des indicateurs de fiabilité formelle de la déclaration : dépôts tardifs récurrents, rectifications spontanées répétées sur les mêmes postes, demandes de dégrèvement contentieuses fréquentes, recours systématiques à des extensions de délai. Ces indicateurs ne traduisent en eux-mêmes aucune fraude, mais ils orientent les ressources de contrôle vers les dossiers où l'investigation a statistiquement le plus de chances d'aboutir à des rectifications significatives. Cette logique d'efficience est explicitement assumée par la DGFiP dans ses documents stratégiques.

D. Les seuils institutionnels de surveillance permanente : DFE, infra-DFE et DTFE

Une dimension institutionnelle indépendante du scoring algorithmique. Au-delà du ciblage statistique conduit par les modèles CFVR et GALAXIE, l'organisation administrative du contrôle fiscal repose sur une seconde grille, ancienne et stable, qui définit pour chaque contribuable un service de rattachement en fonction de seuils de revenu et de patrimoine. Cette segmentation, formalisée par la circulaire DGFiP CF1/2014/10/9600 du 9 octobre 2014 portant généralisation des Pôles de contrôle des revenus et du patrimoine (PCRP), par les commentaires administratifs publiés au Bulletin officiel des finances publiques (BOI-CF-DG-20) et par les annexes successives du document de politique transversale relatif à la lutte contre l'évasion fiscale annexé au projet de loi de finances, est documentée à droit constant. Elle n'a pas vocation à demeurer secrète : elle conditionne l'affectation des moyens humains du contrôle.

Les trois strates et leurs seuils. La première catégorie, dite « infra-DFE » (infra-Dossier à Fort Enjeu), regroupe les foyers fiscaux dont le revenu brut annuel se situe entre 180 000 et 270 000 euros environ. La deuxième catégorie, les Dossiers à Fort Enjeu (DFE), couvre les foyers dont le revenu brut excède 270 000 euros, seuil porté à 500 000 euros lorsque le cumul des traitements, salaires et pensions représente l'essentiel des revenus, ou dont l'actif brut imposable à l'impôt sur la fortune (anciennement ISF, désormais IFI dans ses contours immobiliers) excède 2,5 millions d'euros. La troisième catégorie, dite des Dossiers à Très Fort Enjeu (DTFE), correspond aux foyers présentant un revenu brut supérieur à 2 millions d'euros ou un actif brut imposable supérieur à 15 millions d'euros ; ce portefeuille relève depuis septembre 2011 de la compétence exclusive de la Direction nationale des vérifications de situations fiscales (DNVSF), conformément aux orientations détaillées dans les annexes du projet de loi de finances pour 2019.

La logique sous-jacente : la rémunération salariée bénéficie d'une présomption de fiabilité. Le double seuil 270 000 / 500 000 euros pour la catégorie DFE n'est pas un détail technique. Il traduit une orientation forte de la politique de contrôle : la rémunération versée par un tiers, soumise au prélèvement à la source et reflétée dans la déclaration sociale nominative transmise par l'employeur à l'URSSAF, présente un risque résiduel de sous-déclaration très faible. À l'inverse, la rémunération de dirigeant versée par sa propre structure, les bénéfices non commerciaux ou les revenus de capitaux mobiliers présentent statistiquement un risque d'optimisation ou d'inexactitude plus élevé, justifiant une surveillance dès le seuil inférieur. Cette distinction emporte des conséquences pratiques pour la structuration des rémunérations, et notamment pour les configurations holding-personnel où la qualification de la rémunération peut basculer un contribuable d'une strate à l'autre.

La bascule de 2017-2018 : de l'examen triennal systématique à l'examen piloté par les risques. Jusqu'à la fin de l'année 2017, les Dossiers à Fort Enjeu faisaient l'objet d'un examen triennal systématique sur pièces, conduit selon la méthode du contrôle corrélé revenus/patrimoine, calé sur le délai de reprise de l'article L. 169 du Livre des procédures fiscales. Le document de politique transversale annexé au projet de loi de finances pour 2019 reconnaît expressément cette évolution : la sélection des dossiers à examiner approfondi parmi les DFE est désormais pilotée par les requêtes d'analyse-risque produites par la Mission requêtes et valorisation, ce qui permet, selon les termes mêmes de la note d'orientation citée dans les annexes du PCRP, un « contrôle allégé maîtrisé d'un DFE quand ce dernier a déjà été contrôlé lors de la précédente période triennale et que sa situation n'a pas changé ». L'examen n'est donc plus systématiquement triennal ; il reste régulier, et chaque foyer DFE demeure inscrit en permanence au portefeuille du PCRP de son département de rattachement.

Le cas particulier des DTFE et l'effet de stock. Le portefeuille DTFE de la DNVSF conserve, en revanche, une logique de suivi continu, sans cadence prédéterminée mais avec un vérificateur attitré qui connaît personnellement le dossier. Une caractéristique notable de cette catégorie tient à ce que nous qualifions d'effet de stock : un contribuable entré dans le périmètre DTFE en raison de l'importance de son patrimoine ou de ses revenus n'en sort pas mécaniquement lorsque ses flux annuels redescendent. Une cession d'entreprise suivie d'un passage à des revenus du capital plus modérés ne fait pas perdre la qualification, qui s'apprécie au regard du stock patrimonial et, le cas échéant, de la notoriété. Cette donnée est particulièrement pertinente pour les contribuables en post-cession ou en transition patrimoniale, qui demeurent rattachés à la DNVSF parisienne pendant plusieurs années après l'opération.

Articulation avec le ciblage algorithmique. Les deux grilles, institutionnelle et algorithmique, ne s'opposent pas mais se superposent. La grille institutionnelle détermine quel service de contrôle est compétent et garantit une surveillance permanente des foyers concernés ; le ciblage algorithmique détermine, au sein de chaque portefeuille, quels dossiers seront approfondis prioritairement. Pour un foyer DFE, l'inscription au portefeuille PCRP signifie un contrôle sur pièces régulier (vérification annuelle de la cohérence des déclarations, croisements automatiques avec les sources tierces) assorti d'un risque d'approfondissement (demande d'informations, demande d'éclaircissements, demande de justifications, voire engagement d'un examen contradictoire de situation fiscale personnelle) déclenché par tout signal d'atypie significatif. La sécurité du dossier déclaratif s'apprécie donc dans la durée, et non à l'horizon d'un éventuel contrôle exceptionnel.

III. Conséquences pratiques : revue préventive, rectification spontanée et stratégie de conformité

A. La revue préventive : anticiper les signaux que l'algorithme détectera

L'inversion du raisonnement. La connaissance de la grille de ciblage permet d'inverser le raisonnement traditionnel : plutôt que d'attendre la notification d'un examen pour reconstituer la justification d'une situation déclarative, le contribuable et son conseil peuvent identifier en amont les configurations susceptibles de produire un signal d'atypie et préparer la documentation correspondante. Cette démarche, parfois qualifiée de revue fiscale préventive, n'a rien d'une dissimulation : elle consiste à anticiper les questions que l'administration posera et à documenter les réponses pendant que la mémoire des opérations est encore vive. Le coût marginal d'une telle revue est sans commune mesure avec celui d'une réponse improvisée à une demande de justifications adressée plusieurs années après les faits.

Le périmètre d'examen recommandé. Une revue préventive complète couvre l'ensemble du dossier déclaratif sur le délai de reprise applicable, c'est-à-dire trois ans pour l'impôt sur le revenu de droit commun (article L. 169 du LPF), six ans en cas d'activité occulte ou de non-déclaration d'avoirs étrangers (article L. 169 alinéa 4), et désormais dix ans en cas de fausse domiciliation pour l'IR, l'IFI et les droits de mutation à titre gratuit. Elle examine successivement la cohérence interne des déclarations, la concordance avec les sources tierces accessibles (extraits bancaires, relevés de FICOBA obtenus par exercice du droit d'accès, comptes-rendus de sociétés détenues), et la traçabilité des opérations atypiques. Les zones traditionnellement à risque que sont les comptes courants d'associés, les flux entre patrimoine privé et patrimoine professionnel, les mouvements transfrontières et les régimes de faveur (Dutreil, apport-cession, démembrement) méritent une attention particulière.

La documentation comme bouclier. En matière de contrôle fiscal, ce n'est pas la légitimité économique d'une opération qui en garantit la sécurité, mais la capacité à en démontrer la légitimité au moment où la question sera posée. Un compte courant d'associé d'un million d'euros adossé à un crédit-vendeur dûment formalisé est inattaquable ; le même compte courant sans acte de cession produit ni convention de prêt formalisée devient un objet de discussion contentieuse, quand bien même son origine serait parfaitement licite. La leçon vaut pour toute opération de structuration : la formalisation contemporaine de l'opération est la première ligne de défense, et c'est précisément cette formalisation que la revue préventive vise à objectiver.

B. La rectification spontanée : un outil sous-utilisé

Le régime de l'article L. 62 du LPF. Lorsque la revue préventive révèle une omission ou une inexactitude significative, le contribuable dispose d'un outil puissant et largement sous-utilisé : la déclaration rectificative spontanée. Le mécanisme de l'article L. 62 du Livre des procédures fiscales, étendu et assoupli par la loi du 10 août 2018 pour un État au service d'une société de confiance (loi ESSOC), permet de bénéficier d'une réduction substantielle des intérêts de retard (30 pour cent de réduction si la rectification intervient spontanément avant tout acte d'instruction). Cette réduction est ouverte tant que l'administration n'a pas engagé de procédure de contrôle sur la période concernée, et tant que le contribuable n'est pas tenu à régularisation par une mise en demeure préalable.

L'articulation avec le verrou de Bercy. La loi du 23 octobre 2018 relative à la lutte contre la fraude a modifié l'article L. 228 du LPF en introduisant une obligation de transmission automatique au parquet des dossiers présentant les caractéristiques les plus graves (droits supérieurs à 100 000 euros assortis de pénalités exclusives de bonne foi). La rectification spontanée intervenue avant l'engagement d'une procédure de contrôle écarte cette transmission automatique : c'est l'un des intérêts majeurs de la régularisation préventive pour les dossiers significatifs. La doctrine administrative (BOI-CF-INF-40-10-10) précise les conditions de cette articulation.

Le calcul économique de la rectification. La rectification spontanée ne se conçoit cependant qu'au terme d'une analyse coût-bénéfice rigoureuse. Le coût comprend les droits supplémentaires dus, les intérêts de retard réduits, et le risque résiduel d'examen ultérieur sur d'autres exercices ou d'autres impôts. Le bénéfice tient à l'écart entre cette charge et celle que produirait une rectification contradictoire ultérieure, avec des pénalités potentielles de 40 pour cent pour manquement délibéré, de 80 pour cent pour manœuvres frauduleuses, et le risque pénal pour les dossiers les plus significatifs. Dans la grande majorité des situations où une atypie est identifiée par la revue préventive, la rectification spontanée présente un rapport coût-bénéfice favorable, à condition d'être structurée avec le concours d'un praticien expérimenté.

C. Recommandations pratiques : construire une stratégie de conformité durable

Documenter au fil de l'eau plutôt que reconstituer a posteriori. La règle d'or, pour tout contribuable dont les revenus ou le patrimoine atteignent un seuil significatif, est de documenter chaque opération atypique au moment où elle se produit. Un acte de cession entre proches, un apport en compte courant, un transfert de résidence, un montage Dutreil, ne devraient jamais reposer sur la seule mémoire des protagonistes. La note interne, le mémorandum d'opération, l'échange de courriels conservé, l'attestation contemporaine de l'expert-comptable ou de l'avocat, constituent autant d'éléments dont la valeur probatoire augmente avec l'ancienneté de l'opération. Le coût de cette discipline documentaire est dérisoire au regard de la sécurité qu'elle procure.

Cartographier ses propres signaux d'atypie. Le second réflexe utile est de tenir, pour chaque exercice, une cartographie sommaire des configurations susceptibles de produire un signal dans la grille décrite ci-dessus. Cette cartographie n'a pas vocation à être exhaustive ni à dissimuler quoi que ce soit : elle sert à identifier les points sur lesquels une demande de justifications pourrait être adressée, et à vérifier que la documentation correspondante est disponible. Pour un contribuable détenant une holding patrimoniale, exerçant une activité indépendante et percevant des revenus de source étrangère, cette cartographie tient en une page mais évite des heures de reconstitution sous la pression d'une procédure.

Anticiper plutôt que subir l'évolution des outils. La trajectoire technologique de la DGFiP est clairement orientée : la part des contrôles ciblés algorithmiquement continuera de croître, l'intégration de l'intelligence artificielle générative dans l'instruction des dossiers est déjà engagée comme l'a révélé le rapport du Sénat sur l'IA dans le service public (rapport thématique n° 491, mars 2024), et les sources externes intégrées au modèle s'enrichissent à chaque exercice (DAC 8 sur les actifs numériques entrée en application au 1er janvier 2026, registres européens des bénéficiaires effectifs interconnectés, échange automatique entre les administrations sociales et fiscales). Le contribuable qui anticipe cette trajectoire en structurant sa conformité plutôt qu'en réagissant ponctuellement aux interrogations administratives bénéficie d'un avantage durable.

Conclusion

Le contrôle fiscal français a basculé en moins d'une décennie d'une logique d'enquête ponctuelle à une logique de programmation statistique. Le code source du moteur n'est pas public, et il ne le sera pas, mais les éléments officiels disponibles, des arrêtés ministériels aux délibérations CNIL en passant par les rapports parlementaires et la doctrine universitaire, suffisent à reconstituer avec une précision raisonnable la grille des signaux d'atypie exploités par les modèles. Cette grille, loin d'être un instrument de défiance vis-à-vis de l'administration, constitue pour le contribuable et son conseil un outil de pilotage de la conformité.

Notre analyse de praticien conduit à une conviction tranchée : le contribuable bien informé n'est pas celui qui craint l'algorithme, mais celui qui en comprend la logique pour structurer son dossier déclaratif en conséquence. La revue préventive et, le cas échéant, la rectification spontanée sont les outils privilégiés de cette stratégie. Ils permettent de transformer une exposition latente en sécurité documentée, et de garder la maîtrise du calendrier au lieu de la subir.

Notre recommandation est claire : tout contribuable dont la situation comporte une dimension internationale, un patrimoine structuré par interposition de sociétés, ou des revenus d'origine plurielle, devrait conduire une revue préventive de son dossier déclaratif tous les deux à trois ans, en s'appuyant sur les sources publiques décrites ici pour identifier les signaux susceptibles d'orienter le modèle de ciblage. Le coût de cette discipline est marginal ; sa contrepartie est la sécurité juridique et fiscale durable du contribuable et de sa famille.

Questions fréquentes

Le code source de l'algorithme de ciblage des contrôles fiscaux est-il public ?

Non. La DGFiP a publié en open source le code de calcul de plusieurs impôts (impôt sur le revenu depuis 2016, taxe d'habitation, taxe foncière, IFI), conformément aux exigences de la loi pour une République numérique du 7 octobre 2016. En revanche, le code source du Ciblage de la fraude et valorisation des requêtes (CFVR) et celui des applications connexes (GALAXIE, Foncier innovant, PILAT) ne sont pas publiés. L'administration invoque les exceptions de l'article L. 311-5 du CRPA, tenant à la sécurité publique et à la recherche des infractions. Cette position n'est pas spécifique à la France : aucune administration fiscale au monde ne publie le code de ses moteurs de ciblage.

Sur quelles sources peut-on alors fonder une analyse du ciblage algorithmique ?

Plusieurs sources publiques permettent de reconstituer la grille des signaux exploités par les modèles. Les arrêtés portant création des traitements (notamment arrêté du 21 février 2014 sur le CFVR, arrêté du 14 septembre 2017 sur son extension aux personnes physiques, arrêté du 11 mars 2022 sur GALAXIE) décrivent les finalités et les catégories de données. Les délibérations de la CNIL précisent les garanties et les contours du dispositif. Le rapport du Sénat Carcenac-Nougein de 2020 et les annexes annuelles du projet de loi de finances livrent des indicateurs précis. La doctrine universitaire (RFFP n° 153, Revue de droit fiscal) complète utilement ces sources officielles.

Quelle proportion des contrôles fiscaux est aujourd'hui issue du ciblage algorithmique ?

D'après les chiffres publiés par la DGFiP dans ses rapports d'activité successifs, la part des contrôles fiscaux des entreprises programmés par l'analyse de données a progressé de 13 pour cent en 2018 à plus de 50 pour cent à partir de 2023. L'objectif initial fixé pour 2022 était de 50 pour cent. Pour les particuliers, la proportion est plus difficile à quantifier dans le détail mais suit une trajectoire comparable. Les rendements financiers du datamining sont passés de 785 millions d'euros en 2019 à plusieurs milliards d'euros en cumul aujourd'hui.

Un score d'atypie élevé signifie-t-il que le contribuable a commis une fraude ?

Non. Le score d'atypie ne caractérise aucune fraude : il signale seulement un écart statistique par rapport à un comportement de référence. Les motifs légitimes de divergence sont innombrables : phase de démarrage d'une activité, sinistre, héritage, restructuration patrimoniale, mobilité professionnelle. La DGFiP indique elle-même dans ses documents que le CFVR « ne procède en aucun cas à la caractérisation d'une fraude fiscale mais constate simplement une anomalie ou une irrégularité possible ». L'enjeu pratique est de pouvoir documenter rapidement la justification économique ou juridique du signal détecté.

La rectification spontanée présente-t-elle toujours un intérêt ?

Dans la grande majorité des situations où une atypie significative est identifiée par une revue préventive, oui. La déclaration rectificative spontanée, fondée sur l'article L. 62 du LPF, permet de bénéficier d'une réduction de 30 pour cent des intérêts de retard et d'écarter la transmission automatique au parquet prévue par l'article L. 228 du LPF pour les dossiers les plus significatifs. Le calcul coût-bénéfice dépend toutefois de la nature de l'anomalie et du risque d'examen contradictoire ultérieur ; il mérite d'être conduit avec un praticien expérimenté avant tout dépôt.

Le contribuable peut-il accéder aux indicateurs ayant déclenché son contrôle ?

Le droit d'accès aux règles définissant le traitement algorithmique ayant servi à une décision individuelle est consacré par les articles L. 311-3-1 et R. 311-3-1-1 du CRPA. En pratique, l'administration communique les règles générales du traitement mais oppose le secret des moyens de détection pour les paramètres spécifiques de pondération. Cette position a été validée par la Commission d'accès aux documents administratifs (CADA) à plusieurs reprises. L'angle contentieux reste ouvert mais reste à manier avec précaution, dans le cadre plus large des droits de la défense.

Qu'est-ce qu'un Dossier à Fort Enjeu (DFE) et quels en sont les seuils ?

La qualification de Dossier à Fort Enjeu, formalisée par la circulaire DGFiP du 9 octobre 2014 portant généralisation des Pôles de contrôle des revenus et du patrimoine, s'applique aux foyers fiscaux dont le revenu brut annuel excède 270 000 euros (seuil porté à 500 000 euros lorsque les traitements, salaires et pensions représentent l'essentiel des revenus) ou dont l'actif brut imposable à l'impôt sur la fortune excède 2,5 millions d'euros. Au-dessus de 2 millions d'euros de revenu brut ou de 15 millions d'euros d'actif brut, le foyer entre dans la catégorie des Dossiers à Très Fort Enjeu (DTFE) suivis par la Direction nationale des vérifications de situations fiscales (DNVSF). La catégorie intermédiaire « infra-DFE » couvre les revenus bruts compris entre 180 000 et 270 000 euros.

Les Dossiers à Fort Enjeu font-ils toujours l'objet d'un contrôle triennal systématique ?

Non, plus depuis 2017-2018. Le document de politique transversale relatif à la lutte contre l'évasion fiscale annexé au projet de loi de finances pour 2019 reconnaît explicitement que l'examen triennal systématique des DFE par contrôle corrélé revenus/patrimoine a été remplacé par une sélection pilotée par les requêtes d'analyse-risque. Les foyers DFE restent inscrits en permanence au portefeuille des Pôles de contrôle des revenus et du patrimoine de leur département, mais l'examen approfondi triennal n'est plus automatique : il est désormais déclenché par les signaux d'atypie identifiés par les modèles statistiques, ce qui n'exclut nullement un contrôle sur pièces régulier de cohérence chaque année.

Points clés à retenir

Le code source de l'algorithme de ciblage des contrôles fiscaux (CFVR) n'est pas public, mais les arrêtés réglementaires, les délibérations CNIL, les rapports parlementaires et la doctrine permettent de reconstituer la grille des signaux exploités.
Plus de 50 pour cent des contrôles fiscaux des entreprises sont aujourd'hui issus du ciblage par datamining, selon les rapports d'activité publiés par la DGFiP.
Les signaux exploités se répartissent en trois familles principales : incohérences intra-déclaratives, écarts avec les données tiers-déclarantes (FICOBA, FICOVIE, DSN, CRS/DAC), et indices issus de sources externes ouvertes (article 154 LF 2020, Foncier innovant).
L'organisation administrative du contrôle repose en parallèle sur des seuils institutionnels : Dossiers à Fort Enjeu (revenu brut > 270 000 euros, ou 500 000 euros pour les salariés/retraités, ou patrimoine > 2,5 M€), Dossiers à Très Fort Enjeu (> 2 M€ de revenu ou > 15 M€ de patrimoine), suivis respectivement par les PCRP et la DNVSF.
Un score d'atypie ne caractérise pas une fraude : il signale un écart statistique nécessitant une justification documentée par le contribuable lorsque l'administration en demande l'éclaircissement.
La revue préventive et, le cas échéant, la rectification spontanée fondée sur l'article L. 62 du LPF constituent les outils privilégiés de la stratégie de conformité face au contrôle algorithmique.