La CNIL explore la traçabilité des modèles d’IA en source ouverte

La CNIL explore la traçabilité des modèles d’IA en source ouverte

La CNIL a dévoilé, le 18 décembre 2025, un démonstrateur permettant d'explorer la généalogie des modèles d’IA publiés en source ouverte. Cet outil vise à mieux comprendre les liens entre les modèles existants et à identifier les modèles susceptibles de contenir des données personnelles, facilitant ainsi l'exercice des droits prévus par le RGPD.

Dans l'écosystème open source, les modèles d’IA sont souvent repris, modifiés et partagés à nouveau. Cette dynamique engendre une généalogie complexe, dans laquelle un modèle peut avoir de multiples ascendants et descendants. Comprendre cette filiation est crucial, notamment pour déterminer si des données personnelles ont pu être reprises dans des modèles dérivés.

Le démonstrateur mis en ligne par la CNIL permet de visualiser ces relations, à partir de données issues de la plateforme HuggingFace. Il s’agit d’une première étape vers une plus grande transparence dans l’usage des données, particulièrement dans un contexte où les modèles génératifs sont susceptibles de "régurgiter" des données de leur base d’entraînement.

Cette initiative s’inscrit dans une démarche d’expérimentation réglementaire. La CNIL souhaite tester concrètement comment les droits d’accès, d’opposition ou d’effacement pourraient être exercés face à un modèle d’IA ayant mémorisé des données personnelles. À terme, elle pourrait contribuer à une meilleure conformité des projets open source au RGPD, tout en promouvant la responsabilité des acteurs de l’IA.

Source : CNIL

Read more