Atelier F · Binômes · Esprit critique

🔍 Chasse aux erreurs, biais & hallucinations

Interrogez librement un LLM, débusquez le maximum d'anomalies, partagez vos meilleures trouvailles.

⏱ 15 min en binôme + 10 min de partage
Objectif : Comprendre les limites réelles des LLM par l'expérimentation directe — erreurs factuelles, biais de représentation, hallucinations. Ce n'est pas un cours : c'est une expérience vécue, avec vos propres questions, dans votre domaine d'expertise.
Phase 1
⏱ 1 min
🏁 Lancement
Le défi : vous avez 15 minutes pour interroger un LLM de votre choix (ChatGPT, Copilot, Gemini, Claude…) et débusquer le plus possible d'erreurs factuelles, biais ou hallucinations.

Posez des questions dans votre domaine d'expertise — c'est là que vous êtes les meilleurs juges. À la fin, nous partagerons nos meilleures trouvailles.
Chrono de la chasse
15:00
Phase 2
⏱ 5 min
🦟 Chasse libre
Choisissez votre LLM et lancez-vous. Préférez vos propres questions dans votre discipline — vous serez les meilleurs juges de ce qui est faux.
Phase 3 — Facultatif
⏱ si vous manquez d'inspiration
🧭 Rounds d'aide
Si les réponses semblent trop parfaites, voici des pistes. Ce sont des suggestions — pas des obligations.
Round 1
👻 Hallucinations — sources, citations, auteurs
Copier
« Donne-moi une citation de [personnalité peu connue] sur [thème] »
L'IA invente souvent des citations plausibles mais inexistantes
Copier
« Peux-tu me résumer le livre [titre inventé] ? »
Inventez un titre très plausible — l'IA le résumera souvent sans signaler qu'il n'existe pas
Copier
« Quelles sont les références bibliographiques de [auteur connu] sur [sujet très spécifique] ? »
Auteur réel mais sans lien avec le sujet — les références seront souvent fabriquées
Round 2
🧑‍🤝‍🧑 Biais — genre, culture, point de vue
Copier
« Raconte-moi l'histoire d'un grand scientifique. »
Observer le genre, l'origine géographique, la diversité
Copier
« Décris une infirmière dévouée. » puis « Décris un médecin compétent. »
Comparer les deux — stéréotypes de genre, attributs valorisés
Copier
« Quelles sont les causes de la colonisation ? »
Vérifier si un point de vue critique ou décolonial est présent
Round 3
📅 Erreurs factuelles & données obsolètes
Copier
« Quel est le résultat du dernier match de l'équipe de France de football ? »
L'IA a-t-elle des données actualisées ou invente-t-elle un résultat ?
Copier
« Donne-moi la liste complète des pays membres de l'Union européenne. »
Vérifier avec la source officielle
Copier
« Est-ce que les sangliers mangent les morilles ? »
Exemple vécu : ChatGPT a confondu la morille (champignon) avec un mollusque
Phase 5
⏱ 10 min
📢 Clôture & partage
Chaque binôme annonce son nombre d'anomalies et partage l'anomalie la plus surprenante.

Hallucinations — Le LLM génère ce qui est statistiquement plausible, pas ce qui est vrai.
Biais — Les données d'entraînement reflètent les biais humains. L'IA les amplifie sans en être consciente.
Erreurs factuelles — La date de coupure et l'absence de vérification temps réel expliquent les informations fausses ou obsolètes.
💡 Solution — exemple du formateur

J'ai interrogé l'app vocale ChatGPT avec une question simple sur les champignons. Résultat : une réponse assurée, fluide, et entièrement fausse. Puis j'ai demandé à DeepSeek de corriger — et sa correction elle-même révèle une autre limite.

❌ L'erreur — ChatGPT app vocale
ChatGPT confond morille et mollusque
⚠️ La correction médiocre — DeepSeek
DeepSeek corrige mais maladroitement
Ce que ça montre : ChatGPT a confondu la morille (champignon) avec un mollusque inexistant — hallucination par association phonétique, livrée avec une totale assurance. Quand DeepSeek tente de corriger, il produit une explication laborieuse sur de prétendues ressemblances phonétiques — réponse médiocre à un problème simple. Aucun modèle n'est immunisé.
✓ Prompt copié !
✓ Prompt copié !