Le Chief Digital and Artificial Intelligence Office (CDAO) a achevé avec succès un projet pilote du programme d'assurance CAIRT (Crowdsourced AI Red-Teaming) axé sur l'utilisation de chatbots à grand modèle de langage (LLM) dans le contexte de la médecine militaire. Le programme CAIRT aide le ministère de la défense à créer des approches ascendantes et participatives de l'assurance et de l'atténuation des risques liés à l'IA. Grâce au crowdsourcing, les projets sont en mesure de saisir d'importants volumes de données et d'impliquer un large éventail de parties prenantes.
Ce projet pilote CAIRT LLM a été mené par Humane Intelligence, une entreprise technologique qui crée une communauté de pratique autour des évaluations algorithmiques, en partenariat avec la Defense Health Agency (DHA) et le Program Executive Office, Defense Health Management Systems (PEO DHMS). Grâce à une méthodologie de red-teaming - utilisant des techniques adverses pour tester en interne la résilience du système - Humane Intelligence a été en mesure de découvrir efficacement les vulnérabilités spécifiques du système. En outre, le red-teaming attire des participants qui souhaitent s'engager dans les nouvelles technologies et, en tant que futurs bénéficiaires potentiels, ont la possibilité de contribuer à l'amélioration du système. Au printemps 2024, le CDAO a organisé un exercice CAIRT de grande valeur en utilisant les avantages financiers du red-teaming.
Dans le cadre d'un récent programme pilote, Humane Intelligence a utilisé le crowdsourcing red-teaming pour deux cas d'utilisation prometteurs dans le contexte de la médecine militaire : le résumé de notes cliniques et un chatbot pour des conseils médicaux. Plus de 200 participants, dont des prestataires cliniques et des analystes de la santé du DHA, de l'Uniformed Services University of the Health Sciences et des services, ont pris part à l'exercice, qui comparait trois LLM populaires. L'exercice a permis de mettre au jour plus de 800 résultats concernant des vulnérabilités et des biais potentiels liés à l'utilisation de ces capacités dans ces cas d'utilisation prospectifs. Cet exercice permettra d'obtenir des résultats reproductibles et évolutifs grâce au développement d'ensembles de données de référence qui pourront être utilisés pour évaluer les futurs fournisseurs et outils afin de vérifier qu'ils sont conformes aux performances attendues. En outre, ces résultats joueront un rôle clé dans l'élaboration des politiques et des meilleures pratiques du ministère de la défense pour une utilisation responsable de l'intelligence artificielle générative (GenAI), ce qui permettra en fin de compte d'améliorer les soins médicaux militaires. Si ces cas d'utilisation post-mission prospectifs incluent l'IA couverte telle que définie dans l'OMB M-24-10, ils suivront toutes les pratiques de gestion des risques requises.
"L'utilisation de la GenAI à ces fins au sein du ministère de la défense n'en étant qu'aux premiers stades du pilotage et de l'expérimentation, ce programme joue un rôle essentiel de pionnier en générant une multitude de données d'essai, en mettant au jour des domaines à prendre en considération et en validant des options d'atténuation qui façonneront la recherche, le développement et l'assurance des systèmes de GenAI susceptibles d'être déployés à l'avenir", a déclaré le secrétaire général de la Commission européenne. a indiqué que le CDAO était le chef de file de l'initiative, Dr. Matthew Johnson.
Comme le récent projet pilote et d'autres l'ont montré, la poursuite des essais des systèmes LLM et d'IA dans le cadre du programme CAIRT Assurance sera essentielle pour accélérer la cellule de capacité d'IA rapide du CDAO, améliorer l'efficacité de la mission GenAI et contribuer à une confiance justifiée dans tous les cas d'utilisation du ministère de la défense.
À PROPOS DE LA CDAO
Lancé en juin 2022, le CDAO se consacre à l'intégration et à l'optimisation des capacités d'IA au sein du DoD. Le bureau est chargé d'accélérer l'adoption des données, de l'analytique et de l'IA au sein du DoD, en permettant à l'infrastructure numérique du département et à l'adoption de politiques de fournir des solutions évolutives basées sur l'IA pour les cas d'utilisation d'entreprise et interarmées et de protéger la nation contre les menaces actuelles et émergentes.
Pentagone/ gnews- RoZ
PHOTO ILLUSTRATIVE - pixabay