Il Chief Digital and Artificial Intelligence Office (CDAO) ha completato con successo un progetto pilota del Crowdsourced AI Red-Teaming (CAIRT) Assurance Program, incentrato sull'uso di chatbot con grandi modelli linguistici (LLM) nel contesto della medicina militare. Il programma CAIRT sostiene il Dipartimento della Difesa (DoD) nella creazione di approcci dal basso verso l'alto, basati sul crowdsourcing, per l'assicurazione dell'IA e la mitigazione del rischio dell'IA. Grazie al crowdsourcing, i progetti sono in grado di acquisire grandi volumi di dati e di coinvolgere un'ampia gamma di soggetti interessati.
Questo progetto pilota CAIRT LLM è stato condotto da Humane Intelligence, un'azienda tecnologica che sta creando una comunità di pratica intorno alle valutazioni algoritmiche, in collaborazione con la Defense Health Agency (DHA) e il Program Executive Office, Defense Health Management Systems (PEO DHMS). Attraverso una metodologia di red-teaming - che utilizza tecniche avversarie per testare internamente la resilienza del sistema - Humane Intelligence è stata in grado di scoprire efficacemente specifiche vulnerabilità del sistema. Inoltre, il red-teaming attira i partecipanti che desiderano confrontarsi con le nuove tecnologie e, in quanto potenziali futuri beneficiari, hanno l'opportunità di contribuire al miglioramento del sistema. In precedenza, nella primavera del 2024, il CDAO ha ospitato una preziosa esercitazione CAIRT utilizzando le ricompense finanziarie del red-teaming.
In un recente programma pilota, Humane Intelligence ha utilizzato il crowdsourced red-teaming per due promettenti casi d'uso nel contesto della medicina militare: la sintesi delle note cliniche e un chatbot per la consulenza medica. Più di 200 partecipanti, tra cui operatori clinici e analisti sanitari del DHA, della Uniformed Services University of the Health Sciences e dei servizi, hanno preso parte all'esercitazione, che ha messo a confronto tre popolari LLM. L'esercitazione ha portato alla luce più di 800 risultati relativi a potenziali vulnerabilità e pregiudizi legati all'uso di queste funzionalità in questi casi d'uso prospettici. Questo esercizio porterà a un risultato ripetibile e scalabile attraverso lo sviluppo di set di dati di riferimento che potranno essere utilizzati per valutare i fornitori e gli strumenti futuri per l'allineamento con le prestazioni previste. Inoltre, questi risultati svolgeranno un ruolo chiave nella definizione delle politiche e delle migliori pratiche del Dipartimento della Difesa per l'uso responsabile dell'intelligenza artificiale generativa (GenAI), portando in ultima analisi a un miglioramento dell'assistenza medica militare. Se questi casi d'uso prospettici post-missione includono l'IA coperta come definita nell'OMB M-24-10, seguiranno tutte le pratiche di gestione del rischio richieste.
"Poiché l'uso di GenAI per questi scopi all'interno del Dipartimento della Difesa è nelle prime fasi di pilotaggio e sperimentazione, questo programma sta agendo come un pioniere essenziale per generare una ricchezza di dati di prova, scoprire aree di considerazione e convalidare le opzioni di mitigazione che plasmeranno la futura ricerca, lo sviluppo e la garanzia dei sistemi GenAI che potrebbero essere distribuiti in futuro". ha preso atto della guida del CDAO per l'iniziativa, Dr. Matthew Johnson.
Come dimostrato dal recente pilota e da altri, la continua sperimentazione dei sistemi LLM e AI attraverso il programma CAIRT Assurance sarà fondamentale per accelerare la rapida cellula di capacità AI del CDAO, migliorare l'efficacia della missione GenAI e contribuire a una giustificata fiducia in tutti i casi d'uso del DoD.
SU CDAO
Lanciato nel giugno 2022, il CDAO è dedicato all'integrazione e all'ottimizzazione delle capacità di IA in tutto il Dipartimento della Difesa. L'ufficio è responsabile di accelerare l'adozione di dati, analisi e IA nel Dipartimento della Difesa, consentendo l'infrastruttura digitale del Dipartimento e l'adozione di politiche per fornire soluzioni scalabili basate sull'IA per casi d'uso aziendali e congiunti e proteggere la nazione dalle minacce attuali ed emergenti.
Pentagono/ gnews- RoZ
FOTO ILLUSTRATIVA - pixabay