Accélérer la création de modèles d’IA pour lutter contre la COVID-19 avec Element AI Orkestrator
Issam Laradji Issam Laradji
3 juillet 6 min

Accélérer la création de modèles d’IA pour lutter contre la COVID-19 avec Element AI Orkestrator

En collaboration avec The University of British Columbia (UBC), le Vancouver Coastal Health Research Institute (VCHRI), les radiologues du Vancouver General Hospital (VGH), Amazon Web Services (AWS) et SapienML, le chercheur postdoctoral Issam Laradji d’Element AI a contribué à ce projet pour développer un modèle d’intelligence artificielle (IA) à source ouverte pour l’analyse des infections de COVID-19 dans les tomodensitogrammes de la poitrine.

En tant que chercheur en IA, le potentiel d’application des méthodes d’apprentissage approfondi à la science médicale me passionne vraiment. Alors, lorsque j’ai été récemment invité à participer à un projet qui vise à utiliser l’IA pour diagnostiquer la COVID-19 à partir d’examens de TDM pulmonaires, j’ai sauté sur l’occasion. Dirigée par les docteurs Savvas Nicolaou et William Parker, tous deux de University of British Columbia (UBC), l’initiative a permis de collecter des centaines d’examens de TDM pulmonaires de patients dans le monde entier et a fait appel à des radiologues et des étudiants en médecine pour évaluer et étiqueter chacun d’entre eux. Une fois ces images correctement étiquetées, mes collaborateurs et moi les avons utilisées pour élaborer des modèles d’IA qui peuvent analyser de nouveaux examens de TDM pulmonaires sans qu’un expert médical ait à intervenir.

L’utilisation de l’IA pour trouver plus efficacement des modèles et des correspondances dans un grand nombre de tomodensitogrammes des poumons signifierait que les diagnostics pourraient potentiellement être faits plus rapidement et à moindre coût. Mais il n’est pas facile de développer ce genre de modèles d’IA et il faut disposer des bons outils pour changer les choses.

Element AI est une entreprise qui développe des solutions d’IA transformatrices pour concilier la collaboration entre les humains et les machines. Nos équipes de recherche fondamentale lancent constamment des expériences et des projets à forte intensité de calcul qui pourraient mettre à rude épreuve notre infrastructure informatique. Pour répondre aux besoins croissants de puissance de calcul et d’un meilleur accès à nos grappes d’UTG (GPU), nous avons développé Element AI Orkestrator, un logiciel qui gère activement l’allocation des ressources d’UTG. Dans cet article, je vais expliquer certains des obstacles auxquels nous avons été confrontés dans ce projet de recherche et comment Element AI Orkestrator nous a été indispensable pour nous aider à les surmonter.

Lorsque vous traitez un projet de cette envergure, l’un des défis les plus importants est de travailler avec des ensembles de données médicales, qui ont souvent des étiquettes de segmentation imparfaites. Les étiquettes de segmentation identifient les régions infectées sur une tranche particulière d’un examen de TDM et sont souvent incomplètes et très chargées. Les professionnels de la santé qui annotent ces images ont parfois des façons différentes d’étiqueter les régions infectées, ce qui peut entraîner des incohérences qui rendent difficile l’analyse par les modèles d’IA. Un autre défi est que l’étiquetage d’une seule tranche d’examen de TDM – qui est un modèle en 2D à une hauteur spécifique, dans ce cas, des poumons – peut prendre beaucoup de temps. Le résultat est que vous vous retrouvez avec des données annotées très limitées.


Pour ce projet, j’ai lancé des centaines d’expériences d’apprentissage profond, lourdes en calcul, tous les quelques jours. Cela a nécessité l’exécution d’un grand nombre de recherches par hyperparamètres; j’ai cherché dans une vingtaine d’architectures de modèles différentes et dans un éventail de tailles de lots, de fonctions de perte et de méthodes d’augmentation des données. Sans le soutien d’Element AI Orkestrator, la réalisation de ces expériences aurait été beaucoup plus difficile, voire impossible. En utilisant ce logiciel avec notre bibliothèque Python Haven, nous pouvons, avec quelques commandes simples, exécuter et gérer des milliers d’expériences en parallèle. Bien sûr, l’un des défis que pose la réalisation d’un nombre aussi élevé d’expériences est de comprendre lesquelles réussissent et lesquelles échouent.

Ork et Haven

Ces outils nous ont permis de suivre toutes nos expériences en même temps et de les organiser de manière à ce qu’il soit facile de les filtrer et d’interagir avec elles. Toutes les défaillances ont pu être regroupées afin que nous puissions étudier les registres pour comprendre pourquoi elles ont échoué, puis déboguer et relancer uniquement ces expériences spécifiques. Inversement, nous avons également pu identifier et extraire quelques expériences plus intéressantes parmi des milliers, affichées dans un tableau de bord et dans des graphiques générés dynamiquement qui ont permis d’évaluer facilement leurs performances. Finalement, j’ai pu passer à un petit sous-ensemble d’expériences qui ont été couronnées de succès. Somme toute, la plateforme a permis d’atteindre l’échelle nécessaire au projet et a également amélioré le flux de travail global, en éliminant une grande partie de l’ingénierie que j’aurais dû faire autrement, et en me permettant de lancer et de gérer efficacement un grand nombre d’expériences en parallèle.

C’était la première phase d’un projet qui, je l’espère, se poursuivra. Compte tenu du temps et des ressources que peut nécessiter l’étiquetage des images médicales, une voie que nous aimerions explorer, je pense, est de savoir comment nous pouvons tirer parti de l’apprentissage actif pour réduire la quantité de données dont nous avons besoin pour former nos modèles. Je me réjouis de continuer à collaborer à ce projet inventif qui, je l’espère, sauvera des vies et nous aidera à sortir de la crise du coronavirus.

Le financement de ce projet est assuré par le Community Health and Wellbeing Cloud Innovation Centre (UBC CIC) de l’UBC, alimenté par Amazon Web Services (AWS), ainsi que par l’AWS Diagnostic Development Initiative (DDI).