Publication details

Detekce ložiskových změn plicního parenchymu pomocí hlubokého učení v klinickém prostředí s nízkou prevalencí

Authors

KVAK Daniel

Year of publication 2023
Type Appeared in Conference without Proceedings
Citation
Description Rychlý rozvoj umělé inteligence (AI) v lékařských zobrazovacích metodách přinesl zajímavou perspektivu zvýšení přesnosti a efektivity diagnostiky. Jednou z aktivních oblastí výzkumu je využití algoritmů automatické detekce založených na hlubokém učení ve skiagrafii hrudníku, které prokázaly obrovský potenciál při identifikaci různých nálezů, jako je tuberkulóza nebo plicní léze. Navzdory slibným výsledkům v kontrolovaných simulovaných podmínkách s vysokou prevalencí, které se obvykle vyskytují ve výzkumných podmínkách, však existují obavy ohledně použití těchto systémů v reálném klinickém provozu. Pro účely naší studie jsme shromáždili 956 RTG snímků hrudníku z každodenní klinické praxe z městské nemocnice Havířov. Dva centrální čtenáři s přístupem k doplňujícím vyšetřením pacienta dosáhli zaslepeně shody (ground truth) u 901 snímků, z nichž u 21 bylo potvrzeno, že obsahují jednu nebo více plicních lézí (prevalence: 2,3 %), a u 880 bylo potvrzeno, že plicní léze neobsahují. Šest radiologů s různou úrovní odbornosti bylo požádáno, aby provedli retrospektivní analýzu těchto snímků. Následně byl výkon každého radiologa porovnán se stanoveným ground truth a algoritmem Carebot AI CXR (2.0.20-v2.01). Navržený algoritmus vykázal vyšší senzitivitu (Se 0,905 (0,715-0,978)) než všichni srovnávaní radiologové (RAD 1 0,238 (0,103-0,448), p < 0,001, RAD 2 0,333 (0,170-0,544), p < 0,001, RAD 3 0,524 (0,324-0,717), p < 0,001, RAD 4 0,619 (0,410-0,794), p < 0,001, RAD 5 0,667 (0,456-0,83), p < 0,001, RAD 6 0,619 (0,41-0,794), p < 0,001) a tento rozdíl byl statisticky významný. Specificita algoritmu (Sp 0,893 (0,871-0,912)) byla významně nižší než u pěti srovnávaných radiologů (RAD 1 0,999 (0,994-1), p < 0,001, RAD 2 0,933 (0,915-0,948), p < 0,001, RAD 4 0,968 (0,955-0,978), p < 0,001, RAD 5 0,991 (0,982-0,996), p < 0,001, RAD 6 0,989 (0,979-0,994), p < 0,001), s výjimkou jednoho středně zkušeného radiologa, ale rozdíl nebyl statisticky významný (RAD 3 0,884 (0,861-0,904), p = 0,685). Výsledky této studie ukazují, že navrhovaný algoritmus byl schopen dosáhnout vysoké úrovně senzitivity a poměrně spolehlivé úrovně specificity i při použití v reálných podmínkách s nízkou prevalencí.

You are running an old browser version. We recommend updating your browser to its latest version.

More info