Йеспер Твейт,
Харальд Арліен,
Сяргей Пліс і інш.
JAMA Neurology 2023 Aug 1, Volume 80, Number 8, p805-812
Ці можна навучыць мадэль штучнага інтэлекту (ІІ) інтэрпрэтаваць стандартныя клінічныя электраэнцэфалаграмы (ЭЭГ) з дакладнасцю, эквівалентнай дакладнасці спецыялістаў?
У гэтым дыягнастычным даследаванні на 30493 ЭЭГ была навучана мадэль штучнага інтэлекту (SCORE-AI), спачатку для таго, каб аддзяляць нармальныя ЭЭГ ад анамальных, а затым для класіфікавання анамальных ЭЭГ як: ЭЭГ з факальнай эпилептиформной актыўнасцю, ЭЭГ з фокальнымі неэпілептыформнай зменамі і ЭЭГ з дыфузнымі неэпилептиформными зменамі. SCORE-AI была валідаваная з выкарыстаннем трох незалежных набораў дадзеных, якія складаюцца з 9945 ЭЭГ, не скарыстаных для навучання; SCORE-AI змагла дасягнуць дыягнастычнай дакладнасці, падобнай спецыялістам.
Вынікі гэтага даследавання дазваляюць выказаць здагадку, што прымяненне SCORE-AI можа дапамагчы палепшыць якасць дапамогі пацыентам у раёнах, дзе экспертныя навыкі чытання ЭЭГ цяжкадаступныя, а таксама для павышэння эфектыўнасці і ўзаемаўзгодненасці інтэрпрэтацыі ЭЭГ ў спецыялізаваных цэнтрах.
Актуальнасць
Электраэнцэфалографа з’яўляецца вельмі важным метадам абследавання ў неўралогіі. Інтэрпрэтацыя электраэнцэфалаграфіі патрабуе наяўнасці спецыялістаў з адпаведнымі ведамі і навыкамі, што, на жаль, у многіх кутках свету недаступна. У ІІ ёсць патэнцыял для задавальнення гэтых патрэбаў. Раней распрацаваныя мадэлі ІІ тычацца толькі абмежаваных аспектаў інтэрпрэтацыі ЭЭГ, такіх як адрозненне анамальнай ЭЭГ ад нармальнай або выяўленне эпілептыформнай актыўнасці. Неабходна комплексная, цалкам аўтаматызаваная інтэрпрэтацыя стандартнай ЭЭГ на аснове штучнага інтэлекту, прыдатная для клінічнай практыкі.
Мэта
Распрацаваць і валідаваць мадэль ІІ (Standardized Computer-based Organized Reporting of EEG-Artificial Intelligence [SCORE-AI]) з магчымасцю адрозніваць анамальныя ЭЭГ ад нармальных і класіфікаваць анамальныя ЭЭГ па катэгорыях, важным для прыняцця актыўнасцю, ЭЭГ з генералізованной эпилептиформной актыўнасцю, ЭЭГ з факальнымі неэпілептыформнай зменамі і ЭЭГ з дыфузнымі неэпилептиформными зменамі.
Дызайн даследавання
У гэтым шматцэнтравым даследаванні дыягнастычнай дакладнасці была распрацавана і валідаваная мадэль згортачнай нейронавай сеткі SCORE-AI з выкарыстаннем ЭЭГ, запісаных у перыяд з 2014 па 2020 гады. Дадзеныя аналізаваліся з 17 студзеня 2022 года па 14 лістапада 2022 года. Усяго ў набор дадзеных для распрацоўкі, анатаваны 17 экспертамі, было ўключана 30493 запісы пацыентаў, накіраваных на ЭЭГ. У набор дадзеных распрацоўкі ўключаліся ЭЭГ пацыентаў ва ўзросце старэй 3 месяцаў на момант запісу ЭЭГ, якія не знаходзіліся ў крытычным стане. SCORE-AI была валідаваная з выкарыстаннем трох незалежных набораў тэставых дадзеных: шматцэнтровага набору дадзеных з 100 рэпрэзентатыўных ЭЭГ, ацэненых 11 экспертамі, одноцентрового набору дадзеных з 9785 ЭЭГ, ацэненых 14 экспертамі, а ІІ — набор дадзеных з 60 ЭЭГ з вонкавым эталонным стандартам. Ні адзін пацыент, які адказвае крытэрам адбору, не быў выключаны.
Асноўныя канчатковыя кропкі і параметры
Дыягнастычная дакладнасць, адчувальнасць і спецыфічнасць працы SCORE-AI па параўнанні з ацэнкай экспертаў і вонкавым эталонным стандартам звычайных клінічных эпізодаў пацыентаў, запісаных падчас відэа-ЭЭГ.
Вынікі
Характарыстыкі набораў дадзеных ЭЭГ: набор дадзеных для распрацоўкі (N = 30493; 14980 мужчын; сярэдні ўзрост 25,3 года [95% ДІ, 1,3-76,2 года]), шматцэнтравы набор тэставых дадзеных (N = 100; 61 ; сярэдні ўзрост 25,8 года [95% ДІ, 4,1-85,5 гадоў]), аднацэнтравы набор тэставых дадзеных (N = 9785; 5168 мужчын; сярэдні ўзрост 35,4 года [95% ДІ, 0,6-87,4 года]) і набор тэставых дадзеных з вонкавым эталонным стандартам (N = 60; 27 мужчын; сярэдні ўзрост 36 гадоў [95% ДІ, 3-75 гадоў]). SCORE-AI дасягнула высокай дакладнасці: плошча пад ROC-крывой складала ад 0,89 да 0,96 для розных катэгорый парушэнняў на ЭЭГ, а прадукцыйнасць была аналагічная такой у людзей-спецыялістаў. Параўнальны аналіз з трыма раней апублікаванымі мадэлямі ІІ абмяжоўваўся параўнаннем здольнасці выяўляць эпілептыформнай актыўнасць. Дакладнасць SCORE-AI (88,3%; 95% ДІ, 79,2-94,9%) была значна вышэй, чым у трох раней апублікаваных мадэляў (P <0,001), і аналагічная дакладнасці людзей-спецыялістаў.
Высновы і значнасць
У гэтым даследаванні SCORE-AI, цалкам аўтаматызавана інтэрпрэтуючы стандартныя ЭЭГ, дасягнула ўзроўню чалавека-эксперта. Прымяненне SCORE-AI можа палепшыць дыягностыку і якасць аказваемай медыцынскай дапамогі ў рэгіёнах з недахопам экспертаў у электраэнцэфалографа, а таксама павысіць эфектыўнасць і ўзаемаўзгодненасць працы спецыялізаваных эпілепталагічных цэнтраў.
doi:10.1001/jamaneurol.2023.1645
