Искусственный интеллект в диагностике злокачественных новообразований кожи

Первый случай, когда писатель высказал предположение о том, что люди могут быть заменены разумными машинами, часто приписывают Аристотелю. В разделе своей работы “Политика" он утверждает, "Если бы каждое орудие могло выполнять свойственную ему работу само, по данному ему приказанию или даже его предвосхищая» (...) мастерам-ремесленникам не нужны были бы ни подчиненные, ни хозяева рабов" (Lagrandeur, 2020). Со времен Аристотеля человечество переживало непрерывную технологическую эволюцию, переходя от простых инструментов к современным компьютерам. На заре компьютерной эры исследователи изначально верили, что они могут достичь значимых результатов с помощью систем, основанных на правилах, во многом подобных силлогизмам, предложенным Аристотелем. Однако в последние годы искусственный интеллект, основанный на данных (ИИ), приобрел все большее значение по сравнению с ИИ, основанным на правилах.

Современные методы машинного обучения опираются на обширные массивы данных для выявления закономерностей, полезных для классификации. Диагностическая визуализация представляет собой одну из наиболее перспективных областей исследований искусственного интеллекта. Обнаружение злокачественных новообразований кожи, в частности, служит привлекательным приложением для искусственного интеллекта, учитывая, что диагнозы часто зависят от субъективной визуальной интерпретации клинических и дерматоскопических изображений. Диагностика с помощью искусственного интеллекта обещает ряд преимуществ. Например, искусственный интеллект может улучшить доступ к экспертным знаниям на уровне специалистов. Нехватка дерматологов является серьезной проблемой во многих регионах, что часто приводит к длительному ожиданию приема у специалиста. Кроме того, растет оптимизм по поводу того факта, что системы, основанные на искусственном интеллекте, могут обеспечить большую согласованность и точность, чем эксперты-люди.

Esteva и соавт. впервые продемонстрировали эффективность сверточных нейронных сетей (СНС) для решения задачи классификации изображений в дерматологии. СНС – это специализированные типы нейронных сетей, которые оптимально подходят для анализа изображений и преимущественно обучаются с использованием методов контролируемого обучения. Для этого требуется, чтобы изображения в обучающем наборе данных были помечены диагнозом, служащим основой истины. Эта метка необходима системе для изучения взаимосвязи между входными данными и соответствующим диагнозом. Esteva и соавт. в 2017 г. продемонстрировали, что искусственный интеллект, обученный таким образом, может различать злокачественные и доброкачественные новообразования кожи на экспертном уровне. Последующие исследования, такие как исследования Haenssle и соавт. (2020) и Tschandl и соавт. (2019), подтвердили эти выводы по различным наборам изображений и категориям заболеваний кожи. Благодаря достижениям в области вычислительной мощности и растущей доступности обучающих изображений диагностическая точность систем искусственного интеллекта со временем продолжала повышаться. Однако практическая полезность этих систем искусственного интеллекта в реальных условиях остается предметом постоянных исследований, поскольку большинство исследований проводилось в искусственных средах.

За последние десятилетия появилось множество приложений для смартфонов, предназначенных для самостоятельной оценки новообразований кожи. Более половины этих приложений предоставляют пользователям функции самоконтроля, включая возможность регистрировать, систематизировать и отслеживать невусы с помощью встроенной камеры на своих мобильных устройствах. Некоторые приложения служат посредниками, передавая изображения квалифицированным экспертам для оценки потенциальных рисков на основе представленных фотографий. Другие приложения самостоятельно классифицируют образования как высокого или низкого риска, предлагая рекомендации относительно того, может ли потребоваться медицинская консультация.

В 2018 году Кокрейновская группа по обзору точности диагностических тестов на ЗНО кожи провела систематический обзор исследований, опубликованных до августа 2016 года, в которых изучалась диагностическая точность приложений для смартфонов для выявления меланомы и пограничных состояний (Chuchu и соавт., 2018). Их обзор подчеркнул общее низкое методологическое качество и нехватку надежных фактических данных в этой области. Из 1051 оцененного исследования 203 были рассмотрены, 16 были определены как потенциально приемлемые, и в конечном итоге были включены только 2. Основными причинами исключения были неподходящая популяция для исследования, неподходящие индексные тесты, отсутствие категориальных показателей результатов в виде таблиц 2 × 2 и производный характер исследования. Среди 2 включенных исследований одно было моноцентровым ретроспективным исследованием "случай-контроль", целью которого был анализ точности 4 нераскрытых мобильных приложений в диагностике 188 новообразований кожи (Wolf и соавт, 2013).

Другим было проспективное исследование, направленное на проверку диагностических возможностей приложения SkinVision. Эталонным стандартом для обоих исследований явилось патогистологическое исследование. Считалось, что оба исследования сопряжены с высоким риском предвзятости и опасениями по поводу применимости при отборе населения. Они проводились в специализированных центрах, которые отличались от условий сообщества, в котором предназначены для использования эти приложения.
Во всех 4 приложениях на основе искусственного интеллекта, протестированных в этих исследованиях, истинно положительные показатели варьировались от 7% (95% доверительный интервал [ДИ] = 2-16) до 73% (95% ДИ = 52-88), а истинно отрицательные показатели варьировались от 37% (95% ДИ = 29-46) до 94% (95% ДИ = 87-97). Авторы пришли к выводу, что приложения для смартфонов, использующие анализ на основе искусственного интеллекта, не показали достаточной точности и что они были связаны с высокой вероятностью пропустить меланому (Chuchu и соавт, 2018).

Аналогичные выводы были сделаны в более недавнем систематическом обзоре, в котором также основное внимание уделялось диагностической точности приложений для смартфонов на базе искусственного интеллекта для выявления рака кожи. В дополнение к 2 исследованиям, проанализированным Chuchu и соавт. (2018), авторы включили еще 5 исследований, опубликованных после 2016 года, а также 2 исследования, исключенные Chuchu и соавт. (2018) из-за небольшого количества включенных случаев. Почти все включенные исследования были проспективными, и только 2 исследования были ретроспективными. Только 2 исследования были оценены как имеющие низкий риск предвзятости при отборе, тогда как считалось, что все исследования имеют высокий риск предвзятости в отношении потока и сроков, отбора пациентов и индексных тестов.

Одним из существенных критических замечаний, касающихся всех включенных исследований, было то, что качество изображения, вероятно, было лучше, чем можно было бы ожидать в реальных условиях. Стоит отметить, что только 2 (TeleSkin skinScan и SkinVision) из 6 мобильных приложений, упомянутых в этом систематическом обзоре, все еще были доступны на момент подготовки рукописи. Два были изъяты с рынка после расследований, проведенных Федеральной торговой комиссией США, а еще 2 были больше недоступны. Хотя не удалось найти рецензируемых исследований, оценивающих приложение TeleSkin skinScan, авторы обзора представили анализ чувствительности и специфичности приложения SkinVision, проведя оценку образований в различных исследованиях.

Как сообщили Тиссен и др. (2017) в своем исследовании, самое высокопроизводительное приложение продемонстрировало чувствительность 88% и специфичность 79%. В гипотетической популяции из 1000 взрослых, предполагающей распространенность меланомы в 3%, такой уровень показателей привел бы к тому, что 4 из 30 меланом остались бы недиагностированными. Кроме того, более 200 человек были бы обременены ложноположительными результатами. Авторы пришли к выводу, что низкие показатели, вероятно, были связаны с низким методологическим качеством включенных исследований. Выделенные конкретные проблемы включали выборочный набор участников, неадекватные эталонные стандарты, дифференцированные процессы проверки и высокую частоту изображений, которые невозможно было оценить.

Искусственный интеллект как инструмент для врачей общей практики
Теоретически, внедрение искусственного интеллекта в первичную медицинскую помощь при наличии достаточной чувствительности может повысить эффективность сортировки образований высокого риска и дальнейшего направления к узкому специалисту. Высокая специфичность может свести к минимуму ненужные направления и уменьшить беспокойство пациентов.

Что касается удовлетворенности и принятия искусственного интеллекта, Escalé-Besa et al (2023) обнаружили, что 92% врачей общей практики утвердительно ответили на вопрос о том, помогает ли искусственный интеллект в их подходе к дифференциальной диагностике. В 60% случаев инструмент искусственного интеллекта сыграл важную роль в постановке диагноза, а в 34% случаев консультации теледерматолога можно было избежать. Два других исследования продемонстрировали схожие результаты: врачи общей практики выразили решительную поддержку ИИ и отметили значительные преимущества, вопреки опасениям дерматологов.

Искусственный интеллект как инструмент для дерматологов
В дерматологии искусственный интеллект находит применение в различных инструментах, предназначенных для выявления ЗНО кожи, включая фотографирование всего тела и дерматоскопию. Программное обеспечение на базе искусственного интеллекта для дерматологов, такое как MoleAnalyzer Pro (FotoFinder ATMB) и DEXI (Vectra WB360), как правило, интегрировано со специализированным оборудованием. Эти приложения на базе искусственного интеллекта прошли тестирование в ходе ретроспективных исследований.

При применении фотографирования всего тела пациентов с множественными невусами ИИ выполняет вспомогательную роль для дерматологов. В таких случаях ИИ помогает сортировать и визуализировать невусы, позволяя дерматологам эффективно сравнивать изображения и выявлять изменения и отклонения. ИИ также облегчает быстрое распознавание новых или развивающихся образований (рисунок 1) путем сопоставления изображений всего тела из текущего и предыдущих визитов.
Рисунок 1. ИИ и фотографирование всего тела. Сравнение последовательных изображений у пациента в возрасте 36 лет с меланомой Ia стадии в личном анамнезе. Искусственный интеллект быстро обнаружил новое образование (синяя стрелка), появившееся на коже спины после 6-месячного наблюдения.
Первоисточник - Brancaccio G, Balato A, Malvehy J, Puig S, Argenziano G, Kittler H. Artificial Intelligence in Skin Cancer Diagnosis: A Reality Check. J Invest Dermatol. 2024 Mar;144(3):492-499.
https://pubmed.ncbi.nlm.nih.gov/37978982/
Полезность искусственного интеллекта для определения общего количества невусов, признанного фактора риска развития меланомы, остается предметом дискуссий. В австралийском исследовании была продемонстрирована эффективность искусственного интеллекта в точном определении общего количества невусов, выявив существенное 97%-ное соответствие между подсчетами на основе искусственного интеллекта и данными, приведенными дерматологами.

Однако в недавнем швейцарском исследовании сообщалось о значительных различиях между количеством невусов, определенным дерматологами, и количеством, определенным искусственным интеллектом.

Было показано, что дерматоскопия повышает как чувствительность, так и специфичность дерматологов в выявлении ЗНО кожи. В недавнем систематическом обзоре, проведенном Хаггенмюллером и соавторами (2021), оценивались исследования, в которых проводились прямые сравнения классификаторов искусственного интеллекта и экспертов-людей, что подчеркивает потенциальную полезность классификаторов на основе искусственного интеллекта в клинической практике.

Из 11 исследований, которые были сосредоточены на классификации дерматоскопических изображений, в большинстве использовалась бинарная система классификации, проводящая различие либо между меланомой и невусом, либо между злокачественными и доброкачественными новообразованиями. Важно отметить, что все 11 исследований проводились в искусственных средах, которые значительно отличались от реальных сценариев.

В 7 из 11 исследований искусственный интеллект продемонстрировал диагностическую точность, превосходящую таковую у дерматологов. Искусственный интеллект также продемонстрировал превосходную производительность в задачах многоклассовой классификации, которые охватывают более широкий спектр клинически значимых диагнозов (Maron et al, 2019; Tschandl et al, 2019a). Однако в случае беспигментных новообразований ИИ демонстрировал аналогичные или даже более низкие показатели, чем у людей (Tschandl et al, 2019b).

Сценарий "человек против машины" постепенно заменяется более актуальным сотрудничеством человека и компьютера, впервые предложенным Tschandl и соавторами.

Подводя итог, можно сказать, что, хотя будущее искусственного интеллекта в области выявления ЗНО кожи многообещающе, мы находимся лишь в начале того, что часто называют трансформацией, меняющей парадигму в здравоохранении.
Обучение и повышение квалификации
Дерматоскопия, Биопсия и другие курсы
Более 1130 врачей уже прошли обучение, присоединяйтесь
Первоисточник - https://pubmed.ncbi.nlm.nih.gov/37978982/
Научный редактор - Пягай Ольга Григориевна
Понравилась статья?