Algoritmo de detección automática basado en aprendizaje profundo para hemorragia intracraneal aguda: un ensayo clínico aleatorizado fundamental

Noticias

HogarHogar / Noticias / Algoritmo de detección automática basado en aprendizaje profundo para hemorragia intracraneal aguda: un ensayo clínico aleatorizado fundamental

Oct 29, 2023

Algoritmo de detección automática basado en aprendizaje profundo para hemorragia intracraneal aguda: un ensayo clínico aleatorizado fundamental

Volumen de Medicina Digital de npj

npj Digital Medicine volumen 6, Número de artículo: 61 (2023) Citar este artículo

1636 Accesos

14 Altmetric

Detalles de métricas

La hemorragia intracraneal aguda (HAI) es una emergencia potencialmente mortal que requiere una evaluación y un tratamiento rápidos y precisos. Este estudio tiene como objetivo desarrollar y validar un algoritmo de inteligencia artificial (IA) para diagnosticar AIH utilizando imágenes de tomografía computarizada (TC) cerebral. Se realizó un estudio aleatorizado, cruzado, pivotal, con varios lectores y retrospectivo para validar el rendimiento de un algoritmo de IA que se entrenó con 104 666 cortes de 3010 pacientes. Las imágenes de TC cerebral (12 663 cortes de 296 pacientes) fueron evaluadas por nueve revisores pertenecientes a uno de los tres subgrupos (médicos no radiólogos, n = 3; radiólogos certificados por la junta, n = 3; y neurorradiólogos, n = 3) con y sin la ayuda de nuestro algoritmo de IA. La sensibilidad, la especificidad y la precisión se compararon entre las interpretaciones asistidas y no asistidas por IA mediante la prueba de chi-cuadrado. La interpretación de la TC cerebral con asistencia de IA da como resultado una precisión diagnóstica significativamente mayor que sin asistencia de IA (0,9703 frente a 0,9471, p < 0,0001, por paciente). Entre los tres subgrupos de revisores, los médicos que no son radiólogos demuestran la mayor mejora en la precisión diagnóstica para la interpretación de la TC cerebral con asistencia de IA en comparación con aquellos sin asistencia de IA. Para los radiólogos certificados por la junta, la precisión diagnóstica para la interpretación de la TC cerebral es significativamente mayor con la asistencia de IA que sin la asistencia de IA. Para los neurorradiólogos, aunque la interpretación de la TC cerebral con asistencia de IA da como resultado una tendencia hacia una mayor precisión diagnóstica en comparación con la interpretación sin asistencia de IA, la diferencia no alcanza significación estadística. Para la detección de AIH, la interpretación de la TC cerebral con asistencia de IA da como resultado un mejor rendimiento diagnóstico que sin asistencia de IA, con la mejora más significativa observada para los médicos que no son radiólogos.

La hemorragia intracraneal aguda (HAI) es una enfermedad potencialmente mortal con una tasa de mortalidad a 30 días que oscila entre el 35 % y el 52 %. En particular, se espera que solo el 20 % de los sobrevivientes logre una recuperación funcional completa a los 6 meses1,2,3. Las imágenes por resonancia magnética (IRM) pueden ser tan precisas como las tomografías computarizadas con respecto a la detección de HAI en pacientes que presentan síntomas de accidente cerebrovascular focal agudo4 y son más precisas que las tomografías computarizadas en términos de detección de microhemorragia. No obstante, las tomografías computarizadas cerebrales sin contraste son el enfoque de diagnóstico de primera línea más utilizado para identificar la HAI debido a las diversas desventajas de las resonancias magnéticas, incluida su disponibilidad limitada, tiempos prolongados de adquisición de imágenes, alto costo y problemas con la tolerancia del paciente5,6

A pesar de la relevancia clínica de diagnosticar la HAI mediante tomografías computarizadas cerebrales (los falsos negativos pueden retrasar el diagnóstico correcto, lo que puede tener consecuencias devastadoras, mientras que los falsos positivos conducirán a exámenes innecesarios), la evaluación rápida y precisa de la HAI mediante tomografías computarizadas cerebrales sigue siendo un desafío para los médicos. Además, los grandes volúmenes de datos de imágenes que requieren evaluación suponen una carga importante para los radiólogos que necesitan mantener la precisión y la eficiencia diagnósticas7,8.

Durante la última década, la tecnología de inteligencia artificial (IA) basada en el aprendizaje profundo ha logrado avances significativos con mejoras en el poder de las computadoras y la acumulación de "grandes datos". Los avances en el reconocimiento de imágenes basado en el aprendizaje profundo, como parte del aprendizaje automático, están transformando el campo médico y tienen el potencial de mejorar aún más los procesos en el dominio de imágenes médicas9. Estas innovaciones pueden aumentar la precisión diagnóstica, permitir un diagnóstico rápido y un mejor manejo de diversas afecciones, y facilitar nuevos conocimientos biológicos. Se han desarrollado varios algoritmos de IA para el diagnóstico de HAI que han mostrado resultados prometedores en la detección, clasificación, cuantificación y predicción de HAI mediante tomografías computarizadas cerebrales7,8,10,11,12,13,14,15.

Estudios previos que emplean arquitecturas de aprendizaje profundo han utilizado predominantemente métodos de detección de hemorragias basados ​​en el etiquetado o la segmentación por parte de expertos7,8,10,11,13,15,16,17. Sin embargo, la clasificación de AIH depende de la opinión de los expertos, y la capacitación del sistema depende del etiquetado de las áreas sospechosas de AIH por parte de los expertos. Como tal, la discordancia entre los expertos en cuanto a las clasificaciones finales o el etiquetado de las imágenes es inevitable. Además, las características mal definidas, la variabilidad de tamaños y morfologías y la atenuación de la HAI contribuyen a la discordancia interobservador incluso entre neurorradiólogos expertos. En este sentido, un proceso de detección de anomalías basado en un entrenamiento no supervisado junto con un proceso de detección de hemorragias puede superar los inconvenientes del proceso de detección de hemorragias supervisado utilizado en los algoritmos de IA convencionales para la detección de hemorragias intracraneales, lo que lleva a una mejora en el rendimiento diagnóstico18,19,20,21 ,22. En cuanto a las arquitecturas de aprendizaje profundo utilizadas para la detección de hemorragias, la mayoría de las investigaciones anteriores se han basado en algoritmos de IA basados ​​en redes neuronales convolucionales (CNN) que, según se ha informado, clasifican y cuantifican las hemorragias intracraneales con un buen rendimiento diagnóstico11,13,23,24, 25,26. Estudios recientes han propuesto nuevas arquitecturas de aprendizaje profundo basadas en un enfoque de red neuronal recurrente conjunta (CNN-RNN) con resultados prometedores, destacando su potencial para ayudar a radiólogos y médicos en su flujo de trabajo de diagnóstico clínico15,27.

Aunque el excelente rendimiento de los algoritmos de IA basados ​​en el aprendizaje profundo se ha demostrado en la cohorte de validación interna, lograr resultados favorables persistentes sin una disminución del rendimiento en el conjunto de datos de validación externa que consta de una población diversa de pacientes y un escáner sigue siendo un desafío28,29.

En este estudio, desarrollamos un algoritmo de IA de detección automática basado en aprendizaje profundo para identificar AIH en tomografías computarizadas cerebrales basado en un nuevo enfoque que combinaba detección de hemorragias (basado en un sistema conjunto CNN-RNN) y detección de anomalías (basado en entrenamiento no supervisado) utilizando un gran conjunto de datos. Evaluamos el rendimiento de diagnóstico de este algoritmo de IA en un gran conjunto de datos de validación externa para validar nuestro enfoque y también realizamos un estudio retrospectivo de lectores múltiples para validar la mejora en el rendimiento de diagnóstico con la ayuda de nuestro algoritmo de IA por parte de médicos de diferentes niveles de experiencia.

El AUROC general para el rendimiento de la IA en el conjunto de datos de validación externa fue de 0,992 y 0,977 para los análisis de pacientes y de cortes, respectivamente. Los análisis de pacientes y cortes indicaron una sensibilidad del 94,4 % y el 79,0 % y una especificidad del 98,2 % y el 99,3 %, respectivamente. Los detalles sobre los resultados para la validación externa se presentan en la Tabla 1 y las Tablas complementarias 1–3.

El AUROC general para el rendimiento independiente de la IA en el conjunto de datos para el estudio de evaluación del lector fue de 0,9874 y 0,9671 para los análisis de pacientes y cortes, respectivamente (Figs. 3 y 4). Para el análisis por paciente, el mejor rendimiento diagnóstico se logró con un nivel de corte del 39,84 %, una sensibilidad del 95,89 % y una especificidad del 95,33 %. Para el análisis por cortes, el mejor rendimiento diagnóstico se logró con un nivel de corte del 7,70 %, una sensibilidad del 89,87 % y una especificidad del 91,60 %. A un nivel de corte del 50,0 %, la sensibilidad y la especificidad fueron del 93,84 % y el 97,33 %, respectivamente, en el análisis por pacientes y del 67,26 % y el 99,60 %, respectivamente, en el análisis por cortes (Figs. 1 y 2). ).

En el estudio de evaluación del lector, el grupo asistido por IA demostró una precisión diagnóstica significativamente mayor en la detección de HAI en comparación con el grupo no asistido por IA en el análisis por paciente (0,9703 [IC del 95 %: 0,9632, 0,9765] frente a 0,9471 [IC del 95 % : 0,9379, 0,9553], p < 0,0001). Según el análisis de subgrupos, los médicos no radiólogos lograron el mayor beneficio en términos de mejora en la precisión diagnóstica con asistencia de IA en relación con el grupo sin asistencia de IA (0,9505 [IC del 95 %: 0,9340, 0,9638] frente a 0,9189 [IC del 95 % : 0,8990, 0,9360], con una mejora de 3,15 [IC 95%: 0,86, 5,45], p = 0,0072) para médicos no radiólogos al nivel de radiólogos sin asistencia de IA (0,9459 [IC 95%: 0,9290, 0,9599]) . Además, los radiólogos certificados por la junta demostraron una mejora significativa en la precisión diagnóstica con asistencia de IA en relación con el grupo sin asistencia de IA (0,9741 [IC del 95 %: 0,9614, 0,9835] frente a 0,9459 [IC del 95 %: 0,9290, 0,9599], con una mejora de 2,82 [IC del 95 %: 1,00, 4,63], p = 0,0025), con una mejora para los radiólogos certificados por la junta al nivel de los neurorradiólogos sin asistencia de IA (0,9764 [IC del 95 %: 0,9641, 0,9853]). Nota. ROC: característica de funcionamiento del receptor.

En el estudio de evaluación del lector, el grupo asistido por IA demostró una precisión diagnóstica significativamente mayor en la detección de HAI que la del grupo no asistido por IA en el análisis por sectores (0,9581 [IC del 95 %: 0,9569, 0,9592] frente a 0,9522 [95 % IC: 0,9509, 0,9534], p < 0,0001). Según el análisis de subgrupos, los médicos que no son radiólogos y los radiólogos certificados por la junta demostraron una mejora significativa en la precisión diagnóstica con asistencia de IA en relación con el grupo sin asistencia de IA (para médicos que no son radiólogos: 0,9393 [IC del 95 %: 0,9369, 0,9417 ] vs. 0,9306 [IC 95 %: 0,9280, 0,9332], con una diferencia de 0,87 [IC 95 %: 0,52, 1,22], p < 0,0001, para radiólogos certificados por la junta 0,9632 [IC 95 %: 0,9623, 0,9661] vs. 0,9567 [IC 95%: 0,9546, 0,9587], con una diferencia de 0,75 [IC 95%: 0,48, 1,03], p < 0,0001). Nota. ROC: característica de funcionamiento del receptor.

En el estudio de evaluación del lector, el grupo asistido por IA exhibió una precisión diagnóstica significativamente mayor en la detección de HAI que el grupo no asistido por IA tanto para el análisis de pacientes (0,9703 frente a 0,9471, p < 0,0001) como de cortes (0,9581 frente a 10). 0,9522, p < 0,0001). En comparación con el grupo sin asistencia de IA, el grupo asistido por IA logró una sensibilidad significativamente mayor (0,9718 frente a 0,9437, p = 0,0003 para el análisis por paciente y 0,8469 frente a 0,8299, p < 0,0001 para el análisis por corte) y especificidad (0,9689). vs. 0,9504, p = 0,0145 para análisis por paciente y 0,9855 vs. 0,9824, p < 0,0001 para análisis por corte) (Tablas 2 y 3, Figs. 1 y 2).

Entre los tres subgrupos de revisores, los médicos que no eran radiólogos demostraron la mayor mejora en la precisión diagnóstica con el uso de asistencia de IA en comparación con aquellos sin asistencia de IA (0,9505 frente a 0,9189, con una diferencia del 3,15 %, p = 0,0072 para el paciente). análisis por corte y 0,9393 vs 0,9306, con una diferencia de 0,87%, p < 0,0001 para análisis por corte). Para los radiólogos certificados por la junta, la detección de HAI con asistencia de IA dio como resultado una precisión diagnóstica significativamente mayor en comparación con la sin asistencia de IA (0,9741 frente a 0,9459, con una diferencia de 2,82 %, p = 0,0025 para el análisis por paciente y 0,9632 frente a 0,9632 frente a 0,9459). 0,9567, con una diferencia del 0,75 %, p < 0,0001 para el análisis por cortes). Para los neurorradiólogos, aunque la detección de HAI con asistencia de IA mostró una tendencia hacia una mayor precisión diagnóstica en comparación con la detección sin asistencia de IA, esto no alcanzó significación estadística (0,9865 frente a 0,9764, con una diferencia del 1,01 %, p = 0,1138 para el análisis por paciente). y 0,9706 vs. 0,9691, con una diferencia de 0,15%, p = 0,2345 para el análisis por cortes) (Tablas 2 y 3, Figs. 1 y 2). En las Figs. 1 y 2, respectivamente.

El análisis de GEE reveló que la asistencia de IA dio como resultado un aumento significativo en la precisión tanto en el paciente (3,67 para el grupo asistido por IA y 3,01 para el grupo sin asistencia de IA, con una diferencia de 0,66, p = 0,0075) como en los análisis de corte ( 3,21 para el grupo asistido por IA y 3,03 para el grupo no asistido por IA, con una diferencia de 0,18, p < 0,0001). La sensibilidad aumentó significativamente en los análisis de pacientes (4,24 para el grupo asistido por IA y 2,89 para el grupo no asistido por IA, con una diferencia de 1,35, p = 0,017) y por corte (1,75 para el grupo asistido por IA y 1,69 para el grupo sin asistencia de IA, con una diferencia de 0,05, p = 0,3273). La especificidad también aumentó significativamente en los análisis de pacientes (3,81 para el grupo asistido por IA y 3,17 para el grupo no asistido por IA, con una diferencia de 0,364, p = 0,0376) y por cortes (4,56 para el grupo asistido por IA y 4,15 para el grupo sin asistencia de IA, con una diferencia de 0,41, p <0,0001) (Tablas complementarias 4–7).

El ICC indicó que los grupos con y sin asistencia de IA demostraron una fiabilidad excelente (0,9193) y buena (0,8475), respectivamente. Las imágenes representativas de la detección de AIH a partir de imágenes de TC cerebrales se presentan en la Fig. 3 y en la Fig. 1 complementaria.

una tomografía computarizada del cerebro asistida por IA reveló la ubicación probable de AIH como la cisterna basal y la cisterna ambiental derecha. La TC cerebral asistida por IA proporcionó puntuaciones de probabilidad de AIH en forma de corte (95,8 %) y de paciente (99,4 %). Los nueve revisores estuvieron de acuerdo con el diagnóstico de HAI para las interpretaciones asistidas y no asistidas por IA. b La TC cerebral asistida por IA reveló que la ubicación probable de la AIH era el lado izquierdo de la hoz. La TC cerebral asistida por IA proporcionó las puntuaciones de probabilidad de AIH en forma de corte (62,2 %) y de paciente (95,3 %). Para la interpretación sin asistencia de IA, un revisor (médico no radiólogo) pasó por alto este caso de AIH en el lado izquierdo de la hoz. Los nueve revisores estuvieron de acuerdo con el diagnóstico de HAI para las interpretaciones asistidas y no asistidas por IA. c La TC cerebral asistida por IA reveló la ubicación probable de la AIH en los surcos parietales izquierdos. La TC cerebral asistida por IA proporcionó puntuaciones de probabilidad de AIH en forma de corte (39,0 %) y de paciente (46,3 %). Para la interpretación sin asistencia de IA, dos tercios de los revisores (tres médicos no radiólogos, dos radiólogos certificados por la junta y un neurorradiólogo) no detectaron este caso de HAI en el surco parietal izquierdo. Con el uso de la asistencia de IA, estos seis revisores pudieron revisar correctamente sus decisiones. d La TC cerebral asistida por IA reveló la ubicación probable de la HAI en el área frontal izquierda. La TC cerebral asistida por IA proporcionó las puntuaciones de probabilidad de AIH en forma de corte (54,9 %) y de paciente (65,8 %). Para la interpretación sin asistencia de AI, un tercio de los revisores (un médico no radiólogo y dos radiólogos certificados por la junta) lo informaron como AIH. Con el uso de la asistencia de IA, un tercio adicional de los revisores (un médico no radiólogo, un radiólogo certificado por la junta y un neurorradiólogo) informaron esto como AIH. Sin embargo, la lesión hiperatenuante sutil en el área frontal izquierda se debió al artefacto de endurecimiento del haz del cráneo.

En el presente estudio, informamos sobre un nuevo algoritmo de IA que utiliza una combinación de entrenamiento supervisado para la detección de hemorragias y entrenamiento no supervisado para la detección de anomalías. Además, aplicamos una arquitectura conjunta CNN-RNN para la detección de hemorragias. Nuestro algoritmo de IA logró una alta precisión para la detección de IA independiente, y su uso en la interpretación asistida por IA dio como resultado un rendimiento de diagnóstico superior en la detección de AIH en relación con la interpretación sin asistencia de IA.

Con respecto a los valores AUROC, el rendimiento del algoritmo de IA independiente en el estudio de validación externa (0,992 y 0,977 en análisis de pacientes y cortes, respectivamente) y el estudio de evaluación del lector (0,9874 y 0,9671 en análisis de pacientes y cortes) , respectivamente) fueron comparables con el desempeño del subgrupo de neurorradiólogos sin asistencia de IA (0,9764 y 0,9691 en análisis de pacientes y cortes, respectivamente). Estas precisiones diagnósticas fueron más altas que las reportadas por la mayoría de los estudios previos7,8,10,11,13,15 y fueron comparables con los resultados logrados en un estudio anterior (AUROC = 0.991), que informó que el desempeño independiente de la IA era comparable con la de expertos altamente capacitados13. Además, en el presente estudio, la alta sensibilidad del 95,89 % y la alta especificidad del 95,33 % logradas por nuestro enfoque a un nivel de corte del 39,84 % en el análisis por pacientes fue mayor que las logradas por los revisores sin asistencia de IA (94,37 % y 95,04%, respectivamente). Los resultados prometedores logrados por nuestro algoritmo de IA resaltan su potencial para la detección precisa de AIH en imágenes de TC cerebrales.

En el estudio de evaluación de lectores, que empleó un diseño de estudio retrospectivo, con varios lectores, fundamental, cruzado y aleatorizado, el grupo asistido por IA demostró una precisión diagnóstica significativamente mayor en la detección de HAI que el grupo sin asistencia de IA. Además, el rendimiento superior del grupo asistido por IA en términos de precisión diagnóstica se validó mediante el análisis GEE. Hasta donde sabemos, los efectos beneficiosos de la asistencia de IA en la interpretación del lector para la detección de AIH en imágenes de TC cerebral no se han informado previamente. Los hallazgos prometedores de este estudio respaldan la relevancia práctica del uso de IA en entornos clínicos para mejorar la atención al paciente. En particular, con la ayuda de nuestro algoritmo de IA, el rendimiento diagnóstico de los médicos que no son radiólogos alcanzó el nivel de los radiólogos y el rendimiento diagnóstico de los radiólogos alcanzó el nivel de los neurorradiólogos para la detección de HAI en imágenes de TC cerebrales. Creemos que nuestro algoritmo de IA puede desempeñar un papel clave como asistente confiable en la práctica clínica del mundo real donde la ayuda inmediata de radiólogos o neurorradiólogos expertos puede no estar disponible. Además, nuestro algoritmo de IA puede aliviar en parte la carga de los radiólogos y neurorradiólogos que se encuentran con grandes volúmenes de imágenes de TC que requieren una interpretación con alta precisión diagnóstica y eficiencia en el momento oportuno. La mejora significativa en la sensibilidad observada en este estudio implica que el presente algoritmo de IA puede reducir la aparición de falsos negativos en los que se puede excluir erróneamente la HAI, lo que permite un tratamiento rápido que es fundamental para los pacientes con HAI.

Es interesante notar que la diferencia entre las sensibilidades asistida y no asistida por IA muestra un valor más bajo para la forma por corte (1,70 %) que para la forma por paciente (2,82 %), y la mejora en términos de la sensibilidad para los médicos que no son radiólogos en la forma de paciente no logró la significación estadística en la forma de corte (Tablas 2 y 3). Además, de acuerdo con el análisis GEE, el logro de una superioridad estadísticamente significativa fracasó solo en el análisis de sensibilidad en forma de corte (Tabla complementaria 6). La baja sensibilidad de la IA independiente en forma de corte (89,87 %) en comparación con la forma de paciente (95,89 %) podría hacer que un efecto positivo constante en la decisión sea un desafío. Además, la disminución en cuanto al rol positivo podría afectar con mayor intensidad al grupo de médicos no radiólogos. Sin embargo, la mejora estadísticamente significativa de la sensibilidad en el grupo de neurorradiólogos solo en forma de corte sigue siendo un desafío que debe explicarse.

Aunque la especificidad mejoró significativamente en el grupo asistido por IA para todos los lectores, no observamos una mejora estadísticamente significativa en la especificidad para cada grupo. Esto sugiere que la capacidad del presente algoritmo de IA para reducir los falsos positivos puede ser limitada y que nuestro algoritmo de IA es más adecuado como herramienta de apoyo que como método alternativo para la detección de AIH en imágenes de TC cerebrales.

En el presente estudio, describimos el desarrollo de un nuevo algoritmo de IA, que combina procesos de detección de hemorragias y anomalías, con el objetivo de mejorar el rendimiento diagnóstico para la identificación de HAI en imágenes de TC cerebral. La mayoría de los algoritmos de IA anteriores utilizados para analizar imágenes médicas, incluidos los diseñados para la detección de hemorragias intracraneales, se han desarrollado mediante el etiquetado supervisado de imágenes de entrenamiento para facilitar el proceso de detección de biomarcadores7,8,10,11,13,15,16,17. Aunque el entrenamiento con imágenes etiquetadas por expertos ha producido resultados prometedores27,30,31, es inevitable que haya discordancia en las áreas etiquetadas entre expertos. Además, las características mal definidas, la variación de tamaños y morfologías y la atenuación de la HAI contribuyen a la discordancia interobservador que puede ocurrir incluso entre neurorradiólogos expertos. La detección de anomalías es el proceso de identificación de áreas anormales basado en un entrenamiento no supervisado usando datos normales21,22,32. La aplicación de la detección de anomalías basada en el entrenamiento no supervisado utilizando imágenes de TC cerebrales normales puede superar los inconvenientes de los algoritmos de IA convencionales para la detección de AIH que se basan en el entrenamiento supervisado. En el presente estudio, la combinación de detección de hemorragia y detección de anomalías basada en un conjunto de datos relativamente grande puede haber contribuido al rendimiento superior demostrado por el algoritmo de IA actual.

Para superar los problemas antes mencionados y mejorar el rendimiento del diagnóstico, utilizamos un CNN-RNN combinado en nuestro algoritmo de IA. Con respecto a las arquitecturas de aprendizaje profundo, estudios previos han utilizado predominantemente algoritmos basados ​​en CNN 2D o 3D11,13,23,24,25,26. Sin embargo, las imágenes de TC cerebrales consisten en una serie de imágenes 2D que contienen información sobre estructuras 3D reales. Por lo tanto, en el presente estudio, diseñamos una arquitectura que era más apropiada para procesar datos 3D y, además, aplicamos un módulo RNN al módulo CNN más común. El uso adicional de este RNN facilitó puntajes de probabilidad de AIH más precisos por paciente y mejoró el rendimiento diagnóstico tanto a nivel de paciente como de corte.

Se justifica más trabajo para abordar la utilidad de este algoritmo de IA desde una perspectiva clínica, incluidas las investigaciones sobre la morbilidad o mortalidad relacionadas. En el presente estudio, abordamos la precisión diagnóstica del presente algoritmo de IA en la detección de AIH en imágenes de TC cerebrales; sin embargo, las características críticas de la evolución de la HAI que se asocian con los resultados clínicos, incluidos el volumen y la expansión de la hemorragia, requieren una evaluación con imágenes de seguimiento para obtener una comprensión completa de la precisión diagnóstica de nuestro enfoque. Como tal, futuras investigaciones sobre la utilidad clínica del presente algoritmo de IA en pacientes con HAI crítica para los cuales se dispone de resultados clínicos aclararán su papel potencial en el diagnóstico y manejo de esta afección. Además, el ambiente de lectura en este estudio experimental no replicó el de la práctica diaria, especialmente con respecto al uso de la información clínica. En entornos clínicos, la información del paciente, incluidas las principales quejas, los síntomas, los resultados del examen físico y el historial médico pasado, contribuyeron a un desempeño diagnóstico superior de los médicos. Por lo tanto, la aplicación directa del presente algoritmo de IA basado en su excelente desempeño diagnóstico en este estudio experimental puede ser prematura. Además, la clasificación de AIH por la junta de revisión estándar de oro en este estudio puede ser una limitación. Determinar el estándar de oro para la HAI es un desafío, particularmente cuando la cantidad de hemorragia es tan sutil que no se indica ningún tratamiento, y los pasos de diagnóstico adicionales, como una punción lumbar, no se considerarían de forma rutinaria, e incluso pueden ser inexactos. La verdad básica puede no ser conocida en tales casos en la medicina clínica de rutina. Para minimizar el inconveniente natural en el diagnóstico de AIH, en el presente estudio, el estándar de oro para la clasificación de AIH se basó en la interpretación de la junta de revisión de estándar de oro compuesta por tres neurorradiólogos con al menos 11 años de experiencia relevante como radiólogos, incluso en al menos 7 años de experiencia como neurorradiólogos. Sin embargo, lograr un acuerdo completo entre los dos neurorradiólogos primarios fue un desafío. En el presente estudio, el valor de kappa ponderado para la concordancia entre evaluadores entre los neurorradiólogos experimentados fue de 0,9865, y dos casos que se incluyeron inicialmente en el grupo AIH se reclasificaron al grupo normal (sin AIH). Aunque nuestro enfoque para lograr un diagnóstico estándar de oro fue razonable, puede haber limitaciones en cuanto a la idoneidad de nuestro método para identificar el estándar de oro utilizado para la validación del algoritmo de IA, que logró una precisión diagnóstica de hasta 0,9874 según estas decisiones. . Finalmente, las características demográficas de los casos incluidos y el diseño retrospectivo del estudio que permite un posible sesgo de selección son limitaciones adicionales.

En conclusión, desarrollamos un algoritmo de IA basado en aprendizaje profundo para la detección automática de AIH en imágenes de TC cerebrales basado en una combinación de un proceso de detección de hemorragias, que empleó una arquitectura combinada CNN-RNN, y un proceso de detección de anomalías, que utilizó entrenamiento no supervisado. El rendimiento de diagnóstico del algoritmo de IA se validó en un gran conjunto de datos de validación externa. Además, la mejora en el rendimiento del diagnóstico con asistencia de IA frente a sin asistencia de IA también se validó en este estudio retrospectivo de lectores múltiples.

Desarrollamos y validamos un algoritmo de IA basado en aprendizaje profundo (Medical Insight+ Brain Hemorrhage, SK Inc. C&C, Seongnam, República de Corea) para la detección automática de AIH en tomografías computarizadas cerebrales. Este estudio fue aprobado por las juntas de revisión institucional de las instituciones participantes (H-2007-061-1140, Junta de Revisión Institucional del Hospital Universitario Nacional de Seúl [institución A] y AJIRB-DEV-DE3-20-379, Revisión Institucional del Centro Médico de la Universidad de Ajou [institución B]), y se renunció al requisito de consentimiento informado debido a la naturaleza retrospectiva de este estudio.

Para desarrollar el algoritmo de IA para usar con nuestro software de soporte de diagnóstico, 104 666 cortes (28 351 [27,1 %] con AIH y 76 315 [72,9 %] sin AIH) de 3010 pacientes (2010 [66,8 %] con AIH y 1000 [33,2 %] sin AIH) AIH) de dos instituciones (el Hospital de la Universidad Nacional de Seúl [institución A] y el Centro Médico de la Universidad de Ajou [institución B]) se utilizaron para el desarrollo del modelo. Los datos fueron recolectados de pacientes en las instituciones A y B entre abril de 2009 y diciembre de 2015 y entre abril de 2004 y abril de 2020, respectivamente. AIH en la patología subyacente (incluida la hemorragia intratumoral y la transformación hemorrágica en el sitio del accidente cerebrovascular isquémico agudo), así como la AIH solitaria, también se incluyeron en el grupo AIH. La mayor parte del conjunto de datos de desarrollo (2632 entre un total de 3010 pacientes [87,4 %]) tenía un grosor de corte de 5 mm (2,5 mm [n = 3], 3,0 mm [n = 104], 3,75 mm [n = 1], 4,0 mm [n = 40], 4,5 mm [n = 209], 4,8 mm [n = 12], 5,3125 mm [n = 1], 6,0 mm [n = 4] y 7,0 mm [n = 4]).

Para la validación externa del rendimiento diagnóstico del algoritmo de IA se utilizaron 1.855.465 cortes (73.467 [4 0%] con HAI y 1.781.998 [96,0%] sin HAI) de 49.841 pacientes (6442 [12,9%] con HAI y 43.399 [87,1%] sin AIH) en el centro AI bajo la dirección de la Agencia Nacional de la Sociedad de la Información de Corea (https://aihub.or.kr/aidata/34101). Este conjunto de datos se recopiló de seis instituciones médicas en Corea en 2020 como un gran proyecto de recopilación de datos sobre enfermedades cerebrovasculares, y los hospitales que contribuyen a la recopilación de datos para el centro de IA son diferentes de los hospitales de los que se recopiló el conjunto de datos de desarrollo. La decisión sobre si los 1 855 465 cortes de 49 841 pacientes eran HAI o normales se tomó en función de la interpretación de las imágenes por parte de los neurorradiólogos de cada institución. Un total de 6442 imágenes de TC mostraron HAI, incluidos 2424 casos de hemorragia subaracnoidea, 2738 casos de hemorragia subdural, 371 casos de hemorragia epidural, 1266 casos de hemorragia intraventricular y 3367 casos de hemorragia intraparenquimatosa (nota: los subtipos superpuestos eran posibles). Un total de 73 467 cortes exhibieron HAI, incluidos 32 751 casos de hemorragia subaracnoidea, 39 604 casos de hemorragia subdural, 4567 casos de hemorragia epidural, 18 220 casos de hemorragia intraventricular y 35 669 casos de hemorragia intraparenquimatosa (nota: los subtipos superpuestos eran posibles). En las tablas complementarias 8 y 9 se presenta un resumen de la información del paciente y del escáner con respecto a la validación externa.

Se obtuvo un conjunto de datos separado temporalmente del conjunto de datos de desarrollo para la evaluación del lector. Un total de 12.663 cerebros (2508 AIH [19,8%] y 10.155 normales [81,2%]) de 296 pacientes (146 AIH [49,3%] y 150 normales [51,7%]) cortes de TC se obtuvieron de dos instituciones (Seoul National University Hospital [institución A] y Ajou University Medical Center [institución B]). Se recolectaron datos de pacientes en las instituciones A y B entre enero de 2016 y diciembre de 2019 y entre abril de 2004 y abril de 2020, respectivamente. Los pacientes inscritos en el conjunto de datos de desarrollo no se inscribieron en el conjunto de datos del estudio del lector.

Las 296 imágenes de TC completas que cumplieron con los criterios de calidad de imagen modificados de los criterios informados anteriormente se inscribieron como el conjunto de datos para el estudio de evaluación del lector (Tabla complementaria 10)33,34. El número de imágenes de TC requeridas se calculó utilizando el método de estimación de potencia con el nivel de significación establecido en 5 % y la potencia en 90 %, que se basó en una sensibilidad del 88,6 % como se informó anteriormente27 y una sensibilidad del 98,5 % a partir de la validación interna de el actual algoritmo de IA. Esto dio como resultado un total de 148 imágenes de TC para cada grupo, lo que representó una tasa de abandono del 15 %. Además, sobre la base de una especificidad del 88,6 % informada en un estudio anterior27 y una especificidad del 96,0 % de la validación interna del presente algoritmo de IA, se obtuvieron 114 imágenes de TC para cada grupo, lo que representa una tasa de abandono del 15 %.

El estándar de oro para la interpretación de los 12 663 cortes de 296 imágenes de TC como AIH o normal se logró a través del consenso cuidadoso de una junta de revisión de estándar de oro compuesta por tres neurorradiólogos con al menos 11 y 7 años de experiencia como radiólogos y neurorradiólogos, respectivamente. Para la interpretación de la TC, dos radiólogos interpretaron de forma independiente la presencia o ausencia de HAI tanto en forma de paciente como de corte. Un tercer neurorradiólogo revisó los casos en los que hubo desacuerdo entre los dos neurorradiólogos iniciales para tomar una decisión final. El valor kappa ponderado de la concordancia entre evaluadores entre las interpretaciones independientes iniciales de los neurorradiólogos experimentados fue de 0,9865 [IC del 95 %: 0,9732, 0,9997] para el análisis por paciente y se basó en las interpretaciones de la junta de revisión estándar. Dos casos que inicialmente habían sido categorizados en el grupo HAI según la historia clínica fueron reclasificados al grupo normal. En total, 146 imágenes de TC mostraron HAI, incluidos 101 casos de hemorragia subaracnoidea, 72 casos de hemorragia subdural, 20 casos de hemorragia epidural, 40 casos de hemorragia intraventricular y 66 casos de hemorragia intraparenquimatosa (nota: los subtipos superpuestos eran posibles). Un total de 2508 cortes exhibieron HAI, incluidos 1408 casos de hemorragia subaracnoidea, 1150 casos de hemorragia subdural, 228 casos de hemorragia epidural, 240 casos de hemorragia intraventricular y 535 casos de hemorragia intraparenquimatosa (nota: los subtipos superpuestos eran posibles). En la Tabla complementaria 11 se presenta un resumen de la población del estudio de lectores.

Para el desarrollo del algoritmo de IA, los neurorradiólogos anotaron 28 351 cortes de 2010 pacientes con AIH y 1000 participantes normales utilizando nordicICE versión 4.1.3 (NordicNeuroLab, Bergen, Noruega), con un enfoque particular en las áreas de AIH. Para superar los inconvenientes de la variabilidad entre observadores mediante el entrenamiento supervisado, desarrollamos un nuevo algoritmo de IA basado en una combinación de un proceso de detección de hemorragias supervisado y un proceso de detección de anomalías no supervisado.

El propósito del proceso de detección de hemorragias es predecir si HAI está presente en las imágenes de TC cerebral. Este proceso consta de dos módulos15,27,35. El primero es un módulo de detección de hemorragias basado en CNN que proporciona el vector de características y la puntuación AIH para el objetivo. El segundo es un módulo de secuencia basado en RNN con doble capa. En este módulo, se producen puntajes AIH más precisos para cada segmento utilizando los vectores de características y puntajes del primer módulo como entradas para superar las limitaciones de las CNN en términos de análisis de datos de imágenes 3D. Además, las puntuaciones de cada paciente se adquirieron simultáneamente.

Se aplicó un proceso de detección de anomalías para predecir si había anomalías en las imágenes de TC del cerebro. En este proceso se utilizó un módulo de generación basado en un autocodificador variacional36,37 y una red antagónica generativa38. El módulo de generación fue entrenado para generar cortes de TC normales (imágenes de TC restauradas) usando imágenes del grupo normal. Como tal, una comparación de las imágenes de TC restauradas y de entrada indicó áreas de anomalía cuando se consideraron áreas que se suponía que tenían HAI en el proceso de detección de hemorragia.

Finalmente, las imágenes de TC del cerebro asistidas por IA, que incluían un mapa de calor integrado que representaba la ubicación probable de la AIH de acuerdo con las puntuaciones de probabilidad de AIH del paciente y de los cortes, se proporcionaron al visor del sistema de archivo y comunicación de imágenes (PACS) junto con las imágenes originales de la TC del cerebro. (Figura 1). En la figura 4 y las figuras complementarias se presenta una descripción general y los detalles de la arquitectura del algoritmo de IA. 2 y 3.

El diagrama muestra la arquitectura del algoritmo de IA propuesto. Este nuevo algoritmo de IA combinó un proceso de detección de hemorragias supervisado y un proceso de detección de anomalías no supervisado. Además, se aplicó una arquitectura combinada CNN-RNN en el proceso de detección de hemorragias. La presencia o ausencia se determina mediante el proceso de detección de hemorragias. Como resultado de este proceso de detección de hemorragias, el algoritmo de IA proporciona la puntuación de AIH por paciente y por corte. El algoritmo de IA proporciona el mapa de anomalías para los pacientes con AIH a través de la resta entre la imagen de TC original y la imagen de TC restaurada (imagen normal generada artificialmente basada en el entrenamiento no supervisado del conjunto de datos normal) y el posprocesamiento. El tiempo adicional promedio para acceder a las imágenes de TC asistidas por IA en el visor PACS fue de 97,4 segundos. El tiempo desde el servidor PACS hasta la IA, el tiempo de procesamiento de la IA y el tiempo desde la IA hasta el visor PACS fueron 54,6 segundos (rango, 37–91 segundos), 11,8 segundos (rango, 0,8–90,6 segundos), 31,0 segundos (rango, 30–33 segundos ). Nota. Hemorragia intracraneal aguda AIH, sistema de archivo y comunicación de imágenes PACS, red neuronal convolucional CNN, red neuronal recurrente RNN, codificador automático variacional VAE, red antagónica generativa GAN.

Las puntuaciones de probabilidad de AIH por paciente y por corte se utilizaron para evaluar las métricas de rendimiento independientes de nuestro algoritmo de IA, incluidas la precisión, la sensibilidad, la especificidad, el valor predictivo positivo, el valor predictivo negativo, la puntuación F1 y el área bajo la curva característica operativa del receptor (AUROC).

Se utilizaron puntuaciones de probabilidad de AIH por paciente y por corte para evaluar las métricas de rendimiento independientes de nuestro algoritmo de IA, incluidas la AUROC, la sensibilidad y la especificidad.

Se realizó un estudio aleatorizado retrospectivo, multilector, cruzado, de superioridad, fundamental, para evaluar la eficacia del software que asiste en la decisión de diagnóstico con respecto a la identificación y detección de hemorragia intracraneal en tomografías computarizadas cerebrales (Clinical Research Information Service of Republic of Corea [https://cris.nih.go.kr; identificador: KCT0006734], que es un registro primario coreano de la Plataforma de Registro de Ensayos Clínicos Internacionales de la Organización Mundial de la Salud que está bajo la dirección de la Agencia de Prevención y Control de Enfermedades de Corea) ( Nota complementaria (Detalles del estudio)).

Este estudio retrospectivo de múltiples lectores se realizó con nueve revisores de cuatro instituciones en Corea del Sur (Hospital de la Universidad Nacional de Seúl, Centro Médico de la Universidad de Ajou, Hospital de la Universidad Nacional de Bundang Seúl y Centro Médico de Seongnam) usando 12,663 cortes de TC cerebrales de 296 pacientes como estudio. conjunto de datos Nueve médicos de tres subgrupos diferentes con números iguales (es decir, tres médicos no radiólogos con 5 a 7 años de experiencia en esa función, tres radiólogos certificados por la junta con 5 a 7 años de experiencia en esa función y tres neurorradiólogos capacitados en subespecialidades con 7 a 11 años de experiencia como radiólogos, incluidos 3 a 7 años de experiencia como neurorradiólogos) participaron como revisores.

En este estudio aleatorizado, pivotal, cruzado, retrospectivo y con múltiples lectores, antes de la primera evaluación, el conjunto completo de datos de TC se dividió en grupos A y B, cada uno de los cuales comprendía imágenes de TC de 148 pacientes, y los números para la evaluación secuencial se asignaron al azar. El grupo A consistió en imágenes de TC originales y las correspondientes imágenes de TC asistidas por IA, mientras que el grupo B consistió solo en imágenes de TC originales sin imágenes de TC asistidas por IA. Las imágenes de TC asistidas por IA proporcionaron un mapa de calor con información sobre la ubicación sospechosa de AIH y la probabilidad de AIH en forma de paciente y corte. Cada revisor revisó de forma independiente las imágenes de TC para la detección de HAI. El visor de imágenes PACS se utilizó para evaluar las imágenes de TC en función del paciente y de los cortes. Los revisores desconocían las decisiones de la junta de revisión estándar con respecto a la AIH y la proporción de casos de AIH en el conjunto de datos evaluado. Después de un período de lavado de 4 a 5 semanas, se realizó una segunda evaluación. En la segunda evaluación, el conjunto de datos del grupo A que comprende imágenes de TC originales y asistidas por IA durante la primera evaluación se cambió para incluir solo las imágenes de TC originales sin ninguna imagen de TC asistida por IA, mientras que las imágenes de TC asistidas por IA se agregaron al grupo B conjunto de datos que previamente había incluido solo las imágenes de TC originales sin imágenes de TC asistidas por IA. Los números para las evaluaciones secuenciales se reasignaron aleatoriamente. Cada revisor repitió el mismo proceso de revisión que en la primera evaluación. En la figura 5 se presenta una descripción general esquemática del diseño del estudio.

El diagrama esquemático muestra el diseño de estudio retrospectivo, pivotal, cruzado y aleatorizado utilizado en el presente estudio (izquierda). En la primera revisión de imágenes, el grupo A constaba de imágenes de TC originales y las correspondientes imágenes de TC asistidas por IA, mientras que el grupo B constaba solo de imágenes de TC originales sin imágenes de TC asistidas por IA. Después de un período de lavado de 4 a 5 semanas, en la segunda revisión de imágenes, el conjunto de datos del grupo A se cambió para incluir solo las imágenes de TC originales sin ninguna imagen de TC asistida por IA, mientras que las imágenes de TC asistidas por IA se agregaron al conjunto de datos del grupo B . Las imágenes de TC asistidas por IA proporcionaron un mapa de calor con información sobre la ubicación sospechosa y la probabilidad de AIH en forma de paciente y corte (derecha).

La determinación de la IA se basó en si la probabilidad proporcionada por el algoritmo de IA era igual o superior al nivel de corte. Para la validación externa, una decisión se consideró correcta si la determinación de AI coincidía con la decisión sugerida tomada sobre la base de la información básica en el conjunto de datos de validación externa; la sensibilidad y la especificidad se calcularon a un nivel de corte del 50,0 %. Sin embargo, para la evaluación independiente de AI, una decisión se consideró correcta si la determinación de AI coincidía con la decisión tomada por la junta de revisión estándar de oro para el análisis AUROC; la sensibilidad y la especificidad también se calcularon a un nivel de corte del 50,0 %.

En el estudio del lector, la corrección de una decisión se determinó en función de si la decisión del lector coincidía con la decisión tomada por la junta de revisión del patrón oro. La sensibilidad, la especificidad y la precisión se compararon entre los grupos asistidos y no asistidos por IA mediante la prueba de chi-cuadrado. Para validar el rendimiento superior del grupo asistido por IA en comparación con el grupo no asistido por IA, se utilizó la regresión logística utilizando el método de ecuación de estimación generalizada (GEE) para probar la significancia y para estimar los intervalos de confianza (IC) del 95 %. La concordancia entre observadores según el subtipo de HAI se analizó mediante un coeficiente de correlación intraclase basado en un análisis por paciente. Todos los análisis se realizaron utilizando el software estadístico SAS (versión 9.4; SAS Institute, Cary, NC, EE. UU.).

Más información sobre el diseño de la investigación está disponible en el Resumen de informes de investigación de Nature vinculado a este artículo.

Los documentos adicionales relacionados con este estudio están disponibles del autor correspondiente a pedido razonable. Los conjuntos de datos del Hospital de la Universidad Nacional de Seúl y el Centro Médico de la Universidad de Ajou se utilizaron bajo licencia para el estudio actual y no están disponibles públicamente.

El código utilizado para entrenar el modelo de IA depende de la anotación, la infraestructura y el hardware; por lo tanto, no puede ser liberado. Sin embargo, todos los detalles experimentales y de implementación que se pueden compartir se describen en detalle en la Nota complementaria (Detalles del estudio). El algoritmo de IA desarrollado a partir de este estudio está disponible a través del producto comercial, SK Inc. C&C Medical Insight+ Brain Hemorrhage.

Qureshi, AI, Mendelow, AD & Hanley, DF Hemorragia intracerebral. Lanceta 373, 1632-1644 (2009).

Artículo PubMed PubMed Central Google Académico

Broderick, J. et al. Pautas para el manejo de la hemorragia intracerebral espontánea en adultos: actualización de 2007: una guía del Consejo de Accidentes Cerebrovasculares de la Asociación Estadounidense del Corazón/Asociación Estadounidense de Accidentes Cerebrovasculares, el Consejo de Investigación de la Presión Arterial Alta y el Grupo de Trabajo Interdisciplinario de Calidad de la Atención y Resultados en la Investigación. Accidente cerebrovascular 38, 2001-2023 (2007).

Artículo PubMed Google Académico

van Asch, CJ et al. Incidencia, letalidad y resultado funcional de la hemorragia intracerebral a lo largo del tiempo, según la edad, el sexo y el origen étnico: una revisión sistemática y un metanálisis. Lancet Neurol. 9, 167–176 (2010).

Artículo PubMed Google Académico

Kidwell, CS et al. Comparación de MRI y CT para la detección de hemorragia intracerebral aguda. JAMA 292, 1823–1830 (2004).

Artículo CAS PubMed Google Académico

Cordonnier, C., Demchuk, A., Ziai, W. & Anderson, CS Hemorragia intracerebral: enfoques actuales para el manejo agudo. Lanceta 392, 1257–1268 (2018).

Artículo PubMed Google Académico

Morotti, A. & Goldstein, JN Diagnóstico y manejo de la hemorragia intracerebral aguda. emergente Medicina. clin. Norte. Soy. 34, 883–899 (2016).

Artículo PubMed PubMed Central Google Académico

Lee, JY, Kim, JS, Kim, TY & Kim, YS Detección y clasificación de hemorragia intracraneal en imágenes de TC mediante un novedoso algoritmo de aprendizaje profundo. ciencia Rep. 10, 20546 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Hwang, I. et al. Predicción de la edad cerebral a partir de imágenes de resonancia magnética cerebral de eco de espín ponderadas en T2 de rutina con una red neuronal convolucional profunda. Neurobiol. Edad 105, 78–85 (2021).

Artículo PubMed Google Académico

Hosny, A., Parmar, C., Quackenbush, J., Schwartz, LH y Aerts, H. Inteligencia artificial en radiología. Nat. Rev. Cáncer 18, 500–510 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Arbabshirani, MR et al. Aprendizaje automático avanzado en acción: identificación de hemorragia intracraneal en tomografías computarizadas de la cabeza con integración de flujo de trabajo clínico. Dígito NPJ. Medicina. 1, 9 (2018).

Artículo PubMed PubMed Central Google Académico

Chilamkurthy, S. et al. Algoritmos de aprendizaje profundo para la detección de hallazgos críticos en tomografías computarizadas de la cabeza: un estudio retrospectivo. Lancet 392, 2388–2396 (2018).

Artículo PubMed Google Académico

Ginat, DT Análisis de tomografías computarizadas de cabeza marcadas por software de aprendizaje profundo para hemorragia intracraneal aguda. Neurorradiología 62, 335–340 (2020).

Artículo PubMed Google Académico

Kuo, W., Hne, C., Mukherjee, P., Malik, J. & Yuh, EL Detección a nivel experto de hemorragia intracraneal aguda en tomografía computarizada de la cabeza mediante aprendizaje profundo. proc. nacional Academia ciencia EE. UU. 116, 22737–22745 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Soun, JE et al. Inteligencia artificial e imágenes de accidentes cerebrovasculares agudos. Soy. J. Neuroradiol. 42, 2–11 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Ye, H. et al. Diagnóstico preciso de hemorragia intracraneal y subtipos utilizando una red neuronal convolucional y recurrente conjunta tridimensional. EUR. Radiol. 29, 6191–6201 (2019).

Artículo PubMed PubMed Central Google Académico

Schmidt-Erfurth, U. et al. Aprendizaje automático para analizar el valor pronóstico de los biomarcadores de imágenes actuales en la degeneración macular neovascular relacionada con la edad. Oftalmol. Retina 2, 24–30 (2018).

Artículo PubMed Google Académico

Wang, Z. et al. Clasificación no invasiva de microcalcificaciones con mamografía de rayos X de contraste de fase. Nat. común 5, 3797 (2014).

Artículo CAS PubMed Google Académico

Fernando, T., Gammulle, H., Denman, S., Sridharan, S. y Fookes, CJ ae-p. Aprendizaje profundo para la detección de anomalías médicas: una encuesta. https://arxiv.org/abs/2012.02364 (2020).

Ironside, N. et al. Algoritmo de segmentación totalmente automatizado para el análisis volumétrico de hematomas en hemorragia intracerebral espontánea. Carrera 50, 3416–3423 (2019).

Artículo PubMed Google Académico

Jang, J., Lee, HH, Park, JA y Kim, H. Detección de anomalías no supervisadas mediante redes antagónicas generativas en (1) H-MRS del cerebro. J. magn. resonancia 325, 106936 (2021).

Artículo CAS PubMed Google Académico

Schlegl, T., Seebock, P., Waldstein, SM, Langs, G. y Schmidt-Erfurth, U. f-AnoGAN: detección rápida de anomalías no supervisadas con redes antagónicas generativas. Medicina. Anal de imagen. 54, 30–44 (2019).

Artículo PubMed Google Académico

Schlegl, T., Seeböck, P., Waldstein, SM, Schmidt-Erfurth, U. & Langs, GJ ae-p. En: Procesamiento de la Información en Imagen Médica. https://arxiv.org/abs/1703.05921 (2017).

Dawud, AM, Yurtkan, K. & Oztoprak, H. Aplicación del aprendizaje profundo en neurorradiología: clasificación de hemorragias cerebrales mediante el aprendizaje por transferencia. computar Intel Neurosci. 2019, 4629859 (2019).

Artículo PubMed PubMed Central Google Académico

Lee, H. et al. Un algoritmo explicable de aprendizaje profundo para la detección de hemorragia intracraneal aguda a partir de pequeños conjuntos de datos. Nat. biomedicina Ing. 3, 173–182 (2019).

Artículo PubMed Google Académico

Prevedello, LM et al. Sistema automatizado de identificación de resultados de pruebas críticas y notificación en línea utilizando inteligencia artificial en imágenes. Radiología 285, 923–931 (2017).

Artículo PubMed Google Académico

Titano, JJ et al. Vigilancia automatizada de redes neuronales profundas de imágenes craneales para eventos neurológicos agudos. Nat. Medicina. 24, 1337–1341 (2018).

Artículo CAS PubMed Google Académico

Grewal, M., Srivastava, MM, Kumar, P. y Varadarajan, S. En: 2018 IEEE 15th International Symposium on Biomedical Imaging (ISBI 2018) 281–284 (2018).

Mauri, L. & Damiani, E. Estimación de la degradación de los activos de datos de aprendizaje automático. ACM J. 14, https://doi.org/10.1145/3446331 (2022).

Young, Z. & Steele, R. Evaluación empírica de la degradación del rendimiento de los modelos predictivos basados ​​en el aprendizaje automático: un estudio de caso en los sistemas de información de atención médica. En t. J.Inf. Administrar 2, 10070 (2022).

Google Académico

Esteva, A. et al. Clasificación a nivel dermatólogo del cáncer de piel con redes neuronales profundas. Naturaleza 542, 115–118 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Kooi, T. et al. Aprendizaje profundo a gran escala para la detección asistida por computadora de lesiones mamográficas. Medicina. Imagen. Anal. 35, 303–312 (2017).

Artículo PubMed Google Académico

Zhang, LW, Lin, J. y Karim, R. Detección de anomalías basada en la densidad del kernel adaptativo para sistemas no lineales. Saber Sistema basado 139, 50–63 (2018).

Artículo Google Académico

Fletcher, JG et al. Evaluación de la tomografía computarizada de cabeza espiral de dosis más baja para la detección de hallazgos intracraneales que causan déficits neurológicos. Soy. J. Neuroradiol. 40, 1855–1863 (2019).

CAS PubMed PubMed Central Google Académico

Fletcher, JG et al. Rendimiento del observador en la detección y clasificación de nódulos y masas hepáticas malignas con eliminación de ruido del espacio de imágenes de TC y reconstrucción iterativa. Radiología 276, 465–478 (2015).

Artículo PubMed Google Académico

Sage, A. & Badura, P. Detección de hemorragia intracraneal en TC de cabeza mediante red neuronal convolucional de doble rama, máquina de vector de soporte y bosque aleatorio. aplicación ciencia 10, https://doi.org/10.3390/app10217577 (2020).

Kingma, DP & Welling, M. En: Conferencia Internacional sobre Representaciones de Aprendizaje. https://arxiv.org/abs/1312.6114 (2013).

Kingma, DP & Welling, M. Introducción a los codificadores automáticos variacionales. Tendencias encontradas Mach. Aprender. 12, 4–89 (2019).

Artículo Google Académico

Goodfellow, IJ et al. En: Sistemas de procesamiento de información neuronal. https://arxiv.org/abs/1406.2661 (2014).

Descargar referencias

Este estudio fue financiado por SK Inc. C&C. El financiador del estudio participó en la recopilación, gestión y análisis de los datos utilizados durante el desarrollo del algoritmo de IA. El autor correspondiente tuvo acceso completo a la mayoría de los conjuntos de datos y a todas las estimaciones resumidas de cada conjunto de datos y tuvo la responsabilidad final de la decisión de enviar el manuscrito para su publicación. Agradecemos a Synex por la coordinación del estudio.

Instituto de Medicina Radiológica, Centro de Investigación Médica de la Universidad Nacional de Seúl, Seúl, República de Corea

Tae Jin Yun, Seung Hong Choi, Roh-Eul Yoo e In Pyeong Hwang

Departamento de Radiología, Hospital Universitario Nacional de Seúl, Seúl, República de Corea

Tae Jin Yun, Seung Hong Choi, Roh-Eul Yoo e In Pyeong Hwang

Departamento de Radiología, Facultad de Medicina de la Universidad de Ajou, Suwon, República de Corea

Jin Wook Choi, Miran Han y Woo Sang Jung

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

TJY y JWC concibieron y diseñaron el estudio. TJY, JWC, MH, WSJ, SHC, R.-EY e IPH recopilaron y seleccionaron los datos para el desarrollo de IA. TJY y JWC recopilaron y seleccionaron los datos para el estudio de lectores. TJY y JWC diseñaron el protocolo de estudio del lector. TJY y JWC realizaron el análisis estadístico. TJY y JWC interpretaron los resultados del estudio de validación. TJY y JWC escribieron el borrador inicial. Todos los autores editaron posteriormente el informe. TJY y JWC supervisaron el proyecto.

Correspondencia a Jin Wook Choi.

Los autores declaran no tener conflictos de intereses.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Yun, TJ, Choi, JW, Han, M. et al. Algoritmo de detección automática basado en aprendizaje profundo para hemorragia intracraneal aguda: un ensayo clínico aleatorizado fundamental. npj Dígito. Medicina. 6, 61 (2023). https://doi.org/10.1038/s41746-023-00798-8

Descargar cita

Recibido: 10 Septiembre 2022

Aceptado: 10 de marzo de 2023

Publicado: 07 abril 2023

DOI: https://doi.org/10.1038/s41746-023-00798-8

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt