Deep learning, clave en el diagnóstico de cáncer de mama

Investigadores del MIT y del Hospital General de Massachusetts han desarrollado un modelo automatizado que evalúa el tejido mamario denso en mamografías, que es un factor de riesgo independiente para el cáncer de mama, tan confiable como los expertos radiólogos.

Esto marca la primera vez que un modelo de aprendizaje profundo de este tipo se ha utilizado con éxito en una clínica con pacientes reales, según los investigadores. Con una implementación amplia, los investigadores esperan que el modelo pueda ayudar a brindar mayor confiabilidad a las evaluaciones de densidad mamaria en todo el país.
Se estima que más del 40 por ciento de las mujeres estadounidenses tienen tejido mamario denso, que por sí solo aumenta el riesgo de cáncer de mama. Además, el tejido denso puede enmascarar los cánceres en la mamografía, lo que dificulta la detección. Como resultado, 30 estados de los EE. UU. ordenan que se notifique a las mujeres si sus mamografías indican que tienen mamas densas.
Pero las evaluaciones de la densidad mamaria se basan en la evaluación humana subjetiva. Debido a muchos factores, los resultados varían, a veces dramáticamente, entre los radiólogos. Los investigadores del MIT y MGH capacitaron un modelo de aprendizaje profundo en decenas de miles de mamografías digitales de alta calidad para aprender a distinguir diferentes tipos de tejido mamario, desde graso hasta extremadamente denso, según evaluaciones de expertos. Dada una nueva mamografía, el modelo puede identificar una medición de densidad que se alinee estrechamente con la opinión de los expertos.
“La densidad mamaria es un factor de riesgo independiente que impulsa la forma en que nos comunicamos con las mujeres sobre su riesgo de cáncer. Nuestra motivación fue crear una herramienta precisa y coherente, que se pueda compartir y utilizar en todos los sistemas de atención médica “, dice Adam Yala, estudiante de doctorado en el Laboratorio de Inteligencia Artificial y Ciencias del Ordenador (CSAIL) del MIT y segundo autor en un artículo que describe el modelo.

Los otros coautores son la primera autora, Constance Lehman, profesora de radiología en la Escuela de Medicina de Harvard y directora de diagnóstico de imágenes de mama en el MGH; El estudiante de doctorado de CSAIL Tal Schuster; Kyle Swanson ’18, investigador de CSAIL y estudiante graduado en el Departamento de Ingeniería Eléctrica y Ciencias de la Computación; y la autora principal, Regina Barzilay, profesora de Delta Electronics en CSAIL y el Departamento de Ingeniería Eléctrica y Ciencias de la Computación en MIT y miembro del Instituto Koch para la Investigación Integrativa del Cáncer en MIT.

Densidad de mapeo

El modelo se basa en una red neuronal convolucional (CNN), que también se utiliza para tareas de visión artificial. Los investigadores entrenaron y probaron su modelo en un conjunto de datos de más de 58,000 mamografías seleccionadas al azar de más de 39,000 mujeres examinadas entre 2009 y 2011. Para la capacitación, usaron alrededor de 41,000 mamografías y, para las pruebas, alrededor de 8,600 mamografías.
Cada mamograma en el conjunto de datos tiene un índice de densidad mamaria estándar del Sistema de Datos e Informes de Imágenes de los Senos (BI-RADS) en cuatro categorías: graso, disperso (densidad dispersa), heterogéneo (mayormente denso) y denso. Tanto en el entrenamiento como en las mamografías de prueba, alrededor del 40 por ciento fueron evaluados como heterogéneos y densos.
Durante el proceso de capacitación, el modelo recibe mamografías al azar para analizar. Aprende a mapear la mamografía con calificaciones de densidad igual que radiólogos expertos. Los senos densos, por ejemplo, contienen tejido conectivo glandular y fibroso, que aparecen como redes compactas de líneas blancas gruesas y manchas blancas sólidas. Las redes de tejido graso aparecen mucho más delgadas, con una zona gris en todas partes. En las pruebas, el modelo observa nuevas mamografías y predice la categoría de densidad más probable.

Evaluaciones coincidentes

El modelo se implementó en la división de imágenes mamarias en MGH. En un flujo de trabajo tradicional, cuando se realiza una mamografía, se envía a una estación de trabajo para que la evalúe un radiólogo. El modelo de los investigadores se instala en una máquina separada que intercepta las exploraciones antes de que llegue al radiólogo, y asigna a cada mamografía una clasificación de densidad. Cuando los radiólogos detienen una exploración en sus estaciones de trabajo, verán la calificación asignada del modelo, que luego aceptan o rechazan.
“Toma menos de un segundo por imagen … [y puede] escalarse de manera fácil y económica en todos los hospitales”, dice Yala.
En más de 10,000 mamografías en MGH de enero a mayo de este año, el modelo logró un 94 por ciento de acuerdo con los radiólogos del hospital en una prueba binaria: determinar si los senos eran heterogéneos y densos, o grasos y dispersos. En todas las cuatro categorías de BI-RADS, coincidió con las evaluaciones de los radiólogos en un 90 por ciento. “MGH es un importante centro de imágenes de mamas con un alto acuerdo ientre radiólogos, y este conjunto de datos de alta calidad nos permitió desarrollar un modelo sólido”, dice Yala.
En las pruebas generales utilizando el conjunto de datos original, el modelo igualó las interpretaciones originales de expertos humanos en un 77 por ciento en cuatro categorías BI-RADS y, en pruebas binarias, coincidió con las interpretaciones en un 87 por ciento.
En comparación con los modelos de predicción tradicionales, los investigadores utilizaron una métrica llamada puntuación kappa, donde 1 indica que las predicciones concuerdan cada vez, y algo más bajo indica menos casos de acuerdos. Las puntuaciones Kappa para los modelos de evaluación automática de la densidad disponibles en el mercado tienen una puntuación máxima de aproximadamente 0,6. En la aplicación clínica, el modelo de los investigadores obtuvo una puntuación de 0,85 kappa y, en las pruebas, obtuvo una puntuación de 0,67. Esto significa que el modelo hace mejores predicciones que los modelos tradicionales.
En un experimento adicional, los investigadores probaron el modelo con el consenso de cinco radiólogos MGH de 500 mamografías de prueba aleatorias. Los radiólogos asignaron la densidad mamaria a las mamografías sin conocimiento de la evaluación original, o las evaluaciones de sus pares o del modelo. En este experimento, el modelo logró una puntuación kappa de 0,78 con el consenso del radiólogo.
A continuación, los investigadores pretenden escalar el modelo en otros hospitales. “Aprovechando esta experiencia traslacional, exploraremos cómo hacer la transición de los algoritmos de aprendizaje automático desarrollados en el MIT a una clínica que beneficia a millones de pacientes”, dice Barzilay. “Esta es una carta del nuevo centro en MIT, la Clínica Abdul Latif Jameel para el Aprendizaje Automático en Salud en el MIT, que se lanzó recientemente. Y estamos entusiasmados con las nuevas oportunidades abiertas por este centro “.