Localización de Nódulos Pulmonares

Suman Gunnala, Anil Luthra, Tony Reina, Kyle Shannon

La tomografía computarizada (TC) ha reemplazado recientemente a los rayos X convencionales como la herramienta principal de detección de cáncer de pulmón porque se ha demostrado que reduce la mortalidad hasta en un 20% en pacientes de alto riesgo. Desafortunadamente, hay una alta tasa de falsos positivos (FPR) asociada con la detección por TC. Se detecta al menos un 'nódulo pulmonar' en la mitad de todas las exploraciones por TC, pero solo el 10% de estos 'nódulos' son de hecho cancerosos. El objetivo de este proyecto fue mejorar tanto la localización como la clasificación de nódulos pulmonares usando métodos de aprendizaje profundo con el conjunto de datos LUNA16.

tensorflow amazon-aws cnn-unet
Localización de Nódulos Pulmonares
Inferencia a través de escaneo TC mostrando 3 planos axiales

Descripción General

Este proyecto de tesis de maestría se centró en desarrollar pipelines de aprendizaje profundo para la detección y clasificación automatizada de nódulos pulmonares utilizando datos de escaneo por TC. El trabajo abordó el desafío crítico de las altas tasas de falsos positivos en el cribado de cáncer de pulmón, donde aproximadamente el 50% de los escaneos por TC muestran al menos un nódulo, pero solo el 10% son realmente cancerosos. Utilizando el conjunto de datos LUNA16, desarrollamos un enfoque de dos etapas que combina arquitecturas U-Net para la localización de nódulos con modelos de clasificación para la reducción de falsos positivos.

ROI with cancerous nodule Classification results

Enfoque Técnico

Nuestra metodología consistió en tres componentes principales:

  • Pipeline de preprocesamiento de datos para normalizar y segmentar volúmenes de escaneo por TC, extrayendo regiones de interés mientras se mantiene el contexto espacial
  • Arquitectura U-Net 3D para detección y localización de nódulos a través de planos axiales, coronales y sagitales
  • Modelo de clasificación basado en CNN para la reducción de falsos positivos, entrenado con candidatos a nódulos etiquetados
Data processing pipeline Storage pipeline

Resultados

Los modelos lograron un rendimiento competitivo en los benchmarks del desafío LUNA16. Nuestro detector basado en U-Net demostró una fuerte sensibilidad para la localización de nódulos, mientras que el pipeline de clasificación redujo significativamente los falsos positivos. Las curvas de Free-Response Receiver Operating Characteristic (FROC) mostraron mejoras sobre los métodos de referencia, particularmente para nódulos más pequeños que son los más difíciles de detectar.

FROC curve results CT scan planes

Implementación Técnica

  • TensorFlow y Keras para el desarrollo y entrenamiento de modelos de aprendizaje profundo
  • Instancias AWS EC2 P2 con GPUs NVIDIA K80 para el entrenamiento de modelos
  • Pipeline de datos personalizado para procesar grandes conjuntos de datos de imágenes médicas (formato DICOM)
  • Amplia aumentación de datos incluyendo rotaciones, traslaciones y transformaciones de intensidad
Master's thesis poster

Haga clic para ver el póster en tamaño completo (PDF)


Este proyecto se completó como tesis de Maestría en Ciencia de Datos e Ingeniería en UC San Diego, demostrando la aplicación del aprendizaje profundo a desafíos críticos de atención médica en la detección temprana del cáncer.