Novo Framework e Datasets Sintéticos Aprimoram Análise de Imagens de ECG com Deep Learning
Utilizando o dataset de sinais PTB-XL como base, o framework proposto gera quatro datasets de acesso aberto, cada um focado em um aspecto específico da análise de imagens de ECG. O primeiro dataset consiste em imagens de ECG em várias configurações de derivações pareadas com sinais de séries temporais para digitalização. O segundo fornece imagens de ECG anotadas com caixas delimitadoras no formato YOLO para a detecção de regiões e nomes de derivações. Os datasets três e quatro contêm imagens de derivação única recortadas com máscaras de segmentação compatíveis com modelos baseados em U-Net, nas versões normal e com sobreposição.
Um destaque do trabalho é a criação do dataset de segmentação com sobreposição. Este dataset aborda o desafio comum na digitalização de ECGs impressos onde as formas de onda de derivações vizinhas se sobrepõem. No dataset de sobreposição, as formas de onda de derivações adjacentes são superpostas na imagem da derivação alvo, mas as máscaras de segmentação permanecem limpas, contendo apenas a forma de onda da derivação alvo.
O framework open-source permite que pesquisadores gerem e personalizem datasets de imagens de ECG em larga escala diretamente de sinais de séries temporais brutos. Os usuários podem ajustar facilmente vários parâmetros, como tamanho do dataset, layout visual, caminhos de arquivo e elementos estilísticos, incluindo visibilidade da grade, nomes das derivações, tamanho da fonte, cores da forma de onda e da grade, e preenchimento de margem. O framework opera em dados de séries temporais convertidos para o formato NumPy (.npy) a partir do dataset PTB-XL.
A detecção de regiões de interesse, como a área da derivação e os nomes das derivações, é um componente crítico na digitalização automatizada de ECGs. Embora existam datasets com caixas delimitadoras para derivações, o novo framework e os datasets buscam fornecer recursos em larga escala para a detecção tanto das derivações quanto de seus nomes correspondentes. O framework e os datasets estão disponíveis publicamente.