Repository logo
 
Loading...
Thumbnail Image
Publication

Data mining applied to the Varicocele condition

Use this identifier to reference this record.
Name:Description:Size:Format: 
Judith-Santos-Pereira.pdf13.39 MBAdobe PDF Download

Abstract(s)

O sistema de saúde guarda cada vez mais informação dos seus utentes o que dificulta ou até impossibilita a descoberta de novos conhecimentos só com as técnicas usualmente utilizadas, i.e., as tradicionais técnicas estatísticas. De facto, os investigadores clínicos têm sentido uma crescente necessidade em extrair novos conhecimentos para continuadamente contribuir para o melhoramento dos serviços de saúde prestados. Essa necessidade tem vindo a ser colmatada com a aplicação de um processo, chamado “data mining”, que auxilia, através da aplicação de diversas técnicas (i.e., classificação, clustering, associação, etc.), a descoberta de padrões de dados vistos como interessantes, mas ocultados com as tradicionais técnicas estatísticas. A área da infertilidade masculina já começou a aplicar o data mining, por exemplo, através da aplicação da técnica de classificação para prever o sucesso de uma técnica de Procriação Medicamente Assistida. Contudo, o varicocelo - um síndrome anatómico de varizes escrotais caracterizado pela dilatação das veias que drenam o sangue da região dos testículos que em certos casos dá origem à infertilidade - não foi ainda explorado com uma técnica de data mining. A sua prevalência atinge 40% dos homens tratados por infertilidade, sendo que a infertilidade masculina abrange 50% das causas da infertilidade de um casal. A correção do varicocelo pode ser alcançada com um tratamento radiológico chamado embolização, que tem por objetivo desvitalizar as veias dilatadas através da introdução de substâncias terapêuticas na circulação sanguínea. Neste contexto, este trabalho teve os seguintes principais objetivos: i) averiguar o sucesso da correção do varicocelo com a técnica da embolização através da identificação de algum melhoramento na média dos valores dos parâmetros seminais ou das categorias seminais com recurso a técnicas estatísticas inferenciais (i.e. ANOVA e Chi-quadrado); ii) predizer o sucesso da embolização com técnicas de classificação através da aplicação do decision tree do RapidMiner e do algoritmo W-J48; iii) identificar padrões que caracterizam os pacientes embolizados com a técnica de clustering através do algoritmo K-Means e eleger as relações de atributos que ocorrem mais frequentemente através da técnica de associação com o algoritmo FP-Growth. Este processo de análise de dados seguiu a metodologia Cross-Industry Standard Process for Data mining (CRISP-DM) aplicando-a à análise de uma amostra de 293 homens inférteis descritos com 64 atributos que foram submetidos à embolização no Centro Hospitalar e Universitário de Coimbra (CHUC) entre Janeiro de 2007 e Abril de 2016. Os resultados obtidos indicam que a embolização melhora significativamente a média das concentrações de espermatozoides até 12 meses e de suas morfologias até 6 meses depois da embolização (ANOVA p<0.05) o que permite fundamentar o interesse em prever o sucesso desta técnica terapêutica. Sua previsão computarizada com a árvore de decisão do RapidMiner permitiu prever com uma Accuracy e F-measure de 70.59% e uma AUC de 0.750 que a probabilidade condicional de engravidar tendo um homem com uma severidade baixa ou média do varicocelo e uma parceira entre os 24 e 33 anos inclusive é de 70.83%. Também se viu que a frequência relativa, de pacientes com uma concentração de espermatozoides normal 3 meses depois da embolização e uma motilidade progressiva normal destes antes do tratamento, é mais alta em grupos de pacientes que raramente trabalham em ambientes tóxicos. Estes resultados permitem contribuir para as investigações em curso no domínio da infertilidade, assim como nidentificação de medidas que permitem um maior auxílio na descoberta do conhecimento. Nomeadamente, vimos que a aplicação conjunta dos algoritmos de data mining com as técnicas estatísticas inferenciais, assim como a aplicação de diversas técnicas de data mining (i.e., classificação, clustering e associação), potencia a descoberta do conhecimento em dados clínicos.

Description

Keywords

Data mining Varicocelo Embolização Parâmetros seminais

Citation

Research Projects

Organizational Units

Journal Issue