Name: | Description: | Size: | Format: | |
---|---|---|---|---|
13.39 MB | Adobe PDF |
Authors
Abstract(s)
O sistema de saúde guarda cada vez mais informação dos seus utentes o que dificulta ou até
impossibilita a descoberta de novos conhecimentos só com as técnicas usualmente utilizadas,
i.e., as tradicionais técnicas estatísticas. De facto, os investigadores clínicos têm sentido uma
crescente necessidade em extrair novos conhecimentos para continuadamente contribuir para o
melhoramento dos serviços de saúde prestados. Essa necessidade tem vindo a ser colmatada
com a aplicação de um processo, chamado “data mining”, que auxilia, através da aplicação de
diversas técnicas (i.e., classificação, clustering, associação, etc.), a descoberta de padrões de
dados vistos como interessantes, mas ocultados com as tradicionais técnicas estatísticas. A área
da infertilidade masculina já começou a aplicar o data mining, por exemplo, através da
aplicação da técnica de classificação para prever o sucesso de uma técnica de Procriação
Medicamente Assistida. Contudo, o varicocelo - um síndrome anatómico de varizes escrotais
caracterizado pela dilatação das veias que drenam o sangue da região dos testículos que em
certos casos dá origem à infertilidade - não foi ainda explorado com uma técnica de data mining.
A sua prevalência atinge 40% dos homens tratados por infertilidade, sendo que a infertilidade
masculina abrange 50% das causas da infertilidade de um casal. A correção do varicocelo pode
ser alcançada com um tratamento radiológico chamado embolização, que tem por objetivo
desvitalizar as veias dilatadas através da introdução de substâncias terapêuticas na circulação
sanguínea. Neste contexto, este trabalho teve os seguintes principais objetivos: i) averiguar o
sucesso da correção do varicocelo com a técnica da embolização através da identificação de
algum melhoramento na média dos valores dos parâmetros seminais ou das categorias seminais
com recurso a técnicas estatísticas inferenciais (i.e. ANOVA e Chi-quadrado); ii) predizer o
sucesso da embolização com técnicas de classificação através da aplicação do decision tree do
RapidMiner e do algoritmo W-J48; iii) identificar padrões que caracterizam os pacientes
embolizados com a técnica de clustering através do algoritmo K-Means e eleger as relações de
atributos que ocorrem mais frequentemente através da técnica de associação com o algoritmo
FP-Growth. Este processo de análise de dados seguiu a metodologia Cross-Industry Standard
Process for Data mining (CRISP-DM) aplicando-a à análise de uma amostra de 293 homens
inférteis descritos com 64 atributos que foram submetidos à embolização no Centro Hospitalar
e Universitário de Coimbra (CHUC) entre Janeiro de 2007 e Abril de 2016. Os resultados
obtidos indicam que a embolização melhora significativamente a média das concentrações de
espermatozoides até 12 meses e de suas morfologias até 6 meses depois da embolização
(ANOVA p<0.05) o que permite fundamentar o interesse em prever o sucesso desta técnica
terapêutica. Sua previsão computarizada com a árvore de decisão do RapidMiner permitiu
prever com uma Accuracy e F-measure de 70.59% e uma AUC de 0.750 que a probabilidade
condicional de engravidar tendo um homem com uma severidade baixa ou média do varicocelo
e uma parceira entre os 24 e 33 anos inclusive é de 70.83%. Também se viu que a frequência
relativa, de pacientes com uma concentração de espermatozoides normal 3 meses depois da
embolização e uma motilidade progressiva normal destes antes do tratamento, é mais alta em
grupos de pacientes que raramente trabalham em ambientes tóxicos. Estes resultados permitem
contribuir para as investigações em curso no domínio da infertilidade, assim como nidentificação de medidas que permitem um maior auxílio na descoberta do conhecimento.
Nomeadamente, vimos que a aplicação conjunta dos algoritmos de data mining com as técnicas
estatísticas inferenciais, assim como a aplicação de diversas técnicas de data mining (i.e.,
classificação, clustering e associação), potencia a descoberta do conhecimento em dados
clínicos.
Description
Keywords
Data mining Varicocelo Embolização Parâmetros seminais