Name: | Description: | Size: | Format: | |
---|---|---|---|---|
2.26 MB | Adobe PDF |
Advisor(s)
Abstract(s)
Em época de crise financeira, as ferramentas open source de data mining representam uma nova
tendência na investigação, educação e nas aplicações industriais, especialmente para as pequenas e
médias empresas. Com o software open source, estas podem facilmente iniciar um projeto de data
mining usando as tecnologias mais recentes, sem se preocuparem com os custos de aquisição das
mesmas, podendo apostar na aprendizagem dos seus colaboradores. Os sistemas open source
proporcionam o acesso ao código, facilitando aos colaboradores a compreensão dos sistemas e
algoritmos e permitindo que estes o adaptem às necessidades dos seus projetos. No entanto, existem
algumas questões inerentes ao uso deste tipo de ferramenta. Uma das mais importantes é a diversidade,
e descobrir, tardiamente, que a ferramenta escolhida é inapropriada para os objetivos do nosso negócio
pode ser um problema grave. Como o número de ferramentas de data mining continua a crescer, a
escolha sobre aquela que é realmente mais apropriada ao nosso negócio torna-se cada vez mais difícil.
O presente estudo aborda um conjunto de ferramentas de data mining, de acordo com as suas
características e funcionalidades. As ferramentas abordadas provém da listagem do KDnuggets referente
a Software Suites de Data Mining. Posteriormente, são identificadas as que reúnem melhores condições
de trabalho, que por sua vez são as mais populares nas comunidades, e é feito um teste prático com
datasets reais. Os testes pretendem identificar como reagem as ferramentas a cenários diferentes do tipo:
performance no processamento de grandes volumes de dados; precisão de resultados; etc. Nos tempos
que correm, as ferramentas de data mining open source representam uma oportunidade para os seus
utilizadores, principalmente para as pequenas e médias empresas, deste modo, os resultados deste estudo
pretendem ajudar no processo de tomada de decisão relativamente às mesmas.
Description
Keywords
Open source Livre Data mining Conhecimento Descoberta de conhecimento Análise de dados