Publication
Classificação de dados biológicos : características e classificadores
dc.contributor.advisor | Pereira, Carlos Manuel Jorge da Silva | |
dc.contributor.author | Correia, Daniel João Bastos | |
dc.date.accessioned | 2017-01-03T14:49:53Z | |
dc.date.available | 2017-01-03T14:49:53Z | |
dc.date.issued | 2012 | |
dc.description.abstract | Reconhecendo a importância que o estudo das proteínas desempenha para a compreensão de inúmeros sistemas biológicos, este trabalho tem por objetivo analisar e explorar a efetividade da utilização de técnicas de data mining para classificação de proteínas, aplicadas ao caso de estudo da deteção de peptidases. A metodologia apresentada e avaliada é baseada em técnicas de text mining aplicadas à estrutura primária das proteínas, conjugadas com algoritmos de classificação supervisionada. São apresentados resultados para os algoritmos baseados em máquinas de vetor de suporte, nomeadamente C-SVC, One-Class e LASVM (incremental). Para o caso de estudo da deteção de peptidases, o algoritmo que apresentou melhores resultados foi o C-SVC. A utilização do algoritmo One-Class apresentou uma diminuição da capacidade de deteção de peptidases relativamente ao C-SVC. Apesar disso, o algoritmo One-Class pode ser uma solução de compromisso quando só são conhecidos exemplos positivos. Através da utilização do algoritmo incremental LASVM, conseguiram-se resultados muito próximos do C-SVC. Contudo, não foi possível superá-los, mas os resultados obtidos apresentam ganhos significativos ao nível do tempo de treino e da complexidade dos modelos gerados, tornando-se um algoritmo bastante válido para aplicar a problemas que disponham de uma grande quantidade de exemplos de treino. Além da análise e avaliação dos algoritmos, foi também elaborada uma plataforma web, “Bioink Search”, que permite aplicar as metodologias descritas para a deteção de peptidases. | pt_PT |
dc.identifier.tid | 201509385 | |
dc.identifier.uri | http://hdl.handle.net/10400.26/17234 | |
dc.language.iso | por | pt_PT |
dc.relation | BIOINK- Incremental Kernel Learning for Biological Data Analysis | |
dc.subject | Proteínas | pt_PT |
dc.subject | Deteção de Peptidases | pt_PT |
dc.subject | Text mining | pt_PT |
dc.subject | Support Vector Machines | pt_PT |
dc.subject | One-Class | pt_PT |
dc.subject | LASVM | pt_PT |
dc.subject | Web Platform | pt_PT |
dc.title | Classificação de dados biológicos : características e classificadores | pt_PT |
dc.type | master thesis | |
dspace.entity.type | Publication | |
oaire.awardTitle | BIOINK- Incremental Kernel Learning for Biological Data Analysis | |
oaire.awardURI | info:eu-repo/grantAgreement/FCT/5876-PPCDTI/PTDC%2FEIA%2F71770%2F2006/PT | |
oaire.fundingStream | 5876-PPCDTI | |
project.funder.identifier | http://doi.org/10.13039/501100001871 | |
project.funder.name | Fundação para a Ciência e a Tecnologia | |
rcaap.rights | openAccess | pt_PT |
rcaap.type | masterThesis | pt_PT |
relation.isProjectOfPublication | 19996d28-3cef-411f-a49e-2e8ac3830731 | |
relation.isProjectOfPublication.latestForDiscovery | 19996d28-3cef-411f-a49e-2e8ac3830731 | |
thesis.degree.grantor | Instituto Politécnico de Coimbra |