Repository logo
 
Publication

Classificação de dados biológicos : características e classificadores

dc.contributor.advisorPereira, Carlos Manuel Jorge da Silva
dc.contributor.authorCorreia, Daniel João Bastos
dc.date.accessioned2017-01-03T14:49:53Z
dc.date.available2017-01-03T14:49:53Z
dc.date.issued2012
dc.description.abstractReconhecendo a importância que o estudo das proteínas desempenha para a compreensão de inúmeros sistemas biológicos, este trabalho tem por objetivo analisar e explorar a efetividade da utilização de técnicas de data mining para classificação de proteínas, aplicadas ao caso de estudo da deteção de peptidases. A metodologia apresentada e avaliada é baseada em técnicas de text mining aplicadas à estrutura primária das proteínas, conjugadas com algoritmos de classificação supervisionada. São apresentados resultados para os algoritmos baseados em máquinas de vetor de suporte, nomeadamente C-SVC, One-Class e LASVM (incremental). Para o caso de estudo da deteção de peptidases, o algoritmo que apresentou melhores resultados foi o C-SVC. A utilização do algoritmo One-Class apresentou uma diminuição da capacidade de deteção de peptidases relativamente ao C-SVC. Apesar disso, o algoritmo One-Class pode ser uma solução de compromisso quando só são conhecidos exemplos positivos. Através da utilização do algoritmo incremental LASVM, conseguiram-se resultados muito próximos do C-SVC. Contudo, não foi possível superá-los, mas os resultados obtidos apresentam ganhos significativos ao nível do tempo de treino e da complexidade dos modelos gerados, tornando-se um algoritmo bastante válido para aplicar a problemas que disponham de uma grande quantidade de exemplos de treino. Além da análise e avaliação dos algoritmos, foi também elaborada uma plataforma web, “Bioink Search”, que permite aplicar as metodologias descritas para a deteção de peptidases.pt_PT
dc.identifier.tid 201509385
dc.identifier.urihttp://hdl.handle.net/10400.26/17234
dc.language.isoporpt_PT
dc.relationBIOINK- Incremental Kernel Learning for Biological Data Analysis
dc.subjectProteínaspt_PT
dc.subjectDeteção de Peptidasespt_PT
dc.subjectText miningpt_PT
dc.subjectSupport Vector Machinespt_PT
dc.subjectOne-Classpt_PT
dc.subjectLASVMpt_PT
dc.subjectWeb Platformpt_PT
dc.titleClassificação de dados biológicos : características e classificadorespt_PT
dc.typemaster thesis
dspace.entity.typePublication
oaire.awardTitleBIOINK- Incremental Kernel Learning for Biological Data Analysis
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/5876-PPCDTI/PTDC%2FEIA%2F71770%2F2006/PT
oaire.fundingStream5876-PPCDTI
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.nameFundação para a Ciência e a Tecnologia
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT
relation.isProjectOfPublication19996d28-3cef-411f-a49e-2e8ac3830731
relation.isProjectOfPublication.latestForDiscovery19996d28-3cef-411f-a49e-2e8ac3830731
thesis.degree.grantorInstituto Politécnico de Coimbra

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Daniel-Joao-Correia.pdf
Size:
2.65 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.85 KB
Format:
Item-specific license agreed upon to submission
Description: