Logo do repositório
 
Publicação

Classificação de documentos com processamento de linguagem natural

dc.contributor.advisorPereira, Carlos Manuel Jorge da Silva
dc.contributor.authorSantos, Cedric Michael dos
dc.date.accessioned2016-11-04T16:37:30Z
dc.date.available2016-11-04T16:37:30Z
dc.date.issued2015
dc.description.abstractA quantidade de informação tem vindo a crescer ao longo dos anos, e a sua sobrecarga é hoje, um dos grandes problemas que as empresas e instituições enfrentam. A classificação dos documentos de forma automática surge então como uma necessidade, visto um sistema automático ser capaz de classificar milhares de documentos em apenas alguns segundos, o que seria impraticável de ser realizado por um ser humano. O maior desafio nesta área é obter os melhores resultados, maior eficiência computacional e maior capacidade de auto-aprendizagem, através nomeadamente da implementação de técnicas para a melhor seleção de features. Este trabalho analisa e compara técnicas de classificação com processamento de linguagem natural, através da linguagem Python e com apoio da biblioteca para processamento de linguagem natural Natural Language Toolkit (NLTK). Neste projeto, foram implementados algoritmos para classificação de documentos, com técnicas de Text Mining e NLP, utilizando classificadores como Redes Neuronais, SVM’s e Redes Bayesianas. Foram avaliados em vários casos de estudo e os resultados obtidos nos diferentes estudos atingiram valores médios acima de 90% de accuracy. Um dos principais objetivos deste projeto é aplicar os classificadores implementados na classificação de literatura na área das proteínas. Como resultado deste projeto, foi também implementada uma aplicação web para classificação de documentos, disponibilizando os algoritmos implementados.pt_PT
dc.identifier.tid201332477
dc.identifier.urihttp://hdl.handle.net/10400.26/15293
dc.language.isoporpt_PT
dc.subjectClassificação de textospt_PT
dc.subjectText miningpt_PT
dc.subjectRedes neuronaispt_PT
dc.titleClassificação de documentos com processamento de linguagem naturalpt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT

Ficheiros

Principais
A mostrar 1 - 1 de 1
A carregar...
Miniatura
Nome:
Cedric-Michael-Santos.pdf
Tamanho:
4.94 MB
Formato:
Adobe Portable Document Format
Licença
A mostrar 1 - 1 de 1
Miniatura indisponível
Nome:
license.txt
Tamanho:
1.85 KB
Formato:
Item-specific license agreed upon to submission
Descrição: