Logo do repositório
 
A carregar...
Miniatura
Publicação

Classificação de documentos com processamento de linguagem natural

Utilize este identificador para referenciar este registo.
Nome:Descrição:Tamanho:Formato: 
Cedric-Michael-Santos.pdf4.94 MBAdobe PDF Ver/Abrir

Resumo(s)

A quantidade de informação tem vindo a crescer ao longo dos anos, e a sua sobrecarga Ć© hoje, um dos grandes problemas que as empresas e instituiƧƵes enfrentam. A classificação dos documentos de forma automĆ”tica surge entĆ£o como uma necessidade, visto um sistema automĆ”tico ser capaz de classificar milhares de documentos em apenas alguns segundos, o que seria impraticĆ”vel de ser realizado por um ser humano. O maior desafio nesta Ć”rea Ć© obter os melhores resultados, maior eficiĆŖncia computacional e maior capacidade de auto-aprendizagem, atravĆ©s nomeadamente da implementação de tĆ©cnicas para a melhor seleção de features. Este trabalho analisa e compara tĆ©cnicas de classificação com processamento de linguagem natural, atravĆ©s da linguagem Python e com apoio da biblioteca para processamento de linguagem natural Natural Language Toolkit (NLTK). Neste projeto, foram implementados algoritmos para classificação de documentos, com tĆ©cnicas de Text Mining e NLP, utilizando classificadores como Redes Neuronais, SVM’s e Redes Bayesianas. Foram avaliados em vĆ”rios casos de estudo e os resultados obtidos nos diferentes estudos atingiram valores mĆ©dios acima de 90% de accuracy. Um dos principais objetivos deste projeto Ć© aplicar os classificadores implementados na classificação de literatura na Ć”rea das proteĆ­nas. Como resultado deste projeto, foi tambĆ©m implementada uma aplicação web para classificação de documentos, disponibilizando os algoritmos implementados.

Descrição

Palavras-chave

Classificação de textos Text mining Redes neuronais

Contexto Educativo

Citação

Projetos de investigação

Unidades organizacionais

FascĆ­culo