| Nome: | Descrição: | Tamanho: | Formato: | |
|---|---|---|---|---|
| 1.48 MB | Adobe PDF |
Autores
Orientador(es)
Resumo(s)
Classificação de documentos com aprendizagem profunda é uma abordagem avançada
para categorizar automaticamente documentos em diferentes classes ou categorias, como por
exemplo os sentimentos, tópicos ou outros tipos de conteúdos. Essa abordagem envolve o uso de
redes neurais profundas, que são modelos de aprendizado de mÔquina capazes de aprender
representaƧƵes complexas dos dados.
Neste relatório apresento uma aplicação baseada em redes neurais profundas (Deep
Learning) para a classificação de diferentes tipos de documentos. Inclui todas as técnicas
necessƔrias para resultados eficientes em cada etapa do projecto.
Os documentos sĆ£o processados para remover ruĆdos, normalizar o texto (remover
pontuações, letras maiúsculas, etc.) e criar representações numéricas dos textos, como vetores de
palavras (Word Embeddings) ou representaƧƵes baseadas em sub-palavras.
Foi escolhida uma arquitetura de rede neural profunda, redes neurais recorrentes (RNNs).
O modelo é treinado num conjunto de dados rotulados, onde os rótulos indicam as categorias à s
quais os documentos pertencem.
Durante o treinamento, o modelo ajusta os seus pesos e parâmetros para minimizar a
diferença entre as previsões e os rótulos reais. Isso é feito usando algoritmos de optimização e
funções de perda. O modelo treinado é avaliado num conjunto separado de dados de validação ou
teste para verificar o seu desempenho e ajustar os hiperparâmetros, se necessÔrio. Esse processo
ajuda a evitar o sobreajuste (overfitting) do modelo aos dados de treinamento.
Finalmente, o modelo Ć© avaliado num conjunto de teste independente para medir a sua
capacidade de generalização em dados não vistos. Isso fornece uma estimativa realista do
desempenho do modelo em ambientes do mundo real. Uma vez que o modelo atinja um
desempenho satisfatório, ele pode ser implantado para classificar automaticamente novos
documentos em categorias relevantes. Para o nosso caso a perda (Loss): 0.546 indica que o
modelo estÔ fazendo previsões razoavelmente próximas aos valores reais, o que é um bom sinal.
E a precisão (Accuracy) : 0.860 (ou 86%) sugere que o modelo classificou corretamente 86%.
Isso Ć© uma taxa de acerto relativamente alta e indica que o modelo estĆ” realizando bem a tarefa.
