Logo do repositório
 
A carregar...
Miniatura
Publicação

Modelo de classificação de documento

Utilize este identificador para referenciar este registo.
Nome:Descrição:Tamanho:Formato: 
Relatorio Final - Jose Nduli (1).pdf1.48 MBAdobe PDF Ver/Abrir

Orientador(es)

Resumo(s)

Classificação de documentos com aprendizagem profunda é uma abordagem avançada para categorizar automaticamente documentos em diferentes classes ou categorias, como por exemplo os sentimentos, tópicos ou outros tipos de conteúdos. Essa abordagem envolve o uso de redes neurais profundas, que são modelos de aprendizado de mÔquina capazes de aprender representações complexas dos dados. Neste relatório apresento uma aplicação baseada em redes neurais profundas (Deep Learning) para a classificação de diferentes tipos de documentos. Inclui todas as técnicas necessÔrias para resultados eficientes em cada etapa do projecto. Os documentos são processados para remover ruídos, normalizar o texto (remover pontuações, letras maiúsculas, etc.) e criar representações numéricas dos textos, como vetores de palavras (Word Embeddings) ou representações baseadas em sub-palavras. Foi escolhida uma arquitetura de rede neural profunda, redes neurais recorrentes (RNNs). O modelo é treinado num conjunto de dados rotulados, onde os rótulos indicam as categorias às quais os documentos pertencem. Durante o treinamento, o modelo ajusta os seus pesos e parâmetros para minimizar a diferença entre as previsões e os rótulos reais. Isso é feito usando algoritmos de optimização e funções de perda. O modelo treinado é avaliado num conjunto separado de dados de validação ou teste para verificar o seu desempenho e ajustar os hiperparâmetros, se necessÔrio. Esse processo ajuda a evitar o sobreajuste (overfitting) do modelo aos dados de treinamento. Finalmente, o modelo é avaliado num conjunto de teste independente para medir a sua capacidade de generalização em dados não vistos. Isso fornece uma estimativa realista do desempenho do modelo em ambientes do mundo real. Uma vez que o modelo atinja um desempenho satisfatório, ele pode ser implantado para classificar automaticamente novos documentos em categorias relevantes. Para o nosso caso a perda (Loss): 0.546 indica que o modelo estÔ fazendo previsões razoavelmente próximas aos valores reais, o que é um bom sinal. E a precisão (Accuracy) : 0.860 (ou 86%) sugere que o modelo classificou corretamente 86%. Isso é uma taxa de acerto relativamente alta e indica que o modelo estÔ realizando bem a tarefa.

Descrição

Palavras-chave

Contexto Educativo

Citação

Projetos de investigação

Unidades organizacionais

FascĆ­culo

Editora

LicenƧa CC

Sem licenƧa CC