Logo do repositório
 
Publicação

Classificação automática de textos através reconhecimento de entidades

dc.contributor.advisorPereira, Carlos Manuel Jorge da Silvapt_PT
dc.contributor.authorCosta, Paulo Alexandre Fernandes
dc.date.accessioned2016-03-15T14:51:02Z
dc.date.available2016-03-15T14:51:02Z
dc.date.issued2014
dc.description.abstractA sociedade de informação é um conceito que surge no fim do Século XX e que está diretamente relacionado com a Globalização. Neste contexto podemos considerar que a sociedade se encontra num processo contínuo de formação e expansão. Com o surgimento das redes sociais e com a evolução tecnológica de vários tipos de dispositivos inteligentes assistiu-se a um crescimento alucinante na partilha de um conjunto vasto de informação. Assim, a gestão desta torna-se difícil ou praticamente impossível, sem utilização de ferramentas que permitam filtrar o que realmente é importante para o contexto das organizações, para que estas possam identificar novas oportunidades de negócio. Neste contexto sendo a CISION Portugal líder de mercado na monitorização e segmentação de informação, urge a necessidade de melhorar o seu processo de produção, para uma melhor resposta às exigências do mercado. Esta investigação apresenta então um novo método de indexação e segmentação de conteúdos para ser aplicado no processo interno de produção da CISION Portugal, tendo por base a identificação automática de entidades nos textos jornalísticos produzidos online e a sua relevância para um determinado tema. Verificou-se que o novo método para temas com pouca ambiguidade funciona e consegue resultados semelhantes aos que atualmente existem, sendo que as propostas de indexação chegam mesmo a atingir um grau de certeza próximo dos 100%. Para os temas com um elevado grau de ambiguidade e que, por sua vez, exigem uma equipa de validação de conteúdos, a investigação abordou a questão para um tema específico, através do desenvolvimento de um sistema de classificação automática de texto, utilizando para tal algoritmos probabilísticos. A seleção do conjunto treino, para os sistemas anteriormente referidos, foi criado sem recorrer ao histórico interno produzido pelas equipas da CISION Portugal, utilizando apenas a identificação das entidades. Os resultados obtidos quando comparados com os atuais demonstram que é possível reduzir o número de propostas irrelevantes e fazer a indexação de conteúdos sem necessidade de recorrer a uma supervisão inicial por parte de uma equipa.pt_PT
dc.identifier.tid201191830
dc.identifier.urihttp://hdl.handle.net/10400.26/12344
dc.language.isoporpt_PT
dc.peerreviewednopt_PT
dc.subjectClassificação de textospt_PT
dc.subjectIndexação de conteúdospt_PT
dc.subjectSegmentação de conteúdospt_PT
dc.titleClassificação automática de textos através reconhecimento de entidadespt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT

Ficheiros

Principais
A mostrar 1 - 1 de 1
A carregar...
Miniatura
Nome:
Paulo-Costa.pdf
Tamanho:
3.57 MB
Formato:
Adobe Portable Document Format
Licença
A mostrar 1 - 1 de 1
Miniatura indisponível
Nome:
license.txt
Tamanho:
1.85 KB
Formato:
Item-specific license agreed upon to submission
Descrição: