Publicação
Classificação automática de textos através reconhecimento de entidades
| dc.contributor.advisor | Pereira, Carlos Manuel Jorge da Silva | pt_PT |
| dc.contributor.author | Costa, Paulo Alexandre Fernandes | |
| dc.date.accessioned | 2016-03-15T14:51:02Z | |
| dc.date.available | 2016-03-15T14:51:02Z | |
| dc.date.issued | 2014 | |
| dc.description.abstract | A sociedade de informação é um conceito que surge no fim do Século XX e que está diretamente relacionado com a Globalização. Neste contexto podemos considerar que a sociedade se encontra num processo contínuo de formação e expansão. Com o surgimento das redes sociais e com a evolução tecnológica de vários tipos de dispositivos inteligentes assistiu-se a um crescimento alucinante na partilha de um conjunto vasto de informação. Assim, a gestão desta torna-se difícil ou praticamente impossível, sem utilização de ferramentas que permitam filtrar o que realmente é importante para o contexto das organizações, para que estas possam identificar novas oportunidades de negócio. Neste contexto sendo a CISION Portugal líder de mercado na monitorização e segmentação de informação, urge a necessidade de melhorar o seu processo de produção, para uma melhor resposta às exigências do mercado. Esta investigação apresenta então um novo método de indexação e segmentação de conteúdos para ser aplicado no processo interno de produção da CISION Portugal, tendo por base a identificação automática de entidades nos textos jornalísticos produzidos online e a sua relevância para um determinado tema. Verificou-se que o novo método para temas com pouca ambiguidade funciona e consegue resultados semelhantes aos que atualmente existem, sendo que as propostas de indexação chegam mesmo a atingir um grau de certeza próximo dos 100%. Para os temas com um elevado grau de ambiguidade e que, por sua vez, exigem uma equipa de validação de conteúdos, a investigação abordou a questão para um tema específico, através do desenvolvimento de um sistema de classificação automática de texto, utilizando para tal algoritmos probabilísticos. A seleção do conjunto treino, para os sistemas anteriormente referidos, foi criado sem recorrer ao histórico interno produzido pelas equipas da CISION Portugal, utilizando apenas a identificação das entidades. Os resultados obtidos quando comparados com os atuais demonstram que é possível reduzir o número de propostas irrelevantes e fazer a indexação de conteúdos sem necessidade de recorrer a uma supervisão inicial por parte de uma equipa. | pt_PT |
| dc.identifier.tid | 201191830 | |
| dc.identifier.uri | http://hdl.handle.net/10400.26/12344 | |
| dc.language.iso | por | pt_PT |
| dc.peerreviewed | no | pt_PT |
| dc.subject | Classificação de textos | pt_PT |
| dc.subject | Indexação de conteúdos | pt_PT |
| dc.subject | Segmentação de conteúdos | pt_PT |
| dc.title | Classificação automática de textos através reconhecimento de entidades | pt_PT |
| dc.type | master thesis | |
| dspace.entity.type | Publication | |
| rcaap.rights | openAccess | pt_PT |
| rcaap.type | masterThesis | pt_PT |
