Publication
Search engine architecture
dc.contributor.advisor | Costa, João Pedro Matos da | |
dc.contributor.author | Alves, Ana Sofia Silva | |
dc.date.accessioned | 2024-07-31T11:48:49Z | |
dc.date.available | 2024-07-31T11:48:49Z | |
dc.date.issued | 2020-09-28 | |
dc.description.abstract | Os constantes avanços na tecnologia proporcionam soluções que facilitam o processo da escrita de documentação, no entanto, particularmente em áreas técnicas e científicas, como a medicina e a indústria farmacêutica, a revisão e a associação de conceitos e técnicas, continuam a requerer um esforço dos intervenientes no seu processo de escrita. A plataforma doDOC surge com o intuito de ajudar profissionais a pouparem esforços neste processo, investindo sempre na procura de inovações, com vista a proporcionar melhorias contínuas. A extração de informação adequada é fundamental para analisar e interpretar este volume de informação de modo a agilizar e colaborar na escrita destes documentos.Este estudo propõe um sistema que permite a pesquisa de termos em documentos e, retorna a definição do termo pesquisado e as relações que possam estar associadas ao mesmo. Para o atingir, foi realizado um estudo de aplicações utilizadas para extração de informação no contexto de clinical trials. O segundo passo incidiu num outro estudo de ferramentas que permitissem fazer indexação de estruturas e Full Text Search. Posto isto, foi criado um dicionário interno com base num repositório de informação médica selecionado: o Metathesarus, proveniente do UMLS. Seguiu-se o treino de vários modelos multi-task CNN, com os termos do dicionário criado, e a sua avaliação. Neste ponto, foi possível percorrer o conteúdo dos documentos da plataforma doDOC e proceder à criação de uma estrutura que armazene termos, juntamente com a sua definição, relações e localização no documento. Esta estrutura será periodicamente atualizada e indexada, possibilitando, numa fase final, que sejam realizadas pesquisas pelo utilizador, com uma resposta rápida e completa. Para o efeito, foi desenvolvido um endpoint para retornar o resultado da pesquisa ao utilizador. | pt_PT |
dc.identifier.tid | 203003390 | pt_PT |
dc.identifier.uri | http://hdl.handle.net/10400.26/51438 | |
dc.language.iso | por | pt_PT |
dc.subject | Extração de Informação | pt_PT |
dc.subject | Estrutura de Dados | pt_PT |
dc.subject | Pesquisa | pt_PT |
dc.subject | Índices | pt_PT |
dc.subject | Full Text Search | pt_PT |
dc.title | Search engine architecture | pt_PT |
dc.type | master thesis | |
dspace.entity.type | Publication | |
rcaap.rights | openAccess | pt_PT |
rcaap.type | masterThesis | pt_PT |