Repository logo
 
Publication

Search engine architecture

dc.contributor.advisorCosta, João Pedro Matos da
dc.contributor.authorAlves, Ana Sofia Silva
dc.date.accessioned2024-07-31T11:48:49Z
dc.date.available2024-07-31T11:48:49Z
dc.date.issued2020-09-28
dc.description.abstractOs constantes avanços na tecnologia proporcionam soluções que facilitam o processo da escrita de documentação, no entanto, particularmente em áreas técnicas e científicas, como a medicina e a indústria farmacêutica, a revisão e a associação de conceitos e técnicas, continuam a requerer um esforço dos intervenientes no seu processo de escrita. A plataforma doDOC surge com o intuito de ajudar profissionais a pouparem esforços neste processo, investindo sempre na procura de inovações, com vista a proporcionar melhorias contínuas. A extração de informação adequada é fundamental para analisar e interpretar este volume de informação de modo a agilizar e colaborar na escrita destes documentos.Este estudo propõe um sistema que permite a pesquisa de termos em documentos e, retorna a definição do termo pesquisado e as relações que possam estar associadas ao mesmo. Para o atingir, foi realizado um estudo de aplicações utilizadas para extração de informação no contexto de clinical trials. O segundo passo incidiu num outro estudo de ferramentas que permitissem fazer indexação de estruturas e Full Text Search. Posto isto, foi criado um dicionário interno com base num repositório de informação médica selecionado: o Metathesarus, proveniente do UMLS. Seguiu-se o treino de vários modelos multi-task CNN, com os termos do dicionário criado, e a sua avaliação. Neste ponto, foi possível percorrer o conteúdo dos documentos da plataforma doDOC e proceder à criação de uma estrutura que armazene termos, juntamente com a sua definição, relações e localização no documento. Esta estrutura será periodicamente atualizada e indexada, possibilitando, numa fase final, que sejam realizadas pesquisas pelo utilizador, com uma resposta rápida e completa. Para o efeito, foi desenvolvido um endpoint para retornar o resultado da pesquisa ao utilizador.pt_PT
dc.identifier.tid203003390pt_PT
dc.identifier.urihttp://hdl.handle.net/10400.26/51438
dc.language.isoporpt_PT
dc.subjectExtração de Informaçãopt_PT
dc.subjectEstrutura de Dadospt_PT
dc.subjectPesquisapt_PT
dc.subjectÍndicespt_PT
dc.subjectFull Text Searchpt_PT
dc.titleSearch engine architecturept_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Ana Sofia Silva_Alves.pdf
Size:
1.46 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.85 KB
Format:
Item-specific license agreed upon to submission
Description: