Name: | Description: | Size: | Format: | |
---|---|---|---|---|
784.25 KB | Adobe PDF |
Advisor(s)
Abstract(s)
Apresentamos duas abordagens distintas `a tarefa
de avalia¸c˜ao conjunta ASSIN onde, dada uma cole¸c˜ao
de pares de frases escritas em portuguˆes, s˜ao colocados dois objectivos para cada par: (a) calcular a
similaridade semˆantica entre as duas frases; e (b) verificar se uma frase do par ´e par´afrase ou inferˆencia
da outra. Uma primeira abordagem, apelidada de
Reciclagem, baseia-se exclusivamente em heur´ısticas
sobre redes semˆanticas para a l´ıngua portuguesa. A
segunda abordagem, apelidada de ASAPP, baseia-se
em aprendizagem autom´atica supervisionada. Acima
de tudo, os resultados da abordagem Reciclagem permitem comparar, de forma indireta, um conjunto de
redes semˆanticas, atrav´es do seu desempenho nesta
tarefa. Estes resultados, algo modestos, foram depois utilizados como caracter´ısticas da abordagem
ASAPP, juntamente com caracter´ısticas adicionais, ao
n´ıvel lexical e sint´atico. Ap´os compara¸c˜ao com os resultados da cole¸c˜ao dourada, verifica-se que a abordagem ASAPP supera a abordagem Reciclagem de
forma consistente. Isto ocorre tanto para o Portuguˆes
Europeu como para o Portuguˆes Brasileiro, onde o desempenho atinge uma exatid˜ao de 80.28%±0.019 para
a inferˆencia textual, enquanto que a correla¸c˜ao dos
valores atribu´ıdos para a similaridade semˆantica com
aqueles atribu´ıdos por humanos ´e de 66.5% ± 0.021.
Description
Keywords
similaridade semântica inferência textual redes léxico-semânticas aprendizagem automática semantic similarity entailment lexical semantic networks machine learning