Name: | Description: | Size: | Format: | |
---|---|---|---|---|
1002.74 KB | Adobe PDF |
Authors
Advisor(s)
Abstract(s)
Detectar humor é um passo necessário para a compreensão da linguagem. No entanto,
o trabalho sobre humor computacional para português ainda é limitado. Para este
idioma, abordamos a tarefa de localização de trocadilhos. Com um dataset de textos
anotados com trocadilhos, realizámos o fine-tuning de modelos de linguagem para categorizar
palavras, num dado contexto, como trocadilhos ou não. A categorização foi
realizada através de uma abordagem com sequence labeling. Alcançámos uma medida
F1 de 0,75 no modelo de linguagem BERT e mostramos que é possível melhorar a sua
precisão com pós-processamento. Além disso, mostrámos que um modelo treinado
para localização de trocadilhos pode ser usado também para deteção de trocadilhos,
atingindo um desempenho quase tão bom como um modelo treinado especificamente
para esta última tarefa, mas com a vantagem de identificar as palavras do trocadilho,
contribuindo assim para a explicabilidade do humor. Foi também explorada a capacidade
de generalização dos modelos de linguagem para português de Portugal e português
do Brasil, ainda que com resultados pouco conclusivos.
Description
Keywords
Humor Computacional Localização de trocadilhos Deteção de trocadilhos Desambiguação de trocadilhos Processamento Computacional de Português