Repository logo
 
Loading...
Thumbnail Image
Publication

Sequence labeling for pun location and detection in Portuguese

Use this identifier to reference this record.
Name:Description:Size:Format: 
Patricia-Moura-Gameiro.pdf1002.74 KBAdobe PDF Download

Abstract(s)

Detectar humor é um passo necessário para a compreensão da linguagem. No entanto, o trabalho sobre humor computacional para português ainda é limitado. Para este idioma, abordamos a tarefa de localização de trocadilhos. Com um dataset de textos anotados com trocadilhos, realizámos o fine-tuning de modelos de linguagem para categorizar palavras, num dado contexto, como trocadilhos ou não. A categorização foi realizada através de uma abordagem com sequence labeling. Alcançámos uma medida F1 de 0,75 no modelo de linguagem BERT e mostramos que é possível melhorar a sua precisão com pós-processamento. Além disso, mostrámos que um modelo treinado para localização de trocadilhos pode ser usado também para deteção de trocadilhos, atingindo um desempenho quase tão bom como um modelo treinado especificamente para esta última tarefa, mas com a vantagem de identificar as palavras do trocadilho, contribuindo assim para a explicabilidade do humor. Foi também explorada a capacidade de generalização dos modelos de linguagem para português de Portugal e português do Brasil, ainda que com resultados pouco conclusivos.

Description

Keywords

Humor Computacional Localização de trocadilhos Deteção de trocadilhos Desambiguação de trocadilhos Processamento Computacional de Português

Citation

Research Projects

Organizational Units

Journal Issue

Publisher

CC License