Sequence labeling for pun location and detection in Portuguese

Gameiro, Patrícia Moura

http://hdl.handle.net/10400.26/54350

Use this identifier to reference this record.

Name:	Description:	Size:	Format:
Patricia-Moura-Gameiro.pdf		1002.74 KB	Adobe PDF	Download

Send Feedback

Authors

Gameiro, Patrícia Moura

Advisor(s)

Alves, Ana Cristina Costa Oliveira

Abstract(s)

Detectar humor é um passo necessário para a compreensão da linguagem. No entanto, o trabalho sobre humor computacional para português ainda é limitado. Para este idioma, abordamos a tarefa de localização de trocadilhos. Com um dataset de textos anotados com trocadilhos, realizámos o fine-tuning de modelos de linguagem para categorizar palavras, num dado contexto, como trocadilhos ou não. A categorização foi realizada através de uma abordagem com sequence labeling. Alcançámos uma medida F1 de 0,75 no modelo de linguagem BERT e mostramos que é possível melhorar a sua precisão com pós-processamento. Além disso, mostrámos que um modelo treinado para localização de trocadilhos pode ser usado também para deteção de trocadilhos, atingindo um desempenho quase tão bom como um modelo treinado especificamente para esta última tarefa, mas com a vantagem de identificar as palavras do trocadilho, contribuindo assim para a explicabilidade do humor. Foi também explorada a capacidade de generalização dos modelos de linguagem para português de Portugal e português do Brasil, ainda que com resultados pouco conclusivos.