Percorrer por tipo de recurso "journal"
A mostrar 1 - 9 de 9
Resultados por página
Opções de ordenação
- Avaliação no Desafio de Identificação de PersonagensPublication . Willrich, Roberto; Santos, DianaA primeira edição do Desafio de Identificação de Personagens (DIP) foi uma avaliação conjunta de soluções computacionais para a identificação de personagens em textos literários, bem como a extração de caracterı́sticas destas personagens e seus relacionamentos. Para esta avaliação, foi necessária a definição de uma metodologia de avaliação, incluindo a seleção de métricas adequadas ao problema da identificação de personagens em textos literários. Este artigo apresenta uma panorâmica de avaliação na área de identificação de personagens em textos literários, assim como as escolhas concretas que foram realizadas pela comissão organizadora do DIP. Estas escolhas resultaram na definição da metodologia de avaliação do DIP. O uso da metodologia de avaliação proposta é ilustrado pela avaliação da solução candidata submetida ao DIP. Ao final, são apresentadas crı́ticas e sugestões de melhorias à metodologia de avaliação proposta.
- Clustering emotions in PortuguesePublication . Santos, Diana; Simões, AlbertoIn this paper we present some exploratory studies of emotion words based on large annotated corpora of Portuguese. Those corpora were automatically annotated with emotionality, and each emotion word was assigned one or more groups out of 26 emotion groups. Our goal is to evaluate those groups by applying different statistical approaches to our material, namely based on (a) co-occurrence in a sentence as a sign of closeness of meaning, and (b) word embeddings. After looking at the full material, we turn our attention to two specific emotion groups: Amor (‘love’) and Desespero (‘despair’), investigating whether clustering with those underlying techniques can help improve the shape, or redesign, particular emotion groups. In the paper we suggest some novel forms of measuring semantic coherence on word embedding models. Since computational research on emotion words in Portuguese is still rare, our methods and resources will lay the ground for future investigations.
- Culinária brasileira: um CorTrad mais saboroso com o CulBrasPublication . Rebechi, Rozane R.; Santos, Diana; Tagnin, Stella E. O.; RebechiEmbora muitos acreditem que traduzir receita culinária é algo corriqueiro, o tradutor experimenta problemas de diversos tipos ao se lançar a essa tarefa, desde a busca por equivalências lexicais até caracterı́sticas culturais. Uma fonte de consulta que pode ser de grande auxı́lio é um corpus paralelo, ou seja, textos numa lı́ngua com suas respectivas traduções. O CorTrad culinário, lançado em 2008, numa parceria entre o COMET e a Linguateca, tem desempenhado esse papel, permitindo vários tipos de pesquisas. É composto das receitas de um livro escrito originalmente em português, acompanhado de suas traduções em inglês. Neste artigo apresentamos um novo corpus culinário, o CulBras, composto apenas por receitas brasileiras, originalmente escritas em português e suas respectivas traduções em inglês, totalizando aproximadamente 120.000 palavras em cada lı́ngua. O processo de construção desse corpus é apresentado em detalhes, assim como são relatadas várias pesquisas possı́veis com os dois corpora, inclusive com a comparação entre eles. Convidamos os leitores a se deliciarem com o CulBras.
- DIP - Desafio de Identificação de Personagens: objectivo, organização, recursos e resultadosPublication . Santos, Diana; Mota, Cristina; Pires, Emanoel; Langfeldt, Marcia; Fuão, Rebeca Schumacher; Willrich, RobertoEste artigo apresenta o Desafio de Identificação de Personagens (DIP) em profundidade. Documenta a sua motivação, as escolhas feitas, o desenrolar do processo de organização, a avaliação conjunta, e os resultados que podemos mostrar, assim como os recursos compilados e que são públicos. Relatamos o que aprendemos com a organização do DIP e o que aprendemos sobre a literatura em português. Por exemplo, nas obras do DIP, (1) o número de personagens femininas é muito inferior ao das personagens masculinas, (2) existem sempre algumas personagens referidas com nomes diferentes na mesma obra, (3) a profissão mais mencionada é a de padre, (4) há mais referência a pais do que a mães, e (5) os diminutivos são bastante frequentes.
- Gender Depiction in Portuguese: Distant Reading Brazilian and Portuguese LiteraturePublication . Freitas, Claúdia; Santos, DianaIn this paper, we look at how masculine and feminine characters are described in literature in Portuguese using a publicly available literary corpus: Literateca. We investigate the words used to characterise human beings, after classifying them into four broad categories, namely those related to the social, appearance, character and emotional axes. We study the influence of genre, literary school, author gender, and time, among others.
- On the Variability of Portuguese Duration Adverbials with Por and DurantePublication . Santos, DianaThe fact that there are (at least) two different translations of the English preposition for used to describe duration in Portuguese, namely durante and por, shows that duration is an interesting area in the tense and aspect panorama of this language, which deserves close study. In this paper, I present an empirical study based on four different corpora to investigate the matter, looking at the Portuguese varieties from Brazil and Portugal and different text genres (general and specialised newspapers, oral interviews, and fiction). The material spans circa two centuries. This paper identifies some specific uses and preferences of the two adverbials and confirms and challenges other claims in the linguistic literature. It shows that narrative fiction is definitely different from newspaper text due to its need to describe short duration and that planned duration can be expressed using both kinds of adverbials.
- Pais, filhos e outras relações familiares no DIPPublication . Mota, Cristina; Santos, DianaNeste artigo é descrita em pormenor a tarefa de identificação de relações familiares no Desafio de Identificação de Personagens (DIP), uma avaliação conjunta para identificar personagens em textos literários em português. Explicamos a motivação para esta subtarefa, e quais as dificuldades em criar uma coleção dourada com os valores corretos. Depois de referir em abstrato como se processa a avaliação desta sub-tarefa, relatamos os resultados do sistema participante, o PALAVRAS-DIP, e comentamos alguns problemas na sua avaliação. Além disso, descrevemos aquilo que aprendemos sobre a literatura lusófona com esta tarefa, assim como sugerimos outras pesquisas possı́veis com este material.
- Placing GIS and NLP in literary geography: experiments with literature in PortuguesePublication . Santos, Diana; Alves, DanielIn this case study we discuss different approaches to the study of literature in digital humanities and try to join two methodologies, namely distant reading and spatial analysis. We first describe shortly the two projects involved, the Atlas of Literary Landscapes of Mainland Portugal and Literateca, highlighting and quantifying the different ways to deal with place in literature in Portuguese. Then we describe some different paths to compare and harmonize the two approaches, focusing on annotation, extraction and geocoding of place names.
- Towards a computational history of modernism in European literary history: Mapping the Inner Lives of Characters in the European Novel (1840–1920)Publication . Radak, Tamara; Burnard, Lou; Francois, Pieter; Hilger, Agnes; Jannidis, Fotis; Palkó, Gábor; Patras, Roxana; Preminger, Michael; Santos, Diana; Schöch, ChristofIn this paper, we investigate the common narrative in literary history that the inner lives of characters became a central preoccupation of literary modernism. We operationalise this notion via a proxy, tracing the use of verbs relating to inner life across 10 language corpora from the ELTeC collection, which comprises novels from the period between 1840–1920. We expected to find an increase in the use of inner-life verbs corresponding to the traditional periodisation of modernism in each of the languages. However, different experiments conducted with the data do not confirm this hypothesis. We therefore look at the results in a number of more granular ways, but we cannot identify any common trends even when we split the verbs into individual categories, or take canonicity or gender into account. We discuss the obtained results in detail, proposing potential reasons for them and including potential avenues of further research as well as lessons learned.
