Modificações automáticas no corpus da Floresta

Paulo Rocha

logo temporário da FS
Projecto Floresta sintá(c)tica
Última actualização: 12 de Novembro de 2008


Os corpora disponibilizados pela Floresta Sintá(c)tica são anotados pelo parser PALAVRAS (Bick 2000). Sobre essa anotação, são efectuadas as modificações listadas abaixo, inclusivé sobre os corpora nos quais não é efectuada nenhuma revisão manual (Floresta Virgem e Amazônia). Os scripts em Perl para efectuar essas modificações podem ter obtidos, num ficheiro .tgz, aqui.
voltar à página de documentação