Corpora Digitais
Uma plataforma On-Line para corpora digitais anotados de línguas minoritárias e em perigo de extinção
Participantes
-
Filomena Sandalo
Filomena Sandalo
Doutorado em Linguística pela Universidade de Pittsburgh, Filomena Sandalo é, atualmente, Professora Associada MS 5.3 no Departamento de Linguística do IEL/UNICAMP. Foi coordenadora de Graduação em Linguística de 2007 a 2010 e coordenadora associada da Graduação em Linguística de 2012 a 2014. Foi ainda coordenadora associada do curso de Fonoaudiologia da UNICAMP entre 2015 a 2018. Suas pesquisas tomam como base a Linguística Gerativa nas áreas de fonologia e morfologia. Atua ainda nas áreas de descrição, documentação e análise de línguas indígenas brasileiras. Pesquisas recentes incluem, em fonologia, harmonia vocálica, ditongos, acento e entoação, e, em morfologia, hierarquia de pessoa, clíticos, classificadores numerais.
-
Juanito Avelar
Juanito Avelar
Juanito Avelar é Professor (Senior Lecturer/Associate Professor) do Departamento de Estudos Românicos e Clássicos da Universidade de Estocolmo desde 2018, na área de Língua Portuguesa. Foi professor do Departamento de Linguística da Universidade Estadual de Campinas entre 2007 e 2018, onde também atuou como coordenador do Bacharelado em Linguística no biênio 2011-2012 e chefe departamental entre 2014 e 2016. Doutor (2006) em Linguística pela UNICAMP, desenvolve estudos formais e histórico-diacrônicos sobre o português brasileiro, em torno de construções possessivas e existenciais, constituintes locativos, preposições e posição de sujeito. Suas pesquisas recentes têm se voltado ao papel do contato entre línguas e aquisição L2 no desencadeamento de variação sintática e inovações gramaticais, com foco no português.
-
Luiz Veronesi
Luiz Veronesi
Luiz Veronesi é bacharel em Ciência da Computação pela Universidade Federal de São Carlos (2002) e em Letras pela Universidade de São Paulo (2009). Mestre em Linguística pela Universidade de São Paulo (2015), possui experiência na área de Ciência da Computação, com ênfase em Sistemas de Computação.
Moderador(a)
-
Charlotte Galves
Charlotte Galves
Charlotte Galves é doutora em Língua Portuguesa – Université de Paris IV (Paris-Sorbonne) (1980). Atualmente é professora titular da Universidade Estadual de Campinas. Tem experiência na área de Lingüística, com ênfase em Descrição e Análise do Português, atuando principalmente nos seguintes temas: descrição comparativa do português europeu, português brasileiro e português clássico no quadro teórico da gramática gerativa; história gramatical da língua portuguesa nas suas diversas vertentes; interface fonologia-sintaxe e seu papel na mudança linguística; elaboração e uso de grandes corpora eletrônicos anotados de língua; modelagem probabilística em linguística.
Resumo →
Corpora Digitais
Uma plataforma On-Line para corpora digitais anotados de línguas minoritárias e em perigo de extinção
Nesta mesa redonda, apresentaremos uma plataforma brasileira em desenvolvimento, que abrigará, junto ao corpus do português histórico Tycho Brahe, corpora digitais anotados de línguas minoritárias e em perigo de extinção. Ao lado das ferramentas já disponíveis em outros repositórios, como alinhamento de áudio e transcrição, glosas, tradução e banco de dados lexicais, anotação morfológica e de classe de palavras, a plataforma disponibilizará recursos de edição digital adaptados às características particulares de cada corpus. Também será disponibilizado um módulo de anotação sintática de tipo treebank, que permitirá fazer buscas nesse nível, além de permitir a elaboração de gramáticas, o que é essencial para a revitalização de línguas em perigo de extinção, para a elaboração de cartilhas para alfabetização e para a pesquisa linguística. Além disso, a plataforma permitirá que o trabalho realizado para uma língua sirva para línguas semelhantes, com a reutilização dos sistemas de anotação já existentes. Apresentaremos o corpus da língua indígena brasileira kadiwéu, em desenvolvimento, e o da “língua” secreta conhecida como cupópia, utilizada por moradores da comunidade quilombola do Cafundó, localizada no interior paulista. Destacaremos os desafios metodológicos e teórico-conceituais envolvidos na construção desses corpora, bem como a relevância da documentação digital de línguas minoritárias e em perigo de extinção no atual cenário histórico e político brasileiro, que vem sendo marcado por uma série de ameaças à preservação e sobrevivência não apenas cultural, mas também física, das comunidades onde essas línguas são faladas.