Gestão de dados linguísticos
Moderadores
-
Raquel Freitag
Raquel Freitag
Raquel Freitag é Professora do Departamento de Letras Vernáculas, do Programa de Pós-Graduação em Letras e do Programa de Pós-Graduação em Psicologia da Universidade Federal de Sergipe. Doutora em Linguística pela Universidade Federal de Santa Catarina, área de concentração Sociolinguística, atualmente, estuda o processamento da variação linguística, com atenção às pistas de atenção, reparo e emoções na produção e percepção. Também desenvolve atividades de popularização da ciência e estímulo à pesquisa na educação básica, com o projeto Cienart e com a organização da Feira Científica de Sergipe durante a Semana Nacional de Ciência e Tecnologia. Coordeno o Condomínio de Laboratórios Multiusuário de Informática e Documentação LAMID da Universidade Federal de Sergipe. Foi secretária da Associação Sergipana de Ciência ASCi, biênio 2016-2018. É Pesquisadora Associada da Rede Nacional de Ciência para Educação (CpE) e editora-chefe da Revista da ABRALIN. Vice-presidente da associação do Grupo de Estudos Linguísticos e Literários do Nordeste biênio 2019-2020 (GELNE) e da Associação Brasileira de Linguística.
-
Marco Antonio Rocha Martins
Resumo →
Gestão de dados linguísticos
A descrição linguística requer, cada vez mais, um grande volume de dados para dar suporte às generalizações para a caracterização de fenômenos, validação de teorias e definição de normas de referência.
Uma frase de Labov na sociolinguística histórica, “a arte de fazer bom uso dos maus dados”, pode ser estendida a todos os conjuntos de dados de quem trabalha com descrição linguística: nem sempre dispomos de dados de qualidade (dados linguísticos coletados em laboratório vs. dados de campo), nem sempre os dados são facilmente acessíveis (organização em repositórios assistemáticos, sem ferramentas de busca consolidada vs. anotação e alinhamento dos dados e busca automática). Ademais, se em outro momento as limitações para amostras de dados, especialmente de fala espontânea, eram decorrentes da tecnologia ainda incipiente, hoje, as limitações são decorrentes de restrições impostas por comitês de ética em pesquisa.
E, ainda, a política de transparência com dados abertos requer condições de armazenamento e disponibilização, e novos desafios precisam ser superados, como os custos de manutenção, e o sigilo e direito de uso dos dados.
Dados linguísticos são base para desenvolvimento de tecnologias assistivas, o que coloca a constituição e a gestão de dados linguísticos em alinhamento com as áreas estratégicas para a ciência no Brasil.
Neste simpósio, queremos discutir questões relacionadas ao gerenciamento de dados linguísticos, quer de fala quer de textos escritos, da atualidade ou históricos, em função das demandas latentes:
- Como atender aos princípios de ciência aberta quanto ao armazenamento, reuso e autoria de conjuntos de dados linguísticos?
- Como lidar com a tensão entre a transparência e o sigilo?
- Quais os formatos e as ferramentas mais adequados para a vitalidade dos conjuntos de dados linguísticos?
- Quais ferramentas permitem o melhor armazenamento e sistemas de interface para consulta e pesquisa?
- Como ficam grupos minoritários e variedades subrepresentadas?
Este simpósio virtual requer a inscrição prévia dos expositores, mediante a submissão de uma proposta de fala que contribua para o debate das questões acima. A discussão será transmitida na agenda do Abralin Ao Vivo, com possibilidade de perguntas no chat.
Submissões de propostas até dia 15 de Julho em: https://forms.gle/5ebVNM4duPfLNtE76