Um caso paradigmático de desinformação



Numa época de crises climáticas, conflitos bélicos fratricidas e previsões energéticas catastrofistas, o tema da língua, e mais concretamente o da letra ñ, pode ser percebido como um assunto um chisco frívolo. No entanto, todas as pessoas que temos uma dependência adictiva a la questione della lingua sempre encontramos uma boa escusa para falarmos do tema. Neste caso, quero comentar o que aconteceu no mês de julho no programa da TVG “Dígocho eu”, um programa orientado a dar dicas linguísticas sobre o galego, cujo sucesso e bom fazer estão alicerçados principalmente na simpatia e profissionalismo da jornalista Esther Estévez.

Em finais de julho, este programa publicou um vídeo e mensagens nas redes sociais nos que se afirmava que a letra ñ é totalmente galega e com muitos séculos de história. Esta afirmação apoiava-se numa transcrição realizada polo catedrático Henrique Monteagudo, secretário da Real Academia Galega (RAG), que está publicada no Consello da Cultura Galega (CCG). Trata-se da transcrição do documento medieval conhecido como Foro do bo Burgo do Castro Caldelas, escrito em Alhariz em 1228 e que Monteagudo considera “o texto datado e escrito en galego máis antigo dos producidos en Galicia” (em “O Foro do bo Burgo do Castro Caldelas, dado por Afonso IX en 1228“). Sem querer entrar em polémica, pois não tenho competência filológica nenguma, convém tamém pôr de relevo que outros investigadores, como o medievalista José António Souto Cabo, consideram que a data de 1228 não é correta pois há “incompatibilidade entre a conformação scriptolinguística e diplomática do exemplar conservado e a cronologia que lhe fora atribuída” (em “Os primeiros escritos em galego-português: revisão e balanço”, Lingua, texto, diacronía, 2014). O ano 1228 poderia corresponder-se com a data do original latino e não com o da sua tradução ao galego-português, provavelmente escrita a partir da segunda metade do século XIII. Se assim for, este documento não seria o primeiro texto em galego. Mas não é disto do que quero falar. Aliás, tampouco não quero falar de que o rei galego responsável desse foro deveria ser chamado Afonso VIII e não, como fai a historiografia espanholista, Afonso IX.

A fim de evitar mais digressões, concentremo-nos no assunto em questão. Através de Twitter, comecei a ler respostas onde se punha em dúvida a veracidade da transcrição assegurando que o original não continha nengum ñ. Felizmente, como vivemos na era da Internet onde é possível ter acesso a diversas fontes de informação com bastante rapidez, não me foi difícil encontrar o fac-símile com a reprodução exata do original, assim como a transcrição utilizada no programa para suster o uso estendido do ñ em galego medieval. Mesmo sem estar acostumado a mergulhar neste tipo de documentos, tampouco não me foi demasiado complicado conferir que as palavras com ñ da transcrição (“viçiño”, “señor” ou “Meyriño”) não estavam no original, tal e como mostro abaixo na figura 1. Enviei um tweet com essa mesma captura de imagem em resposta ao chio da conta @digochoeuTVG, como, aliás, fijo muita outra gente com todo tipo de imagens e comentários didáticos e retranqueiros. Uma interessante compilação das respostas enviadas nessa altura pode consultar-se no excelente artigo escrito por Isabel Rei Samartim para o PGL.

Figura 1

Após esta chuva bem argumentada de desmentidos e pedidos de correção, a assessoria linguística de Dígocho eu (ou os/as responsáveis do conteúdo do programa) tinha ainda amplo margem para fazer boa figura e ficar bem com a audiência pedindo desculpas e desviando a responsabilidade do erro à transcrição do documento. Da mesma forma, os/as responsáveis da transcrição, publicada no CCG, tiveram (e ainda têm, com certeza) a oportunidade de justificar as decisões tomadas arguindo, por exemplo, que não se trata duma transcrição paleográfica fiel ao manuscrito, mas duma edição filológica que reproduz de jeito sistemático as intenções do copista, ou bem duma edição modernizada para o grande público, ou bem qualquer outra cousa que eles/as considerarem apropriado argumentar.

Ora bem, nada disso aconteceu. O passo seguinte, ainda mais patético, aprofundou bem mais a ferida. Em vez de pedir desculpas polo erro, o programa decide enviar um tweet com uma captura de imagem tomada do fac-símile do original na que aparece um suposto til sobre a palavra ‘pona’ que simboliza, segundo o/a autor/a do tweet, a letra ñ. De novo, um grande número de respostas em Twitter, a maioria com retranca, corrigiram a falsa afirmação explicando que esse til codifica, em realidade, a nasalização da última vogal pola perda da consoante nasal final. Trata-se portanto da palavra “ponam”, que é lida “ponham”. Eu próprio respondim com um tweet acompanhado duma nova captura (ver figura 2) do documento original onde aparece o mesmo til de nasalidade em várias palavras com consoante nasal final e a sua transcrição correta no texto do CCG. Na verdade, fiquei impressionado com a incrível regularidade na escrita dos amanuenses e copistas daquela época.

Figura 2

 

Nesta ocasião, não houvo resposta por parte dos/as responsáveis do programa. Insistiram no erro com um novo erro e, a partir, de aqui, escolheram o silêncio como resposta aos desmentidos. Tendo em conta as novas circunstâncias, podem-se tirar duas conclusões: por um lado, o programa Dígocho eu está a difundir uma informação falsa sabendo que é falsa (pois não foi apagada da web nem das redes sociais), e por outro, é a transcrição do documento a que adiciona o ñ onde não havia.

Não sei se os/as responsáveis deste excelente programa de divulgação linguística são conscientes de que estão a desprestigiar um bom produto cultural e educativo que eles/as mesmos criaram, além de contaminar outras instituições indiretamente envolvidas, nomeadamente o CCG e mesmo a RAG.

Não sei se os/as responsáveis deste excelente programa de divulgação linguística são conscientes de que estão a desprestigiar um bom produto cultural e educativo que eles/as mesmos criaram, além de contaminar outras instituições indiretamente envolvidas, nomeadamente o CCG e mesmo a RAG.

Sabemos que os boatos e as mentiras se transmitem com muita mais velocidade que os desmentidos e as informações verdadeiras, mas, desta volta, devido às especiais circunstâncias que vou mencionar a seguir, o desmentido do falso ñ vai prolongar-se no tempo. Muitos/as professores/as de diferentes matérias, tanto nos institutos como na universidade, temos agora um exemplo excelente de fake news para dar a conhecer, analisar e explicar nas aulas. Trata-se dum caso com características mui interessantes do ponto de vista educativo. Destaco três: i) é um assunto próximo a nós, pois não são bots russos nem trumpistas americanos, ii) a fonte de informação é facilmente verificável e permite, de passagem, fazer uma introdução à edição de manuscritos, iii) e há uma motivação político-linguística hiperpartisana clara e cristalina. Um exemplo de manual para o nosso estudantado. Fiquei com a impressão, provavelmente certa, de que havia muitos/as professores/as zangados/as a responderem à falsa informação, ansiosos/as por transmitir este fantástico caso de desinformação às nossas gerações futuras, com a vaga esperança de que não se repita.

E termino com duas consequências indiretas derivadas deste caso: uma má para a linguística computacional e outra boa para a filologia mais tradicional. Dado que a transcrição do ñ neste documento concreto está tão afastada do original, já não se pode confiar em que as transcrições doutros fenómenos linguísticos noutros documentos medievais galegos do Tesouro Medieval Informatizado da Lingua Galega sejam mais literais e partilhem critérios filológicos sistemáticos. Portanto, já não são fiáveis os resultados estatísticos de trabalhos computacionais sobre os textos digitalizados e transcritos do galego medieval, como o publicado na revista Linguamática no ano passado sobre os sufixos -çom e -vel, no que participei junto com outros colegas: José Ramom Pichel, José Martinho Montero Santalha e Marco Neves. A fiabilidade destes estudos é posta agora em causa porque se baseiam em textos digitalizados sem tomar em conta os diferentes critérios de transcrição que, potencialmente, dariam lugar a diferentes decisões e a consequente falta de sistematização no conjunto dos documentos.

A fiabilidade destes estudos é posta agora em causa porque se baseiam em textos digitalizados sem tomar em conta os diferentes critérios de transcrição que, potencialmente, dariam lugar a diferentes decisões e a consequente falta de sistematização no conjunto dos documentos.

Esta situação de falta de confiança nos dados é, portanto, a má notícia para a linguística computacional. A boa notícia para a filologia é que há muito trabalho ainda por fazer em termos de edição, transcrição e digitalização dos documentos medievais galegos. É preciso contar com edições paleográficas (fieis aos manuscritos) e com edições filológicas com critérios explícitos idênticos partilhados por todos/as os/as transcritores. Sem este trabalho prévio da filologia, nunca será possível desenvolver modelos de língua computacionais fiáveis do galego medieval, nem processar automaticamente esses textos para extrair informação relevante. Reconheço que, após 25 anos a trabalhar em projetos de linguística computacional, nunca sentim que fosse tão valioso o papel da filologia tradicional.

Paulo Gamalho
Latest posts by Paulo Gamalho (see all)

PUBLICIDADE