A origem da língua basca

Paulo Gamalho
11 de Setembro de 2021

Paulo Gamalho
11 de Setembro de 2021
7 comentários

Partilhar

Após os anteriores artigos sobre o nacionalismo e o celtismo, o terceiro e último tópico polémico que vou tratar duma perspetiva cientista é a origem do basco, uma língua isolada que não parece estar relacionada com outras línguas ou famílias linguísticas atuais ou históricas, e que representa um dos mais interessantes enigmas linguísticos sem resolver do nosso tempo. Em Europa, a imensa maioria das línguas são indo-europeias, com provável origem na língua das populações Yamnaya da estepe pôntico-cáspia que migraram no início da Idade do Bronze. As únicas exceções europeias atuais a esta origem são o euskera, as famílias caucásicas, das que falarei mais a frente, e as línguas fino-úgricas (entre elas, o estoniano, finlandês e húngaro), que chegaram dos Montes Urais em períodos posteriores às migrações das populações Yamnaya que espalharam o proto-indo-europeu.

O euskera fala-se atualmente na região histórica de Euskal Herria, que consta de 7 províncias ou territórios históricos: Araba, Bizkaia, Gipuzkoa e Nafarroa no Estado Espanhol, e Lapurdi, Nafarroa Beherea (Baixa Navarra) e Zuberoa no Estado Francês. Estas três últimas conformam a região do norte, chamada de Iparralde. Contrariamente às províncias do Estado Espanhol, que são unidades político-administrativas de duas Comunidades Autónomas, a região histórica do Iparralde basco-francês não é mais que um território sem regime administrativo do Departement des Pyrenées-Atlantiques, que, a sua vez, pertence à região administrativa Nouvelle-Aquitaine. Os cinco principais dialetos bascos atuais são o ocidental ou biscaio, o central ou guipuscoano, o alto navarrês, o navarrês-lapurdiano e o zuberoano, estes dous últimos falados em Iparralde. Como a distância entre estas variedades diatópicas é muito grande, especialmente entre a ocidental e as mais orientais, a padronização foi um processo complexo. A forma padronizada, chamada de euskera batua, foi desenvolvida entre os anos 60 e 70 do século passado por linguistas como Koldo Mitxelena.

A forma padronizada, chamada de euskera batua, foi desenvolvida entre os anos 60 e 70 do século passado por linguistas como Koldo Mitxelena.

Na atualidade, segundo o último Inquérito Sociolinguístico (número VI), há aproximadamente 750 mil bascofalantes em Euskal Herria, que representam o 28,4% da população total. Esta percentagem varia muito segundo o território: 13% em Nafarroa (70 mil), 20,5% em Iparralde (50 mil) e 34% no País Basco (630 mil), sendo Gipuzkoa, com 50%, a província mais euskaldun com grande diferença sobre o resto. Repare-se que o inquérito mede o grau de competência e não o uso da língua, pois uma pessoa bascofalante (ou eskaldun) é definida como alguém que é capaz de falar e perceber bem ou bastante bem o euskera. É também muito relevante a projeção da língua, que ganhou mais de 220 mil falantes nos últimos 25 anos, ao passar do 22,3 ao 28,4% da população, com uma maior crescida entre a gente nova. Cuspidinho ao que acontece aqui, na Galiza, mas ao contrário.

Na atualidade, segundo o último Inquérito Sociolinguístico (número VI), há aproximadamente 750 mil bascofalantes em Euskal Herria, que representam o 28,4% da população total. Esta percentagem varia muito segundo o território: 13% em Nafarroa (70 mil), 20,5% em Iparralde (50 mil) e 34% no País Basco (630 mil), sendo Gipuzkoa, com 50%, a província mais euskaldun com grande diferença sobre o resto.

Após esta contextualização socio-política e geográfica da língua basca, focarei-me nos estudos sobre a sua origem e as relações filogenéticas que mantém com outras línguas ou famílias linguísticas: começarei apresentando a única teoria que já conseguiu consenso científico, a seguir introduzirei as principais hipóteses que não foram demonstradas e que não conseguiram consenso científico e, finalmente, falarei dum recente estudo genético, baseado no ADN antigo, de alto impacto internacional.

É também muito relevante a projeção da língua, que ganhou mais de 220 mil falantes nos últimos 25 anos, ao passar do 22,3 ao 28,4% da população, com uma maior crescida entre a gente nova. Cuspidinho ao que acontece aqui, na Galiza, mas ao contrário.

Os primeiros textos da língua basca com alguma extensão são dos séculos XV e XVI, mas as frases escritas de maior antiguidade encontram-se nas Glosas Emilianenses, do século X. Entre as anotações ou glosas escritas em antigo aragonês, utilizadas para entender o texto latino do códice de San Millán de la Cogolla, encontraram-se duas breves glosas em basco. No entanto, existe um grande vazio, por volta de mil anos, entre estes primeiros textos do euskera histórico e os dados mais antigos da época romana relacionados com o vascão e o aquitano. Segundo o filólogo Joaquín Gorrochategui, cuja tese sobre o aquitano foi dirigida por Koldo Mitxelena, o vascónio e o aquitano são duas variedades linguísticas regionais, documentadas na Idade Antiga a partir de material onomástico encontrado em território dos vascões (parte da atual Nafarroa) e da Aquitánia (sudoeste da França), respetivamente, e constituem as fases prévias da língua basca histórica. Estas fases prévias deram lugar ao período conhecido como euskera arcaico. Tanto o aquitano como o vascónio, que formam o euskera arcaico, apresentam estreitas e exclusivas relações linguísticas com a língua basca histórica, de maneira que é possível classificá-las como línguas ou variedades pertencentes à mesma família linguística. É importante aqui não confundir vascões e vascónio com bascos/as e basco. Embora sejam conceitos relacionados, estes dous pares de termos designam realidades mui diferentes. Também é relevante incluir neste contexto o proto-euskera, língua reconstruída por filólogos como Koldo Mitxelena, que é o resultado duma construção dedutiva da língua basca que se falava no século V a.C. Muitas das propriedades que foram atribuídas ao proto-euskera estão muito próximas das formas encontradas no material onomástico da antiga Aquitánia. Quer isto dizer que o proto-basco reconstruído coincide com as poucas pegadas de euskera arcaico achadas no período antigo.

Muitas das propriedades que foram atribuídas ao proto-euskera estão muito próximas das formas encontradas no material onomástico da antiga Aquitánia. Quer isto dizer que o proto-basco reconstruído coincide com as poucas pegadas de euskera arcaico achadas no período antigo.

Estes estudos podem considerar-se uma confirmação científica da filiação do basco com o aquitano, pois este revela-se como a materialização ou corporeização do construto intelectual que é o proto-basco. Por último, é importante destacar que, embora o basco seja uma língua pré-romana não indo-europeia, existe uma ampla e profunda influência latino-românica no léxico basco, não só por influência atual do castelhano, mas também, diretamente, através do latim em época antiga e, provavelmente, medieval.

Embora o basco seja uma língua pré-romana não indo-europeia, existe uma ampla e profunda influência latino-românica no léxico basco, não só por influência atual do castelhano, mas também, diretamente, através do latim em época antiga e, provavelmente, medieval.

A origem da família euskérica (basco-vascão-aquitano) ou do proto-euskera é ainda um mistério. Uma das primeiras teorias ou hipóteses formuladas é a do basco-iberismo, que identifica o basco com a língua ibera falada na época antiga na costa mediterrânea da Península Ibérica. Esta é também uma língua isolada, não indo-europeia, cujos textos mais antigos são epígrafes do século V a.C. Mesmo se é hoje uma língua morta, há muita mais pegada material desta que do euskera arcaico. De facto, é a língua com mais abundante documentação epigráfica da Hispânia pré-romana, A tese basco-iberista nasceu no século XVIII com Manuel Larramendi e foi defendida no XIX por cientistas prestigiosos como Wilhelm von Humboldt. No entanto, uma vez descodificado parcialmente o ibero no século XX, autores como Antonio Tovar e Mitxelena considerárom que, embora existam semelhanças superficiais, não há relação genética entre as duas línguas. As poucas semelhanças podem dever-se ao contato por proximidade geográfica.

Uma outra teoria, que é compatível com o basco-iberismo e mais com a hipótese que introduzirei a seguir (a conexão caucasiana), é a conhecida como substrato vascónico, e defendida por Theo Vennemann, que se apoiou em antigas ideias de Francesco Ribezzo formuladas na primeira metade do século XX. Segundo a teoria de Vennemann, muitos idiomas da Europa central e ocidental contêm restos duma antiga família linguística pré-indo-europeia da qual o euskera (ou seica tamém as línguas caucasianas) seria a única sobrevivente. Esta família linguística, com origem no período paleolítico, estender-se-ia pola Europa central e ocidental e mesmo polo norte de África, mas viu reduzido o seu âmbito de influência a partir da expansão indo-europeia. Os principais elementos que apoiam esta teoria são alguns topónimos, nomeadamente hidrónimos, compartilhados por diferentes territórios europeus, que pressupõem substratos antigos pré indo-europeus. No entanto, existem numerosas críticas a esta teoria, como a de P.R. Kitson, que considera que a maioria dos hidrónimos comuns são de origem indo-europeia (provavelmente celta), ou a de Joseba Lakarra, perito no proto-euskera, quem argumenta que Vennemann utiliza como base das comparações raízes bascas modernas que não se correspondem com o euskera arcaico.

Uma das hipóteses com mais defensores e mais sólida, embora também amplamente criticada, é a relação com as línguas do Cáucaso, igualmente isoladas geneticamente e de origem não indo-europeia.

Uma das hipóteses com mais defensores e mais sólida, embora também amplamente criticada, é a relação com as línguas do Cáucaso, igualmente isoladas geneticamente e de origem não indo-europeia. Os estudos linguísticos classificam estas línguas em três famílias: família caucasiana meridional ou kartveliana, família do noroeste ou circasiana e família do nordeste ou daguestão. Há mais de 40 línguas caucasianas faladas por mais de 7 milhões de pessoas. As duas com mais falantes são o georgiano (família kartveliana), com 4 milhões, e o checheno (daguestão), com 1 milhão. Entre as duas famílias do norte é possível achar alguma afinidade, mas existem dúvidas sobre se há, de facto, relação filogenética entre as duas famílias do norte e a meridional ou kartveliana.

Há mais de 40 línguas caucasianas faladas por mais de 7 milhões de pessoas. As duas com mais falantes são o georgiano (família kartveliana), com 4 milhões, e o checheno (daguestão), com 1 milhão.

Alguns dos investigadores que mais contribuíram ao desenvolvimento de estudos comparativos com base em material do euskera e das línguas caucasianas foram Réné Lafon, Karl Bouda, John Bengtson e Jan Braun. Estes autores encontraram semelhanças linguísticas tanto a nível lexical como estrutural. A nível do léxico, os estudos baseados em listas de cognatos (pares de palavras supostamente relacionadas etimologicamente) acharam um número significativo de vocabulário básico similar entre o euskera e as línguas caucasianas. Estruturalmente, coincidem em muitos aspetos: são línguas aglutinantes, a sintaxe é ergativa, os verbos possuem formas polipessoais concordando com vários actantes e têm sistema de cálculo vigesimal. Cumpre sublinhar que há poucas famílias linguísticas no mundo com sintaxe ergativa e, em Europa, só o euskera e as línguas caucasianas possuem essa estrutura. Nas línguas ergativas, o caso ergativo marca o agente dos verbos transitivos, frente ao caso absolutivo que permite identificar tanto o principal actante dos verbos intransitivos como o objeto-paciente dos transitivos.

A nível do léxico, os estudos baseados em listas de cognatos (pares de palavras supostamente relacionadas etimologicamente) acharam um número significativo de vocabulário básico similar entre o euskera e as línguas caucasianas. Estruturalmente, coincidem em muitos aspetos: são línguas aglutinantes, a sintaxe é ergativa, os verbos possuem formas polipessoais concordando com vários actantes e têm sistema de cálculo vigesimal.

Para além destas similaridades, não podo deixar de citar os nossos trabalhos (com José Ramom Pichel e Iñaki Alegria) sobre a distância de línguas, nomeadamente “Measuring Language Distance of Isolated European Languages,”, publicado na revista Information, e “From language identification to language distance”, publicado em Physica A, onde os experimentos realizados acharam que o georgiano, língua caucasiana meridional-kartveliana tem como língua mais próxima, entre mais de 40 línguas de Europa, o basco. Este, não entanto, está mais próximo das línguas latinas que do georgiano, talvez devido à grande quantidade de léxico latino e castelhano do euskera moderno. Recentemente, realizei um novo experimento sem publicar com o checheno, língua da família caucasiana do nordeste, utilizando a mesma metodologia que nos trabalhos anteriores. Neste caso, foi também o basco a língua mais próxima do checheno.

Para além destas similaridades, não podo deixar de citar os nossos trabalhos (com José Ramom Pichel e Iñaki Alegria) sobre a distância de línguas, nomeadamente “Measuring Language Distance of Isolated European Languages,”, publicado na revista Information, e “From language identification to language distance”, publicado em Physica A, onde os experimentos realizados acharam que o georgiano, língua caucasiana meridional-kartveliana tem como língua mais próxima, entre mais de 40 línguas de Europa, o basco.

Ora bem, surpreendentemente, o georgiano ficou bastante afastado (em posição 14th), mesmo se as duas línguas comparadas são as únicas que formam parte das famílias caucasianas na experimentação. Esta baixa similaridade pode explicar-se porque, por um lado, e tal e como foi dito, a família caucasiana meridional não parece ter filiação direta como as famílias do norte, e por outro, é preciso tomar em conta o viés da transliteração: o checheno e o georgiano grafam-se com diferentes alfabetos e a sua transliteração automática para o alfabeto latino pode ter causado um distanciamento artificial. De facto, neste mesmo experimento, a segunda língua mais próxima do checheno foi o russo, duas línguas faladas no mesmo território e codificadas ambas as duas no mesmo alfabeto cirílico.

O checheno e o georgiano grafam-se com diferentes alfabetos e a sua transliteração automática para o alfabeto latino pode ter causado um distanciamento artificial. De facto, neste mesmo experimento, a segunda língua mais próxima do checheno foi o russo, duas línguas faladas no mesmo território e codificadas ambas as duas no mesmo alfabeto cirílico.

É inegável que há semelhanças entre as línguas caucasianas e o euskera, tal e como o próprio Mitxelena reconheceu, mas para podermos concluir que estão geneticamente relacionadas, é preciso demonstrar que as comparações lexicais dão lugar a coincidências fundamentadas em correspondências fonemáticas regulares. E é aqui onde surgem as críticas. Em primeiro, lugar, cumpre sublinhar que a comparação lexical entre basco e línguas caucasianas é difícil de levar a cabo pois, mesmo se o proto-euskera está num estádio avançado de estudo, ainda não foi possível reconstruir o proto-caucasiano devido à pouca afinidade entre as diferentes famílias. Esta circunstância obriga a que os estudos lexicais se realizem comparando vocabulário e raízes lexemáticas modernas, o que não permite tirar conclusões fiáveis desde o ponto de vista filogenético. Em segundo lugar, na lista de cognatos de Braun e Bouda há um grande número de erros: problemas de transcrição, uso de empréstimos latinos confundidos com palavras patrimoniais bascas, segmentações arbitrárias e reconstruções erradas do proto-euskera. Além destes problemas linguísticos, não há estudos de genética populacional com indícios claros que demonstrem que exista ou tivesse existido uma relação genética estreita entre a população autóctone basca e a do Cáucaso.

Colocaram-se muitas outras hipóteses sobre as relações filogenéticas entre o euskera e línguas diversas, mas todas foram desbotadas pola comunidade linguística. Por exemplo, a teoria que relaciona o euskera com as línguas berberes, data do século XIX e foi defendia mais recentemente (finais do XX) por Hans Murakovsky, especialista em línguas africanas. Esta hipótese foi, no entanto, refutada por Larry Trask, reputado especialista da língua basca e membro honorário da Euskaltzaindia (Academia da Língua Basca). Após analisar a lista lexical de vocábulos arcaicos proposta por Murakovsky, Trask achou numerosos erros graves, nomeadamente empréstimos latinos modernos considerados arcaicos e problemas de transcrição e de segmentação, que invalidam a hipótese.

Colocaram-se muitas outras hipóteses sobre as relações filogenéticas entre o euskera e línguas diversas, mas todas foram desbotadas pola comunidade linguística.

Para completar este breve resumo linguístico sobre as origens do basco, vou acrescentar informação duma investigação baseada no ADN antigo. Devido a que não sou especialista neste âmbito, não possuo as requerimentos científicos necessários para revisar e organizar todas as teorias e trabalhos de biologia genética desenvolvidos até à data. Vou simplesmente resumir as ideias dum dos artigos sobre ADN basco mais citado (215 citas em Google Scholar) e, portanto, com mais impacto científico, a nível internacional. O artigo intitula-se “Ancient genomes link early farmers from Atapuerca in Spain to modern-day Basques”, publicado em PNAS em 2015, com uma autoria pluridisciplinar formada por especialistas em genética, arqueologia e paleontologia de diferentes centros internacionais liderados pola Universidade de Uppsala (Suécia), e com a colaboração do biólogo e paleontólogo Juan Luis Arsuaga. Este trabalho comparou o genoma dos restos humanos de 8 indivíduos que viveram há 3500/5500 anos, achados em El Portalón (Sierra de Atapuerca, em Burgos), com o genoma dos restos humanos doutras zonas de Europa de períodos similares e com o ADN de populações europeias atuais. Os resultados genéticos mostraram, por um lado, que os indivíduos de El Portalón eram os primeiros agricultores neolíticos vindos da Anatólia misturados com os cazadores-coletores locais do Paleolítico. Não se achárom, portanto, marcadores genéticos das populações Yamnaya originárias da estepe pôntico-cáspia, supostamente portadoras do proto-indo-europeu durante a Idade do Bronze (para mais informação sobre este aspeto, recomendo o anterior artigo sobre o celtismo). Por outro lado, e mais surpreendente ainda, encontrou-se uma grande afinidade genética entre os 8 indivíduos de El Portalón e as populações atuais bascas. Esta ligação genética sugere que o povo basco e a sua língua podem estar relacionados com a expansão da agricultura no Neolítico, em contraste com hipóteses anteriores que ligavam a população basca a grupos pré-agrícolas do Paleolítico. Os resultados do estudo genético também mostrárom uma grande afinidade entre os indivíduos de El Portalón e a população atual da ilha de Sardenha, que tampouco não tem pegada genética das populações Yamnaya proto-indo-europeias, à diferença do que acontece no património genético do resto do território europeu, onde esta camada migratória está bem presente. As coincidências genéticas entre bascos/as e sardos/as podem ser causadas, não por uma relação filogenética direta, mas polo facto de serem territórios isolados que não receberam influência significativa de migrações pós-neolíticas, ficando assim ao margem da revolução migratória indo-europeia dos povos Yamnaya na Idade do Bronze.

As coincidências genéticas entre bascos/as e sardos/as podem ser causadas, não por uma relação filogenética direta, mas polo facto de serem territórios isolados que não receberam influência significativa de migrações pós-neolíticas, ficando assim ao margem da revolução migratória indo-europeia dos povos Yamnaya na Idade do Bronze.

Estas descobertas figérom renascer o interesse polos estudos sobre o paleo-sardo (também chamado de nurago), língua extinta não indo-europeia falada na Sardenha em época pré-romana. O principal especialista nesta língua, o linguista Eduardo Blasco Ferrer, nunca desbotou uma conexão e uma evolução comum com o proto-euskera, embora linguistas especialistas no proto-euskera, como Joseba Lakarra, acham que não existe uma tal ligação.

Seja como for, fica cada vez mais claro que a resposta ao mistério do euskera e doutras línguas isoladas não poder provir exclusivamente da linguística e filologia histórica, mas da confluência de várias especialidades, incluindo a biologia molecular e genética, a paleontologia, a arqueologia e a linguística. Acredito que novos estudos pluridisciplinares avançados poderão ser capazes de revelar e explicar, não só as origens e conexões filogenéticas da língua, mas também como as populações bascas se mantiveram relativamente isoladas ao longo de várias camadas de migrações, incluindo a dos povos celtas, sem renunciar nunca a perder a sua língua. Pois, tal e como afirmou Koldo Mitxelena, o principal mistério do euskera não é bem a sua origem, mas como conseguiu resistir e manter-se vivo até os dias de hoje.

euskera

Máis de Paulo Gamalho

A origem da língua basca

Partilhar

Confissões à volta do ChatGPT

O debate do galego e português visto por papagaios estocásticos

Um caso paradigmático de desinformação

Os celtas vêm do ocidente?

As comunidades imaginadas de Harari e Anderson

Galiza e Galicia e outras palavras con terminações análogas no período medieval

As ideias linguísticas do Carvalho Calero em dados

Os sufixos -çom/-cion e -vel/-ble nos documentos medievais da Galiza

Por uma língua patrimonial sem castelhanismos: resposta às teses do livro de Fernando Venâncio