Virunduns como uma janela para mudança linguística em andamento

Em alguns casos, nós ouvimos somente o que "queremos"

Glauber Romling da Silva e Andrew Ira Nevins · Glauber Romling da Silva é doutor em Linguística. Ele trabalha com a descrição e documentação de línguas em perigo de extinção. Andrew Ira Nevins é doutor em Linguística. Ele busca entender como os sons linguísticos são compreendidos e representados pela mente humana.

Em gravação no Dia da Independência de 2019, o Presidente Jair Bolsonaro teria sido flagrado errando o hino nacional brasileiro: o trecho Às margens plácidas teria sido cantado Às margens flácidas. Um vídeo de segundos[1] que mostra o Presidente durante essa gravação viralizou nas redes sociais e virou motivo de escárnio para seus detratores, que ouviam claramente a versão adulterada do hino. Seus apoiadores, por outro lado, insistiam que ouviam perfeitamente a versão correta do hino e que isso era, literalmente, intriga da oposição.

Quem está certo nessa disputa? Tudo indica que, nesse caso, os dois lados estão certos. O caso relatado é um exemplo clássico de erro, ou engano, de ouvido. Devido a diversos fatores internos à nossa percepção do fluxo sonoro linguístico, e também a fatores externos ao sistema linguístico, como ruído e visão de mundo: em alguns casos, nós ouvimos somente o que “queremos”.

Esse fenômeno é conhecido na linguística como mondegreen e foi proposto pela escritora americana Sylvia Wright. Esse nome deriva da interpretação auditiva equivocada do trecho de uma famosa música folclórica escocesa. No Brasil, os linguistas chamam de virundum, termo também proveniente de um erro de ouvido do hino nacional: Ouviram do Ipiranga vira O virundum Ipiranga. Além de situações engraçadas, esses virunduns nos revelam sobre como funcionam os fatores que moldam nossa percepção linguística e como lidamos com as ambiguidades que eles provocam. Ambiguidade significa oscilar em ambas as interpretações (seria Ouviram do ou O virundum?). Esses enganos sistemáticos de ouvido apontam caminhos que explicam como línguas podem nascer ou mudar através do tempo. Quando se realizam virunduns de maneira consistente, podem implicar em mudança linguística permanente. E quando o assunto é mudança linguística, a novidade nasce da diversidade.

Figura 1: a imagem sobrepõe dois animais: quais são?

Devido a diversos fatores internos à nossa percepção do fluxo sonoro linguístico, e também a fatores externos ao sistema linguístico, como ruído e visão de mundo: em alguns casos, nós ouvimos somente o que “queremos”

Noções gerais de ambiguidade

A ambiguidade também pode ocorrer em interpretações dúbias no campo visual. Na figura 1[2] mais de um objeto pode ser construído pela nossa capacidade visual.  Geralmente, instintivamente tomamos a decisão por apenas uma interpretação visual imediata. A segunda interpretação, na maioria das vezes, vem somente após certo esforço para achar um segundo mosaico em meio à figura ambígua. A nossa mente opera como filtro de uma realidade física crua.

O que faz, exatamente, a mente escolher apenas uma das duas interpretações? Fatores inerentes ao espectador seriam capazes de impor imagens mais prováveis e revelariam estados mentais específicos. O Teste de Rorschach é famoso por usar como método as impressões emitidas pelos pacientes em relação a imagens que consistem em borrões preto e branco.

Figura 2: O que você vê nesta imagem?

Os cientistas concluem, com base em experimentos como esses, que o cérebro não é capaz de manter mais de uma interpretação ativada ao mesmo tempo, e nem tampouco nenhuma interpretação. Há sempre uma persistência em fazer sentido, mas apenas um sentido.  Essa tendência geral em ‘fazer sentido’ também influencia nas interpretações auditivas de natureza linguística.

A ambiguidade linguística

Os leitores nascidos nos anos 1980 ou antes lembram dos versos “Na madrugada vitrola rolando um blues/ Trocando de biquíni sem parar” (Tocando B.B. King sem parar)[3], “Você que é mal passado e que não vê” (Você que ama o passado e que não vê)[4] e  “Um abajur cor de carmim” (Um abajur cor de carne)[5]. Esses famosos virunduns são ótimos exemplos de como nossos ouvidos podem nos enganar. Esses enganos nos levam a algum entendimento sobre como os objetos linguísticos (fones/fonemas, morfemas, sintagmas etc.) se organizam e sobre a natureza da linguagem humana. A distinção dos sinais acústicos pode ser bastante atrapalhada por fatores externos: transmissão sonora com ruídos (telefone, rádio, etc.), música e contextos barulhentos em geral. Fatores internos de natureza semântico-pragmática, ou seja, da aplicação de semântica em significados práticos, consistem de certa pré-disposição sobre como as coisas fazem sentido em momentos de uso. Essa noção de sentido tende a escolher interpretações mais concretas e familiares do que interpretações mais abstratas e improváveis.

Um dos autores deste texto, falante nativo de inglês, lembra que o primeiro mondegreen (1) que lhe vem à mente está em Everytime you go away de Hall & Oates[6] (2):

(1)

You take a piece of meat…     (Você leva um pedaço de carne…)

With you                                 (Com você)

Fatores internos de natureza semântico-pragmática, ou seja, da aplicação de semântica em significados práticos, consistem de certa pré-disposição sobre como as coisas fazem sentido em momentos de uso. Essa noção de sentido tende a escolher interpretações mais concretas e familiares do que interpretações mais abstratas e improváveis

Para um garoto de seis anos, levar um pedaço de carne consigo parece uma interpretação mais concreta e familiar do que a apaixonada interpretação correta.

(2)

You take a piece of me…        (Você leva um pedaço de mim…)

With you                                 (Com você)

Esse fator semântico-pragmático é importante juntamente a fatores fonéticos. Me se encontra no final do primeiro verso, contexto em que toda vogal em inglês também é seguida pelo fechamento da glote, que fica no final da laringe (“garganta”). Além disso, a palavra meat termina em uma consoante ‘t’ não pronunciada por completo. A palavra me em final de frase seguida de longa pausa gera um som parecido com o da palavra meat. Se observarmos uma imagem do sinal acústico das duas palavras podemos perceber que elas são bem parecidas.

A nossa ignorância também é capaz de nos fazer ouvir coisas inexistentes. Hinos são repletos de exemplos de virunduns, já que geralmente abusam de linguajar erudito, sintaxe rara e são aprendidos por repetição por crianças em idade escolar. Vejamos os seguintes exemplos do hino nacional brasileiro[7] (3-4).

(3)

De um povo heróico o brado retumbante.

De um povo o herói com o braço retumbante.

(4)

Do que a terra mais garrida.

Do que a terra margaridas.

Os exemplos (3-4) refletem uma espécie de coerção instintiva para a letra fazer sentido com o repertório linguístico que o ouvinte tem. A partir da estranheza de sequências como heróico o brado e mais garrida no léxico da criança média brasileira, ocorre a redistribuição das fronteiras fonéticas, com troca da posição de sílabas, para formarem palavras de contextos mais concretos e familiares. Assim, em (4), a sílaba fraca co se separa de heróico o e vira a sequência herói com o; em (5) a palavra mais em mais garrida vira a primeira sílaba fraca de margaridas. Além disso, o contexto subsequente ao hino ativa cenários semanticamente propícios ao uso de margaridas, como o trecho vizinho Nossos bosques têm mais vida.

Por serem, em geral, composições antigas, hinos nacionais são terreno fértil para virunduns em todas as nações. O trecho em (5) do hino nacional dos Estados Unidos[8] contém a palavra dawn (alvorada) em um contexto de posse, raro para a sintaxe de uma criança norte-americana. Assim, a sequência dawn’s early é substituída por donzerly, interpretada vagamente como adjetivo modificador de light. Donzerly não existe e somente emerge como virundum:

(5)       by the dawn’s early light

            ‘pela luz matutina da alvorada’

(6)       by the donzerly light

           A ignorância sobre o léxico e o contexto perfeito que sílabas átonas proporcionam são dois ingredientes que formam um dos virunduns mais famosos em português.

(7)

Um abajur cor de carne.

Um abajur cor de carmim.

O virundum em (7) é um pouco diferente dos apresentados em (1-6). Nesse caso, ouve-se corretamente cor de carne[9]. No entanto, atribuir tons de carne para um abajur parece menos plausível do que tons de carmim, um corante têxtil vermelho de mesmo nome. Além disso, o contexto da música fala em lençol azul e cortinas de seda, elementos que remetem mais a uma interpretação com a palavra carmim. Assim, o ouvinte, em hipercorreção, persevera e “ouve” erradamente cor de carmim. O componente semântico parece ser bem mais forte do que o componente fonético-fonológico, já que para insistir na interpretação de carmim o acento da palavra é deslocado para esquerda de modo a se encaixar no acento tônico do verso. Enquanto a palavra carMIM é oxítona, CARne é paroxítona, em pronúncias isoladas. Com o deslocamento do acento da palavra, a última sílaba, em contexto átono, tem o sinal acústico enfraquecido.

Erros de ouvido consistentes e sistemáticos do presente podem virar as regras linguísticas vigentes do futuro

Outro caso famoso de virundum é o da música Purple Haze de Jimi Hendrix[10]:

(8)

Excuse while I kiss the sky (Com licença, enquanto eu beijo o céu)

Excuse while I kiss this guy (Com licença, enquanto eu beijo este cara)

Além de a alternância ocorrer em contexto de sílaba fraca, a classe de sons envolvidos também parece favorecer bons contextos para virunduns. Em pronúncia rápida, a sequência das duas palavras thesKy fica muito parecida com a sequência das duas palavras thisGuy. No caso, k (de sky) alterna com g (de guy). Se cortarmos, em um programa de análise acústica[11], o s em sky, ouviremos um ky muitíssimo parecido com guy. Os sons k e g pertencem à classe das plosivas (de explodir), consoantes cuja articulação é completamente interrompida em algum momento de sua produção. Já o som s pertence ao grupo das fricativas (de fricção), sons cuja articulação nunca é completamente interrompida durante sua produção. Plosivas e fricativas são as classes mais encontradas em virunduns.

Além dos argumentos fonéticos, também podemos dizer que, sem o devido contexto, ‘beijar este cara’ é uma interpretação mais familiar e concreta do que o conceito abstrato e improvável de ‘beijar o céu’.

Diferenças dialetais (de sotaque) também geram virunduns. Alguns falantes de português europeu julgam ouvir erradamente (9a) no lugar de (9b) na música Ginga da cantora Iza[12]:

(9a)

Entra, arrota e xinga, xinga!

(9b)

Entra na roda e ginga, ginga!

Nesse virundum d é trocado por t (na roda/ arrota) e g é trocado por x (ginga/xinga). Em ambos os casos, os grafemas d > t e g > x formam pares cujos sons que representam distinguem-se apenas pela sua capacidade de fazerem as cordas vocais vibrarem ou não. D e g são grafemas que representam sons em que as cordas vocais vibram (vozeadas); já t e x representam sons em que as cordas vocais não vibram (desvozeadas). Ambas as sílabas afetadas estão em contexto átono em relação ao acento do verso (9c).

(9c)

Entra na ROda e ginGA, ginGA!            

A palavra roda é paroxítona e o permanece quando encaixada no verso. O acento da palavra ginga recai naturalmente na penúltima sílaba, mas quando inserida no verso seu acento é deslocado para a última sílaba. Isso fragiliza acusticamente a primeira sílaba da palavra.

Erros sistemáticos como gatilhos para a mudança e criação linguística

Erros de divisão e categorização entre fronteiras de palavras, morfemas e sintagmas formam uma das engrenagens para a mudança linguística. Erros de ouvido consistentes e sistemáticos do presente podem virar as regras linguísticas vigentes do futuro.

Os virunduns em (10) consistem no rearranjo de certas fronteiras fonéticas.

É comum nomes próprios pouco conhecidos serem confundidos, como B.B. King no Brasil em 1983. A primeira alternância ocorre entre os sons d > b. Nesse estágio, biquínis só podem ser ‘trocados’ e não ‘tocados’. Em (10b), o rearranjo do artigo ‘o’ gera som semelhante ao do ‘l’ no adjetivo ‘mal’(pronunciado ‘mau’). A vogal e ao lado da vogal aberta a (que a) gera uma vogal e com a pronúncia aberta (que é).

Virunduns são como mutações da conversação. O foneticista John Ohala explica que mutações consistentes durante o tempo, como mutações biológicas, levam a mudanças evolucionárias. O erro de ouvido de hoje pode ser a regra implícita gramatical de amanhã. Um exemplo é a palavra do inglês apron (avental). Originalmente, era napron. O contexto ambíguo após o artigo a napron levou à reinterpretação das fronteiras como an apron. O mesmo também pode ocorrer em outras línguas, é o exemplo da palavra orologio do italiano, que foi reanalisada em português como relógio.

Um exemplo relevante na atualidade é o da música Born on the Bayou da banda Creedence Clearwater Revival. No refrão em (11), falantes de português brasileiro têm relatado ouvir a pronúncia do inglês para Corona Virus (algo como corona vAIrus)[13].

(11)     Born on the bayou (Nascido no pântano)

            Corona vAIrus

Podemos pontuar causas de dois tipos para a emergência do virundum em (11)[14]. Primeiramente uma causa de ordem sociolinguístca: a palavra do inglês bayou é um regionalismo do estado da Louisiana nos EUA e significa ‘pântano’. É uma palavra que chega ao inglês a partir do choctaw bayouk via francês. Já vimos em outros contextos como a ignorância sobre o léxico pode influenciar na produção de virunduns (cf. 3-6). Neste caso, uma particularidade nova e circunstancial, a pandemia de COVID-19 (Novo Corona Vírus)[15], agora concreta e familiar, emerge no contexto semanticamente pouco conhecido do regionalismo. O segundo tipo de causa é o contexto foneticamente ambíguo.

Os núcleos das sílabas que carregam o acento principal (mais forte) e secundário (segundo mais forte) do verso são iguais. A sílaba mais forte do verso é bay, cujo núcleo vocálico soa igual ao de v(ai) em virus. A segunda sílaba mais forte do verso está na palavra born (corona). Outro ambiente com sons parecidos é o das consoantes das sílabas fortes. Eles compartilham ao menos um traço em comum cada uma. b em born e c em corona são ambas consoantes que expressam sons do tipo plosivos (que explodem); b em bayou e v em virus começam com consoantes que representam sons do tipo bilabiais (que são articulados com os lábios). Sons da mesma classe são fáceis de serem confundidos.

As sílabas restantes estão em sílabas fracas, o que favorece a queda de sons, como o artigo the. A duração de the é compensada pelo aparecimento da vogal a (mesma vogal da sílaba seguinte em v(ai)rus) no final da palavra corona. A sílaba final do verso, o ambiente mais frágil de todos, é preenchida com consoantes que não causam muita perturbação no sinal acústico: o r da pronúncia do inglês e o s. É comum falantes de português brasileiro oscilarem quanto à pronúncia ou apagamento e, consequentemente, quanto à percepção de -s em contexto final. Nesse caso, o ouvido persevera e “ouve” um “s” final que não existe materialmente. Fatores semânticos atuais que tornam o termo corona vírus mais concreto e familiar, fatores fonético-fonológicos e a reorganização das fronteiras entre as palavras explicam a ocorrência desse recente virundum.

A reorganização de fronteiras linguísticas átonas e com contextos fonéticos frágeis também ocorre em processos de nascimento de línguas. Um desses processos é a comumente chamada crioulização.  O processo que os linguistas chamam tecnicamente de crioulização envolve uma “mistura” organizada e inconsciente de línguas. Minimamente, essa “mistura” envolve uma língua falada por uma minoria dominante, como, por exemplo, a do colonizador, e várias línguas faladas por uma maioria dominada, como, por exemplo, as pessoas escravizadas nas Américas. Em uma situação em que o grupo segregado e dominado que fala várias línguas tem que estabelecer comunicação com o grupo dominador que fala apenas uma língua, a língua do dominador passa a ser o alvo de aprendizado por parte dos adultos segregados.  

Depois de um tempo, esses adultos conseguem reunir um conjunto de palavras com uma gramática bem instável, mas com o mínimo necessário para a comunicação. A esse pré-estágio do nascimento de uma língua chamamos pidgin. Com o passar do tempo, as crianças que nascem no mesmo contexto de segregação e que são expostas a esse pidgin passam a tê-lo como alvo de aprendizado. Nesse momento, uma reestruturação abrupta e inconsciente ocorre no pidgin, que passa a ter uma gramática estável. A partir do momento em que essas crianças adquirem a nova língua como primeira podemos dizer que uma língua crioula acaba de nascer. Tecnicamente, língua crioula é toda e qualquer língua que nasce de contextos específicos de segregação como esses. Pidgins e línguas crioulas são descritos no mundo todo, não somente nas Américas.

O contexto colonial das plantations no Caribe apresentava esse cenário. No caso, o francês era a língua do colonizador e línguas de origem Bantu (oeste da África), as dos segregados. Uma língua que nasceu nesse contexto, o Kheuól do Uaçá, atualmente, é falado por dois povos indígenas no Brasil, os Karipuna e os Galibi-Marworno. Ambos são povos com origens ancestrais bastante distintas, habitantes do Amapá e que herdaram como língua de identidade essa antiga língua franca da região. Em (13a-d) temos alguns exemplos.

(13a) lapolis    (polícia, vem de la police),     *polis

(13b) lahivie   (rio, vem de la rivière),          *hivie

(13c) lokasiõ   (ocasião, vem de l’occasion), *okasiõ

(13d) zohé       (orelha, vem de les oreilles),  *ohé

            As formas em (13a-d) foram incorporadas ao Kheuól junto com o rótulo fonético do artigo francês. No Kheuól, o artigo vem depois do nome (14a-d):

(14a) lapolis-la           ‘a polícia’

(14b) lahivie-la           ‘o rio’

(14c) lokasiõ-la           ‘a ocasião’

(14d) zohéla               ‘a orelha’        

Evolução define-se biologicamente como a capacidade que organismos têm de passarem às gerações seguintes características que lhes conferem vantagem adaptativa. Ao longo do tempo, pequenas mutações sucessivas implicam em grandes mutações (como a capacidade de linguagem nos humanos) ou inovações (como o surgimento de novas espécies). Analogamente, as línguas crioulas nascem de estruturas gramaticalmente instáveis (pidgins) que através das gerações (muitas ou poucas, há ambos os casos) apresentam formas derivantes em disputa. As estruturas que irão perseverar na língua crioula nascente irão depender tanto de fatores internos, como parâmetros de aquisição da linguagem, quanto de fatores externos, como condições socio-historicamente determinadas. Seja por causas internas ou externas, somente estruturas gramaticais que confiram alguma vantagem adaptativa são passadas adiante. Os virunduns podem ser analisados como pequenas mutações linguísticas que, assim como na evolução dos organismos biológicos, podem implicar em grandes mutações (como línguas que trocam a posição normal do verbo) e inovações ao longo do tempo (como novas línguas).

O exemplo que abre este texto, Ouviram do Ipiranga às margens flácidas, envolve a confusão entre uma plosiva p (plácidas) e uma fricativa f (flácidas) em contexto que envolve outra fricativa s no final de margens em um ambiente musical. Além de reunir a fragilidade fonética necessária, o vídeo apresenta ambiente aberto e barulhento de gravação como fator ambiental preponderante. A razoável erudição do léxico do hino torna perfeitamente plausível a interpretação equivocada do hino nacional. Por fim, os ânimos exaltados que dividem os grupos de apoiadores dos opositores constroem as bases perfeitas para interpretações guiadas quase que exclusivamente pelas paixões. Na política, talvez, o que os olhos não veem o coração não sinta, já na linguística temos o completo inverso: o que os ouvidos ouvem (é) o que o coração sente.


Notas

[1] https://m.youtube.com/watch?v=y9kLn0HE6L0 [Acessado em 30/06/2020].

[2] Esta imagem ficou bastante famosa após ser utilizada por Ludwig Wittgenstein em suas Investigações Filosóficas.

[3] https://www.youtube.com/watch?v=1hzbRFXqJ4A [Acessado em 30/06/2020].

[4] https://www.youtube.com/watch?v=7RdD703z4I4 [Acessado em 30/06/2020].

[5] https://www.youtube.com/watch?v=Dsd09Skc0qQ [Acessado em 30/06/2020].

[6] https://www.youtube.com/watch?v=nfk6sCzRTbM [Acessado em 30/06/2020].

[7] https://www.youtube.com/watch?v=iLm5TX9WxPc [Acessado em 30/06/2020].

[8] https://www.youtube.com/watch?v=IdcKLuRjIX0 [Acessado em 30/06/2020].

[9] O autor da música, Ritchie, reafirma que o correto, realmente, é cor de carne. Veja em https://www.youtube.com/watch?v=Z4wsrYpPC08 [Acessado em 30/06/2020].

[10] https://www.youtube.com/watch?v=cJunCsrhJjg [Acessado em 30/06/2020].

[11] Programas de análise acústica fornecem “fotografias” (conhecidos como espectrogramas) dos sons e permitem a mensuração dos elementos que compõem o sinal acústico, como frequência (agudo ou grave), altura (barulhento ou baixo) e duração (longo ou breve). O programa gratuito mais utilizado por linguistas é o PRAAT que pode ser baixado em https://www.fon.hum.uva.nl/praat/ [Acessado em 30/06/2020].

[12] https://www.youtube.com/watch?v=8BXAYleTuLw [Acessado em 30/06/2020].

[13] Ouça e confira: https://www.youtube.com/watch?v=fcTQCNntGEs [Acessado em 30/06/2020].

[14] Especificamente, (11) seria um caso de soromimi, em que uma sequência em uma língua é entendida de maneira ambígua por falantes de outra língua, como nos exemplos de soromimis inglês-português: Please Don’t Go/Fiz dois gols https://www.youtube.com/watch?v=ujwm8YrEgI4; This is the rhythm of the night/ Jesus humilha o Satanás https://www.youtube.com/watch?v=u3ltZmI5LQw; Whoomp! There It is/ Uh! Tererê https://www.youtube.com/watch?v=Z-FPimCmbX8; It’s automatic/Ah tcho tho meri https://www.youtube.com/watch?v=TfdWQcfs4yo. [Acessados em 30/06/2020].

[15] Este texto foi finalizado em abril de 2020, durante a pandemia de COVD-19.