2013/03/26

Fonologia e fonética: definições básicas

1. Sistema de comunicação

Trata-se de um processo, aparentemente, simples, muito embora encerre, no fundo, algumas especificidades próprias. Com efeito, basta pensarmos na forma como o enunciado é concebido e que, no essencial, consiste num processo motor que se articula com os planos fonológico, sintático e semântico
Significa isto que todo e qualquer ato comunicativo obedece a um conjunto de processos que implicam, naturalmente, vários níveis de codificação e de descodificação do sistema linguístico. Assim, e para simplificar, poder-se-á afirmar que, no plano linguístico, o ato de comunicação corresponde a várias fases de processamento que se resumem à interação entre (A) emissor e (B) ao recetor, para que o sinal acústico emitido, (C), ou seja, a fala, se propague no meio. 



Claro que um tal sistema acarreta um conjunto de implicações que se prende com as disciplinas conexas (que não cabe aqui analisar), a saber:
. a biologia;
. a linguística cognitiva;
. a psicolinguística;
. a anatomia;
. etc.
de onde se deve, desde já, inferir que a fonética constitui uma disciplina de natureza interdisciplinar.


2. Propriedades físicas dos sons

Os sons, como se sabe, encerram – quer na atividade de perceção, quer na de produção –, um conjunto de propriedades físicas, as quais, de resto, estão na base da tradicional divisão tripartida do campo da fonética:
1. acústica;
2. articulatória;
3. percetiva (que não será, aqui, objeto de estudo) [1].

De ressalvar, porém, que esta divisória é, a meu ver, perfeitamente artificial, pois que o fenómeno da fala constitui um ato de extrema complexidade onde atuam, como é óbvio, as três componentes mencionadas supra.


2.1. Fonética acústica
som: deslocação do ar que atinge, direta ou indiretamente, o ouvido.

fonte (vibratória): as vibrações podem propagar-se por meio aéreo, sólido ou líquido (constituído por partículas), o qual terá de ser uma massa dotada de uma certa plasticidade (i. e. qualidade de inércia ou resistência ao movimento), para, depois de acionado, voltar ao estado original.

onda sonora: resultado da ação da fonte vibratória, a onda sonora provoca, nas partículas do ar, estados de compressão e de rarefação, que se transmitem em círculos a partir dessa fonte.

pressão sonora: é o resultado da propagação das ondas sonoras.

onda sinusoidal: trata-se de uma onda para a qual a variação de pressão pode ser representada por uma curva sinusoidal, também conhecida por tom puro.

ciclo: a deslocação da partícula, por pressão, até ao seu ponto máximo.

período: duração de tempo que decorre entre dois pontos máximos de pressão da curva sinusoidal.

frequência: o número de vezes que o ciclo se repete por unidade de tempo. A unidade de tempo geralmente utilizada é o segundo, pelo que a frequência é o número de ciclos por segundo (c/s), a que também se dá o nome de Hertz (Hz).

amplitude: o ponto máximo de variação da pressão do ar em relação ao ponto estacionário.

frequência fundamental: a frequência das componentes, (i. e. das ondas sinusoidais), as quais serão sempre múltiplos integrais da frequência da repetição da onda complexa inicial.

harmónicos: as ondas componentes da onda complexa, sendo que a segunda harmónica (harmónico 2) tem uma frequência dupla da frequência fundamental, a terceira harmónica (harmónico 3) uma frequência tripla e assim sucessivamente.

ruído: o som composto por várias frequências aleatórias combinadas, sendo que a forma e a amplitude de cada frequência é aleatória. Isto significa que a onda possui uma forma repetitiva, i. e., não harmónica.


2.2. forma acústica e produção da fala

produção da fala: atividade controlada pelo sistema nervoso central e que passa por três etapas, a saber, (a) a respiração, (b) a fonação e (c) a articulação.

Nesta ótica, pode considerar-se que a respiração, considerada como sistema acústico, é a fonte de energia acústica para a fonação, cuja energia se traduz em pressão de ar com um determinado volume e velocidade.

Veja-se o esquema:


Fonte de energia: os pulmões funcionam como fonte de energia para a voz humana. Para falar, a pressão dos pulmões é aumentada de modo a ter uma pressão que atue como fonte de som. Em geral, a capacidade total de ar dos pulmões pode ser utilizada para diferentes funções. Cerca de 25% do total ficam sempre nos pulmões, mesmo depois da expiração: é o volume residual. Chama-se volume vital ao máximo de ar que pode ser trocado na respiração, que é, portanto, a diferença entre volume total e o volume residual. O volume tidal é aquele que pode variar segundo as atividades.

Fonte sonora: na produção dos sons da fala, podemos ter três tipos de fontes sonoras: uma fonte laríngea, uma fonte de ruído e uma fonte de transição.

Fonte laríngea: a fonte laríngea produz um sinal periódico com um espectro harmónico. Na laringe, as cordas vocais funcionam como um gerador de ondas periódicas. Durante a expiração, a passagem laríngea está aberta. Quando se inicia a fonação, as cordas vocais juntam-se e inicia-se a expiração. Ao juntarem-se, as cordas vocais provocam um aumento da pressão na área, pressão que aumenta até forçar que as cordas vocais se abram outra vez. A pressão baixa e as cordas voltam a fechar, cujo movimento (rápido) cria ondas regulares.

Frequência fundamental: as variações das cordas vocais são responsáveis pela variação de tom da voz, isto é, definem a frequência fundamental de cada voz. Nos homens, a frequência fundamental varia entre as 100 e as 150 vibrações por segundo (Hz) e, nas mulheres, a frequência fundamental varia entre as 200 e 250 vibrações por segundo (Hz). São as chamadas vibrações naturais. Note-se que a variação do tom, para além de definir a voz masculina, feminina ou infantil, define, igualmente, o tom natural da voz cantada – baixo, soprano ou contra-alto.

Tom da entoação: a entoação é produzida pelas variações do tom da voz mais altas ou mais baixas do que o tom de voz natural. Se o tom se mantivesse igual, seria uma voz monocórdica.

Fonte de ruído: uma das fontes sonoras da fala pode ser o ruído, que é um sinal acústico não periódico e quase estacionário, com um espectro contínuo de todas as frequências com a mesma amplitude (chamado ruído branco).

O ruído pode ser produzido na cavidade bucal, sob condição de a passagem do ar atingir uma certa velocidade, de forma a poder criar uma turbulência. Estas condições surgem quando há uma constrição do canal vocal suficiente para criar turbulência.

Na fala, as chamadas fricativas surdas são sons produzidos com passagem de ar, mas sem fonte laríngea. Com efeito, nas cavidades bucais ocorre uma constrição suficiente que provoca uma fonte de ruído – a fricatização.

Alguns dos sons da língua podem ser produzidos por duas fontes sonoras. Assim, as chamadas fricativas sonoras têm, inicialmente, uma fonte laríngea (que lhes atribui o vozeamento, i. e., a sonoridade) e, posteriormente, o ar encontra um constrangimento à sua passagem, provocando uma turbulência – a fricatização.

Fonte de ar transiente: podem igualmente ser originados sons de fala por fontes de ruído transiente. Este é um sinal acústico não periódico e não estacionário, de espectro contínuo.

O som transiente é produzido por uma abertura repentina e brusca de uma oclusão do trato vocal, onde se criou uma alta pressão de um lado da oclusão. A rápida igualização da pressão do ar de um e de outro lado produz uma explosão sonora. Esta fonte ocorre em consoantes ditas oclusivas, em que há, num local do trato vocal, uma obstrução à passagem do ar. Por conseguinte, aumenta a pressão do ar na cavidade anterior, e, quando o oclusão se relaxa, cria uma fonte de som transiente – a explosão do som.

As consoantes oclusivas aspiradas têm, por isso, três fontes sonoras: começam por ter uma fonte laríngea (que lhes atribui a sonoridade), mas o fluxo de ar é obstruído, criando-se, na abertura da oclusão uma fonte de transiente da explosão, e, logo a seguir, uma fonte de ruído.

Articulação: a passagem do ar vindo dos pulmões e da laringe tem de atravessar as cavidades supraglotais com uma configuração própria e assumem funções de filtro, atuando como cavidade de ressonância. Na verdade, as variações de configuração dessas cavidades podem originar cinco tipos diferentes de articulação, com consequências na especificação do som produzido:

1. Configuração vocálica: a configuração vocálica permite a livre passagem do ar com a formação de cavidades de ressonância supraglotais. As diferentes formas e tamanhos das cavidades determinadas pela articulação definem ressoadores com características específicas para certas frequências chamadas formantes.

Formantes: as zonas de frequência intensificadas pelas cavidades de ressonância são os formantes. Os formantes são específicos para cada vogal e definem a sua qualidade. A qualidade vocálica é, essencialmente, determinada pelos dois primeiros formantes (F1/F2), que permitem, por si só, o reconhecimento da vogal. As vogais e as semivogais (também chamadas glides) definem-se pela fonte laríngea e por um trato vocal sem obstruções ou constrições à livre passagem do ar, pelos formantes.

2. Configuração lateral: a passagem do ar é livre pelos lados da boca onde surge uma oclusão provocada pela parte média da língua, que se eleva no sentido do palato duro. Estes sons apresentam um espectro com formantes, mas também com antiformantes que reduzem o nível de F2, F3 e F4. São as consoantes ditas laterais [l] e [ ʎ].

3. Configuração nasal: o véu palatino é abaixado permitindo a passagem do ar pelas fossas nasais, pelo que a passagem nasal é, assim, acoplada à passagem oral. Produzem-se, deste modo, as vogais nasais.

No entanto, a passagem nasal pode estar livre, mas a passagem bucal estar fechada, originando as consoantes nasais. No caso das nasais, aparece um antiformante de cerca de 1000 Hz, reduzindo a energia de F2 e baixando a frequência de F1. De resto, em português, as consoantes nasais são todas sonoras.

4. Configuração fricativa: a passagem do ar é parcialmente obstruída no trato bucal, causando uma fonte de ruído. Com efeito, as fontes supraglotais de ruído apresentam um espectro com energia nas frequência altas (aparência de chuva). Se o ar já foi originado por uma fonte laríngea, aparece, a par da fricatização, um formante baixo (barra da sonoridade) e, nesse, caso, temos as fricativas sonoras.

5. Configuração oclusiva: a passagem do ar é totalmente obstruída nas cavidades bucais. Neste caso, não havendo passagem de ar, não há espectro acústico, o que acontece, com efeito, nas oclusivas surdas. No caso, porém, de a obstrução se der à passagem de som já originado pela fonte laríngea, aparece um formante baixo durante a oclusão (chamado barra de sonoridade), e neste caso, temos as oclusivas sonoras.

Vogal neutra: para obter uma relação entre as diferentes cavidades de ressonância e a estrutura formântica, pode-se, por conseguinte, fazer os cálculos, considerando que o trato vocal é um ressoador tubular de 17,5 cm – que é o tamanho para um homem. Neste caso, teríamos a frequência de 500 Hz para o primeiro formante F1, 1500 Hz para F2, 2500 para F3 e 3500 para F4. É a chamada vogal neutra.


2.3. perceção da fala

Estes fenómenos tratam da forma como os elementos acústicos são interpretados pela audição e, por conseguinte, apresentam a audição subjetiva dos fatores acústicos objetivos da fala, ou melhor, da sua percepção.

1. Tom [Pitch]: a frequência fundamental (F0) da voz é percebida como o tom (que se assume ser a melhor tradução da palavra inglesa pitch, geralmente usada nas diversas línguas e que poderá, pela generalização do seu uso, ser mantida no texto em português). O tom é a frequência fundamental subjectiva, isto é, ouvida.

2. Tom de ondas sinusoidais: a percepção do tom de uma sinusoidal é a própria frequência dessa onda – é um tom puro. Assim, uma onda sonora com frequência de 100 Hz terá um tom de 100 Hz e na onda de 500 Hz terá um tom de 500 Hz.

3. Escala de Koenig: por experimentação com sujeitos que avaliam sons com intervalos diferentes, estabeleceu-se uma escala que permite representar intervalos iguais entre tons por pontos separados por igual distância gráfica – a escala de Koenig.
Na escala de Koenig, dois pontos separados por igual distância equivalem a dois tons com igual diferença percetiva de tom.

4. Escala de Mel: o Mel é considerado como a unidade de tom (pitch). Sons que estão separados por um número igual de mels correspondem a iguais intervalos de tom.

5. Modelo de acesso lexical: o modelo de acesso lexical, apresentado por Klatt, propõe a realidade psicológica do segmento fonético como unidade de reconhecimento no processo bottom-up de formação lexical. Segundo ele, este processo permite a redução do armazenamento de conhecimentos e serve de ligação entra a fala e a audição.
O modelo computacional (LAFS), proposto por Klatt, permite verificar que o tempo de reconhecimento da unidade lexical é mais curto que o tempo de reconhecimento do fonema. Esta verificação apoia a hipótese, segundo a qual a informação deve ser transmitida de forma a não exigir uma quantidade demasiado grande de decisões por unidade de tempo.



3. Classificação e descrição do português contemporâneo

1. Transcrição: a transcrição fonética de uma sequência da fala é sempre um ato individual que reflete, muitas vezes, a conceção teórica que o transcritor tem das unidades da língua e da sua estrutura. Assim, a transcrição de uma mesma sequência pode, por isso mesmo, diferir sensivelmente de pessoa para pessoa. De resto, os hábitos linguísticos, o treino de transcrição, ou outros fatores fazem, por vezes ouvir sons diferentes para cada pessoa.
No entanto, para facilitar a descrição e a classificação das línguas, tem-se criado os chamados alfabetos fonéticos.

2. Identificação de classes: os alfabetos fonéticos mais antigos – quando ainda não havia processos laboratoriais – eram definidos de e pelo ouvido. Assim, os foneticistas podiam, para cada língua, ouvir variantes de uma vogal ou de uma consoante. Citamos, por exemplo, para o português, o número de ditongos considerados por gramáticos e filósofos. Para os ditongos orais esse número variava entre 5 e 28 e para os ditongos nasais entre 0 e 12!

3. Alfabetos fonéticos: o alfabeto fonético é um conjunto de símbolos que se destinam a representar graficamente os sons da linguagem, sendo que o princípio básico deste alfabeto consiste, na sua essência, em ser unívoco, isto é, em fazer corresponder cada símbolo a um único som da linguagem. De resto, importa ter presente que se conhecem alfabetos fonéticos desde, pelo menos, o século XVII, mas muitos só foram usados pelos seus próprios autores, os quais se desenvolveram, sobretudo, com o enorme incremento do estudo de línguas no fim do século XIX, um pouco por toda a Europa.

4. Alfabeto de Fonética Internacional: o alfabeto mais divulgado é o Alfabeto Fonético InternacionalIPA – do inglês International Phonetic Alphabet, cujo sistema notacional tem sido permanentemente atualizado no sentido de ir incluindo símbolos ou diacríticos que permitam uma descrição completa de todas as línguas conhecidas. De resto, hoje, o AFI é essencialmente composto por caracteres do alfabeto romano, acrescido de alguns diacríticos e outros símbolos. Aliás, já é possível integrar o AFI na barra de ferramentas dos programas de processamento de texto dos computadores, pelo que a sua utilização não constitui qualquer problema acrescido [2].

5. AFLL (Alfabeto Fonético da Faculdade de Letras de Lisboa): existem duas versões de transcrição fonética, uma que se destina a dar, apenas, os elementos necessários e suficientes para descrever o uso da língua – é a chamada transcrição larga – e aproxima-se muito da transcrição fonológica. O alfabeto fonético adotado nos trabalhos do Laboratório de Fonética usa símbolos do IPA, mas acrescenta-lhe o [ALFA] da palavra /cama/ por exemplo – por considerar que é um som que não está descrito pelo IPA. Com efeito, várias tentativas têm sido feitas para introduzir o [ALFA] como símbolo correspondente... a um som específico da língua portuguesa no IPA.

6. Classificação tradicional: os alfabetos citados classificam os sons da língua numa base de descrição articulatória. Na verdade, referem cada unidade fonética pelos chamados modo de articulação e ponto de articulação. Significa isto que esta classificação considera, à partida, duas classes de sons: as vogais e as consoantes.

7. Modo de articulação das consoantes: o modo indica a qualidade do som referente ao tipo de formação. Assim, são classificadas as consoantes oclusivas, fricativas, laterais, vibrantes e nasais. De resto, dentro de cada uma destas classes podemos, ainda, operar a divisão em surdas e sonoras, considerando, para o efeito, a ausência ou a presença de vibração das cordas vocais, respetivamente.

8. Ponto de articulação das consoantes: dentro de cada uma destas classes, o ponto de articulação refere a maneira como é realizado o modo, isto é, que partes do canal vocal é que contribuem para a sua definição.
Assim, tendo em conta as diferentes partes desse canal, sabemos que há partes que são estáveis, como por exemplo, o maxilar superior, os alvéolos, o palato, a parede faríngea, ao passo que outras se podem deslocar, como por exemplo, a língua, o véu, os lábios, alterando, por isso, a respetiva configuração articulatória. Por conseguinte, cada som é definido (quanto ao seu ponto de articulação) pelo nome do órgão que se desloca (ativo), seguido do nome do órgão na direção do qual se desloca (passivo).
Assim, se a ponta da língua (apex) se deslocar no sentido dos alvéolos, temos uma consoante apicoalveolar, se for contra os incisivos superiores é uma apicodental, se tivermos um movimento do dorso da língua contra o véu é uma consoante dorsovelar, etc.

Face ao exposto, temos, pois, nove pontos de articulação:
A. bilabial;
B. labiodental;
C. apicodental;
D. apicoalveolar;
E. apicopalatal (retroflexo);
F. dorsopalatal;
G. dorsovelar;
H. dorso-uvular;
I. dorsofaríngeo

9. Vozeamento das consoantes: cada consoante é definida simultaneamente pelo modo e ponto de articulação, a que ainda se acrescenta a característica do vozeamento. Assim, teremos, por exemplo:
i) uma consoante oclusiva apicoalveolar surda ou sonora;  
ii) uma consoante fricativa apicoalveolar surda ou sonora.

Aliás, é este o princípio de classificação utilizado no AFI para as consoantes...

10. Vogais: para classificar as vogais, são usados os termos de aberto, semiaberto, fechado, semifechado, anterior (ou adiantado), central e recuado. Contudo, estes elementos não permitem a identificação de todas as vogais, sem, correlativamente, citar o próprio nome da vogal. Assim, temos uma vogal [a] aberta ou semiaberta, uma vogal [u] fechada ou [+ fechada].
Note-se que, apesar de estarem situadas na zona dos pontos de articulação, as vogais não se classificam, todavia, pelo seu ponto de articulação, na medida em que constituem classes diferentes: as abertas, as fechadas, as médias, as centrais.

11. Classificação e descrição dos segmentos do português: os segmentos do sistema fonético do português são seguidamente apresentados segundo uma classificação tradicional, pelo que a descrição é, fundamentalmente, de dois tipos: articulatória (baseada em cinerradiografia) e acústica (baseada na espectrografia). Temos, assim [3]:





-------------------------------
[1]: o termo de fonética percetiva tem-se revelado, de alguma forma, bastante instável, designando, (a) para alguns autores, as propriedades acústicas subjacentes aos sons, (b) para outros, a perceção que os (inter)locutores possuem da base lexical, e, (c) para outros ainda, a expressão parece ser sinónima de compreensão dos enunciados...
[3] os exemplos apresentados são retirados de um conjunto de frases, lidas por um informante de Lisboa.
© Manuel Fontão

Sem comentários: