Esse artigo foi publicado pela revista científica “Cadernos da Pós-Graduação” do Instituto de Artes da Unicamp, ano 2007.
———————————–
O SOM INTERNÉTICO: a evolução, a situação e a estética sonora na Internet
Autor: Daniela Carvalho Monteiro Ferreira
Co-autor: Prof. Dr. José Eduardo Ribeiro de Paiva
Resumo: O objetivo deste trabalho foi o de relatar o registro histórico dos formatos e dos codecs de áudio presentes na Internet, a partir do ano 1990. Este registro é a base para conhecer a evolução tecnológica sonora digital, que fundamenta a análise do som como recurso de comunicação e de arte. A partir desta análise, verifica-se a função do áudio na multimídia via Internet mediante a percepção dos usuários, e avaliam-se as tendências de utilização para que o processo sonoro de comunicação seja mais efetivo via web.
Palavras-Chave: Websites. Hipertexto. Internet. Áudio. Comunicação. Multimídia.
1. Tipos de Arquivos Sonoros na Internet
Existem três categorias de som digital: som por eventos; som por ondas sem compactação e som por ondas com compactação.
Para Internet, é necessário que o arquivo de áudio seja compactado para não comprometer a execução do som em um tempo suportável pelo usuário.
1994 – MPEG (Moving Picture Experts Group)
O MPEG-1 foi projetado para codificar um vídeo, progressivamente, a uma taxa de 1,5 milhão de bits por segundo. Ele foi desenvolvido, especificamente, para mídias Vídeo-CD e CD-i. O MPEG-1 Audio Layer-3 (MP3) também evoluiu a partir desse trabalho do MPEG. O MPEG-2 é usado para transmissão de televisões digitais e DVDs (Digital Versatile Disc). O MPEG-4 trata-se de um ambicioso padrão, capaz de endereçar vozes e vídeos, trabalhar com geometria de fractais, visualização por computador e inteligência artificial (AI) na hora de construir as imagens.
1995 – STREAMING
Os Streaming media são sons (audio) e imagens (video) transmitidos pela Internet em forma de fluxo (streaming) ou contínua, usando pacotes de dados. A maioria dos áudios streaming não se parece com o arquivo de áudio original, pois este foi comprimido e tem partes de seu espectro original de freqüência removidas. A grande diferença entre o download e o streaming é que, ao contrário do áudio que foi baixado, o áudio streaming é ouvido no mesmo tempo em que é entregue a informação ao usuário.
No streaming, pode-se escolher entre dois diferentes cenários de desenvolvimento. O primeiro é o “ao vivo”, em que o áudio streaming é enviado em tempo real do computador do desenvolvedor para o servidor redistribuir aos múltiplos ouvintes. O segundo cenário é o “sob demanda”, em que os arquivos de áudio streaming são desenvolvidos e transferidos para o servidor redistribuir aos múltiplos ouvintes.
1996 – MP3 (MPEG-1 Audio Layer 3)
O MP3 é uma tecnologia e codec padrão para comprimir uma seqüência de sons em um arquivo muito pequeno (cerca de um doze avos do tamanho do arquivo original), enquanto preserva o nível original da qualidade de som quando ele é tocado.
Os arquivos MP3 (identificados com um sufixo .mp3 no nome do arquivo) estão disponíveis para download em vários Web sites.
1997 – RealAudio
Um arquivo do RealAudio pode ser reconhecido pelas suas extensões no nome do arquivo: .rm, .ram e .rpm (BEGGS; THEDE, 2001).
Clipe de RealMedia (.rm) – clipes de RealMedia são áudio ou vídeo codificados nos formatos RealAudio e RealVideo. Os arquivos .rm podem conter diversas transmissões, incluindo áudio, vídeo, mapas de imagem e eventos. Versões anteriores ao RealAudio 5.0 usavam a extensão .ra para clipes.
Metarquivo RealMedia (.ram) – os metas arquivos localizados no provedor conectam uma página da Internet aos clipes de RealAudio, RealVideo ou RealFlash. O metarquivo contém o URL de um ou mais clipes localizados no RealServer. Este arquivo inicia o player externo, que, depois, requisita o arquivo RealMedia (.rm) mencionado no metarquivo.
Metarquivo de plug-in de RealPlayer (.rpm) – O metarquivo RealPlayer é similar ao metarquivo RealMedia, porém é usado com o Plug-in RealPlayer, quando o player está embutido diretamente numa página de Internet. Este arquivo não inicia o player externo.
1999 – WMA (Windows Media Áudio)
Os arquivos Windows Media Audio são arquivos Advanced Windows Audio (.asf) . Segundo a Microsoft, o WMA possui a tecnologia VBR (Variable Bit Rate), que oferece áudio de alta qualidade com metade do tamanho de arquivos MP3.
2000[?] – TwinVQ
O TwinVQ oferece alta compressão, cerca de 1/18 sem perda da qualidade. Foi projetado pela NTT Human Interface Laboratories no Japão, e sua extensão é VQF (.vqf).
É um formato desenvolvido para evitar erros de canais ou perdas de pacotes de informação. Possui qualidade de 40kbit/s (kilobits por segundo), e isso quer dizer que o TwinVQ é comparável com um MP3 a 64kbit/s.
2000[?] – SWA (Shockwave Audio)
De acordo com a própria Macromedia, esse arquivo foi desenvolvido para fornecer um som contínuo de maior qualidade na Internet, tem o mesmo sistema de compactação do MP3, o que torna possível a excução desse arquivo em qualquer player que toque MP3, cuja principal diferença do SWA para o MP3 é o cabeçalho de informação. A Macromedia incluiu informações em seu cabeçalho para pertimir ao Director (software de desenvolvimento de apresentações multimídia) usá-los como dicas ou utilizar outras propriedades de lingo (linguagem de programação que altera comportamentos de determinados objetos na apresentação).
2000 – FLAC (Free Lossless Audio Codec)
O FLAC (Free Lossless Audio Codec) foi lançado no mercado como um codec para comprimir áudio, utilizado no streamind sound criado pelo Xiphophorus.
É um padrão livre de codec de áudio com poucas perdas e é similar ao MP3, só que com menos perda, ou seja, um áudio pode ser comprimido em FLAC sem perda de qualidade. Funciona, mais ou menos, como o Zip (compressor de arquivos bastante popular), excetuando que o FLAC tem melhor compressão porque foi projetado, especificamente, para áudio, podendo ser utilizado em qualquer player (carro ou qualquer som) que toque os arquivos MP3. Podemos dizer que o projeto FLAC é um formato stream de áudio.
2001 – AAC (Advanced Audio Coding)
O AAC foi desenvolvido pelo grupo MPEG, que inclui a Dolby, Fraunhofer (FhG), AT&T, Sony e Nokia – empresas que também estavam envolvidas no desenvolvimento dos audios codecs como o MP3 e AC3 (agora conhecido como Dolby Digital). O AAC utiliza o Variable Bit Rate (VBR) para codificar o áudio.
Na comparação feita do AAC com o MP3 pela Apple, segue o seguinte resultado:
1- Mais qualidade em menor tamanho.
2- Suporte para multicanais de áudio, oferecendo uma freqüência total de 48 canais.
3- Alta resolução do áudio, com taxa de amostra acima de 96 kHz.
4- Mais eficiência na decodificação, requerendo menos poder de processamento para decodificar.
2002[?] – MP3pro
Para melhorar a qualidade do som do MP3 em pequenas taxas de bit, a Coding Technologies desenvolveu uma tecnologia que utiliza componentes de alta freqüência. A tecnologia chama “Spectral Band Replication” (SBR).
Combinando MP3 com a tecnologia SBR, gera-se um sinal de áudio em bandalarga com baixas taxas de bits. No mp3PRO, o resultado do formato de áudio é composto por dois componentes, a parte MP3 para a baixa freqüência e a parte SBR ou “PRO” para a alta freqüência. Desde a parte “PRO”, que requer somente poucos kbps, o formato poderá ainda ser compatível com o formato original MP3. Esse fato proporciona que players de MP3 já existentes toquem os arquivos mp3PRO; pois eles simplesmente ignoram a parte PRO.
2002 – Ogg Vorbis
O Ogg Vorbis é um codec (audio compression) completamente livre e aberto projetado pela Xiph.org Foundation.
O Ogg Vorbis é um formato de áudio comprimido totalmente aberto, sem proprietário, livre de patente e royalty, e de propósitos gerais, por meio de alta qualidade (8kHz-48.0kHz, 16+ bit, polifônico) de áudio e música, com taxas de bits que podem variar de 16 a 128 kbps/canal. O Ogg Vorbis pertence às mesmas classes de áudio representadas por MPEG-4 (AAC) e similares a ele, e de maior performance do que MPEG-1/2 audio layer 3, MPEG-4 audio (TwinVQ) e WMA.
2003 – ATRAC3Plus
O ATRAC3Plus (Adaptative TRansform Acoustic Coding 3 Plus) é o avanço do ATRAC3 (.OMG) desenvolvido pela Sony em 2000. Os dois formatos são uma tecnologia avançada baseada no ATRAC (Adaptative TRansform Acoustic Coding), que foi originada com o MiniDisc.
Possui uma tecnologia que melhora a análise da freqüência do som e que resulta em alta qualidade com alto nível de compressão de 1/20 do arquivo original.
O software para conversão de um arquivo de áudio para ATRAC3Plus é o SonicStage da Sony.
2004 – Monkey’s Audio
De acordo com o site do fabricante, o Monkey’s Áudio é modo de compressão de música digital diferente do método tradicional, como o MP3 ou OGG, que descarta, permanentemente, a qualidade para economizar espaço, o Monkey’s Audio somente faz a cópia da música bit-por-bit. Isso denota que o som sempre será perfeito, exatamente como no original. Além de o som ser perfeito, ainda economiza muito espaço (parecido como um Winzip para a música).
2004 – Speex
O Speex é um formato aberto/software livre, isento de patente, projetado para a fala. O objetivo do Projeto Speex é diminuir a barreira entre as aplicações de voz, provendo uma alternativa gratuita para os proprietários de codecs de fala.
Supõe-se que o OGG seja uma grande promessa para os próximos anos, pois é o que possui mais vantagens dos apresentados nesta seção, e já começam a surgir aparelhos de som e players diversos para esse formato.
As maiores vantagens são:
1- Tecnologia baseada em MPEG-4.
2- Formato aberto e livre de patente (o MP3 é apenas aberto).
3- Melhor desempenho que o MP3.
2. O Áudio em Sites Brasileiros
Foram analisados nove websites que estavam concorrendo no Top 10, versão 2005, do Prêmio iBest, sorteados aleatoriamente. Os sites analisados foram: Porto Seguro; Americanas; Natura; Usabilidoido; Real Hip-Hop; Descobrindo o Original; Biblioteca Virtual do Estudante de Língua Portuguesa; Chilli Beans; Tribus Online.
Percebeu-se que o áudio não é utilizado com todo seu potencial nos sites analisados, poucos souberam como aproveitar adequadamente os recursos sonoros. No geral, tratam o som como um adorno, e não como um recurso de comunicação. Mesmo a Biblioteca Virtual da USP, que conseguiu utilizar o som como elemento primordial na transmissão de conteúdo de maneira que envolvesse o usuário, pois conseguiu balancear qualidade da captação e edição do som com o tamanho do arquivo, não comprometendo a navegação no site, não maximizou a potencialidade do som na Internet, como um meio de comunicação.
O emprego do som na Internet não está bem resolvido, pois parece que são utilizados sem planejamento, apenas aproveitando a facilidade de captação e divulgação nesse meio. Calcula-se que seja necessário planejar o áudio com a mesma atenção que percebemos que se percebe estarem dando ao design de páginas. Não foram encontrados sites que tenham trabalhado o som, especificamente, para a Web, que tivessem utilizado fundamentos de modelagem sonora (sound design) para desenvolver a ambientação do site.
O som mal articulado transmite a sensação de “feiúra” (JORDAIN, 1998) do áudio na World Wide Web. Por isso, considera-se que os desenvolvedores desses websites ainda não descobriram o poder do áudio para compor a estética geral da página, pois, como Goethe citou (Apud STEINER, 1998:33) uma vez, “a dignidade da Arte é talvez, no caso da música, a mais eminente, por não ter qualquer matéria a ser subtraída. Ela é integralmente forma e teor, e eleva e enobrece o que expressa”.
É de fato necessário ter cuidados ao projetar um áudio para Internet, pois requer conhecimentos tecnológicos e técnicos específicos para conseguir atingir a finalidade do som.
3. Opinião do Usuário de Internet sobre o Som na Web
Foi realizada uma pesquisa qualitativa com três grupos de usuários de Internet, sendo um com utilização menos freqüente e dois com mais freqüência.
Após a interpretação das entrevistas, foram obtidas as seguintes respostas para as perguntas:
. O usuário de Internet já voltou a um site por causa da música / som?
De maneira geral, se o som tiver um conteúdo agradável, for bem planejado, não demorar a carregar e, ainda, não tiver cortes constantes em sua transmissão, os usuários voltariam a um site por causa da música/som, mas não somente por isso.
. Será que o som tocado repetidas vezes (loop) como pano de fundo no site incomoda o usuário?
O uso de loop não é muito aconselhável, pois é necessário que seja bem articulado para que não haja percepção de quebra e constante repetição. Constatou-se que o usuário não se habitua ao som, ignorando-o, mas foi classificado como cansativo, o que aumenta a rejeição do usuário pelo site.
. Qual é a reação perceptiva do usuário quando acessa um site com som?
O visitante reage ao estímulo sonoro, logo, quando este é disparado no website, a rejeição ou a aceitação destes sons, está intimamente ligada a sua coerência com o conteúdo do site, seja funcional, informativo ou de entretenimento.
. Como será a utilização ideal do áudio para que o usuário perceba a beleza no som e sua influência na composição artística do Web site?
Acredita-se que esteja na relação direta com a ambientação do site, ou seja, que torne a visita uma experiência prazerosa.
. Até que ponto a música / som na Internet é prazerosa?
Na Internet, o prazer está relacionado diretamente com a expectativa do visitante, pois deve ajudar na interatividade e não atrapalhar na busca por informação ou mesmo estar desconexo com todo o conteúdo do site.
. O usuário de Internet vê necessidade em investir em equipamentos de som para computadores e de conexão para melhorar a qualidade do som recebido?
Percebeu-se que, quando os usuários detectarem a preocupação dos sites com o som integrado no conteúdo, estes também passarão a preocupar-se com equipamentos sonoros para poder ter acesso a esse trabalho. Mas, enquanto o áudio for secundário na Internet, não for planejado e pensado para esse meio, os usuários também considerarão equipamentos sonoros para o computador, secundários, inclusive, foi identificado que um dos entrevistados tem placa de som que comporta o som surround (5.1 ou 7.1).
Traçando, então, comparativos entre a análise do corpus de estudo e a pesquisa qualitativa, chegou-se à conclusão de que o problema do áudio para a Internet não é a tecnologia (existem vários tipos de arquivos de áudio com algoritmos de compressão avançados, que permitem boa qualidade sonora e a conexão de banda larga está se tornando mais acessível às pessoas comuns) e nem mesmo a técnica (já é de domínio dos profissionais web o conhecimento de ajustar o áudio digital à capacidade disponível na Internet), mas, sim, a estética, pois os conteúdos sonoros não são, em sua maioria, coerentes com o contexto visual e ergonômico do site. Profissionais não estão pensando o som para Internet como se deveria. Esse pensar não envolve apenas adequação tecnológica e técnica (como tamanhos de arquivos x qualidade sonora), mas estética na condição de objeto integrante do conteúdo das páginas.
Hoje, o áudio é tratado como elemento isolado nos websites. O problema, aparentemente, apresenta-se no emissor da mensagem e não na ponta final, o destinatário. O usuário, na verdade, já aceita o som e espera por ele, mas não aceita que seu tempo seja tomado por um conteúdo vazio.
Pode, então, o som conter um sentido em si mesmo, ou apenas em conjunção com imagens ou linguagem?
Com base em tudo que foi pesquisado, percebe-se que, na Internet, é mais difícil conter um sentido em si mesmo, pois tem forte relação com o contexto disponível no website, pois caracteriza-se como um meio mais visual.
Devido à Internet ter como suporte o hipertexto (ligações entre nós, sendo estes nós qualquer tipo de elemento como imagem, som, arquivos etc.), e este, por sua vez, ser norteado por alguns princípios básicos, como a representação figurada, uso do mouse para interação de modo intuitivo e sensoriomotora, de menus que mostrem constantemente ao usuário as operações que ele pode realizar e com uma tela gráfica com alta resolução compatível com suas particularidades (LÉVY, 1993), é esperado que o som não desempenhe a mesma função como na televisão e no cinema, em que imagem exige o som. Mas o som pode dialogar com as imagens e os textos, a fim de dar uma outra significação ao sentido da mensagem na Internet, e também pode atuar como mais um meio de interação homem e computador, otimizando o aprendizado, o entretenimento e a funcionalidade.
4. Considerações Finais
Apesar das descobertas não serem representativas, devido à opção por uma metodologia de pesquisa qualitativa, permitiram ampliar a visão sobre esse assunto que ainda é novo no meio da comunicação. Surgem, portanto, a partir das investigações, hipóteses a ser comprovadas futuramente para, assim, poder-se determinar as modelagens sonoras adequadas à Internet.
A grande problemática, que torna esse essa Rede Mundial tão fascinante e intrigante, é que não existe uma fórmula que funcione. Existem algumas padronizações que tendem a facilitar a vida dos programadores, webdesigners e, agora, dos projetistas sonoros (websound designers), mas que não são suficientes, pois, por ser uma mídia interativa, depende muito dos recursos disponíveis no cliente, ou seja, no usuário. Recursos de hardware (placa de som, caixas de som, processador etc.) e de software (browser compatível, sistema operacional, plug-ins etc.). Acredita-se que o processo de comunicação sonora na Internet dê resultados com esforços despendidos em três pontas: 1- Profissionais de Tecnologia ou Interessados em Tecnologia; 2- Profissionais de Comunicação ou Interessados em Comunicação; 3- Esforços do Destinatário.
Mas, como previsto por Lévy, em um contexto em que o hipertexto seja dominante, a visualização gráfica ou diagramática é o meio mais intuitivo (1993). E a Internet, como um meio hipertexto, tem como atrativo maior a imagem, seja ela textual, pictórica ou em movimento. Por isso, icônicamente, o computador é representado pelo monitor, que é o dispositivo hardware que faz a interface visual entre o usuário e os recursos dentro, harmonizadamente, conectados e arranjados dentro do gabinete.
E ainda, porque o hipertexto permite a interatividade, tem característica multidimensional e dinâmica, é que possibilita conteúdos que vão além da escrita estática e linear. Percebe-se que o áudio precisa acompanhar essa não-linearidade.
O hirpertexto desafia o áudio, pois ele toma para si o poder de enaltecer um conteúdo visual, por isso é que o som, esteticamente, precisa ser constamente repensado para Internet, pois é importante tornar o conceito de hipertexto um fundamento para o conteúdo sonoro, enfaticamente, é necessário que o som seja pensado de modo não-linear.
Não é aconselhado utilizar músicas em looping nas páginas, porque ele é um som linear, e os usuários querem que o áudio aumente sua experiência multimídia e não que a boicote.
A Internet, por ser uma rede de hipertexto, prima pelo tempo real e imediatez (LÉVY, 1993), por isso que o usuário não quer esperar apresentações carregarem e não permitem atrasos. Devido a esse motivo, acredita-se que o streaming via Real Player, Windows Media Player ou QuickTime é aconselhado somente para vídeo (com ou sem áudio) ou para rádio on-line, já quando somente áudio por demanda, aconselha-se a utilização do Flash para otimizar a experiência sonora do usuário.
Percebe-se que alguns esforços em comunicação sonora já estão surgindo. Um exemplo recente é o Podcast, que, segundo Todd Cochrane (2005), tem se tornado moda nos Estados Unidos, e nota-se que, aos poucos, está conseguindo adeptos no Brasil. Como fundamento da suposição anterior, a técnica Podcast foi desenvolvida por um interessado em Internet sonora.
Essa interatividade, que pede pela participação do usuário e aliada àquela que emociona e que surpreende, tem sucesso na Internet. É um desafio tornar o áudio um elemento da comunicação web que possa interagir com o usuário, driblando as limitações de largura de banda e estimulando a qualificação tecnológica do destinatário. Diz-se um desafio porque as razões de incômodo do áudio na Internet são a baixa qualidade ou a demora do carregamento, pois quanto mais qualidade o som contiver, mais o arquivo ficará maior e mais problemas com a transmissão existirão. Com os novos tipos de arquivos sonoros citados anteriormente, entende-se que o caminho para contornar essa limitação do áudio está próximo do satisfatório, ainda mais que o índice de conexão em banda larga está crescendo no Brasil. Por isso, supõe-se que a evolução estética da comunicação sonora na Internet é tão relevante.
Enfim, deve-se aceitar que, hoje, o som tem um papel secundário na percepção do usuário, mas que também é um recurso relevante para criar novas experiências na Internet, assim, cabe aos profissionais de comunicação pensar o áudio coerente com o contexto de website, sem exageros. À medida que as experiências como som na Internet cresçam, também aumentará o número de usuários com suporte às várias abordagens tecnológicas, técnicas e estéticas do com, como o surround (WMA).
Percebe-se que, para o som conseguir emocionar e surpreender, aumentando a eficácia da comunicação, é importante que seja original e contextual. À medida que sua importância for aumentando, poderá existir a possibilidade do som ter sentido em si mesmo, sem precisar de elementos auxiliares, na Internet.
5. Referências
• ALTEN, Stanley A. Audio in Media. 6a Ed. Belmont: Wadsworth, 2001.
• BAUER, Martin W.; GEORGE, Gaskell; ALLUM, Nicholas C. Qualidade, Quantidade e Interesses do Conhecimento. In: BAUER, M.; GASKELL, G. Pesquisa Qualitativa com Texto, Imagem e Som: um manual prático. 3ª ed. Rio de Janeiro: Vozes, 2002.
• BEGGS, Josh; THEDE, Dylan. Projetando Web Audio: RealAudio, MP3, Flash e Beatnik. Tradução: Kirsten Woltmann. Rio de Janeiro: Ciência Moderna, 2001.
• CANCELLARO, Joseph. Exploring Sound Design for Interactive Media. Canada: Thomson, 2005.
• COCHRANE, Todd. Podcasting: the do-it-yourself guide. Estados Unidos: Wiley, 2005.
• JOURDAIN, Robert. Música, Cérebro e Êxtase: como a música captura nossa imaginação. Rio de Janeiro: Objetiva, 1998.
• LÉVY, Pierre. As Tecnologias da Inteligência: o futuro do pensamento na era da informática. São Paulo: Editora 24, 1993.
• MONKEY’S AUDIO. Disponível em <http://www.monkeysaudio.com>. Acesso em fev. 2005.
• SONY. Disponível em <http://www.sony.net>. Acesso em jan. 2005.
• STEINER, Rudolf. Arte e Estética Segundo Goethe: Goethe como inaugurador de uma estética nova. 2ª ed. São Paulo: Antroposófica, 1998.
• Whatis?com’s. Dicionário de Tecnologia. São Paulo: Futura, 2003.
• XIPH. Disponível em <http://www.xiph.org>. Acesso em jan. 2005.