domingo, 2 de novembro de 2008

Entrando no clima...

Já que hoje o Felipe Massa não levou o campeonato por pouco e já que o clima de F1 paira sobre esta cidade, venho aqui demonstrar meu interesse atual pelo sentimento ágil. Thanks F1 and InfoQ.

De baby step em baby step a gente chega lá!

InfoQueue BR


Ontem, sábado, 01 de novembro de 2008, ocorreu o lançamento da InfoQueue BR com a presença de Floyd Marinescu. O evento foi organizado pela Fratech, que está trazendo esta marca para o Brasil.

Iniciativa louvável pois o infoQueue é um dos sites mais influentes na área de T.I. Traz muitas informações, artigos, videos, apresentações e livros sobre vários assuntos. Em destaque: Java, Ruby, SOA, Agile e Arquitetura.

Aproveite para visitar, se cadastrar e participar!

Welcome Back!

Após alguns - vários - dias distantes do blog, vou tentar aparecer mais por aqui e escrever sobre o que tenho visto e estudado nesse mundo de computação e música.

segunda-feira, 15 de setembro de 2008

Agradecimento

Muito obrigado ao pessoal que apareceu na minha palestra no Just Java 2008. Apesar de ter sido bem corrida, acredito que quem foi passou a conhecer um pouco mais sobre a computação musical e Java Sound.

Obrigado!

quinta-feira, 4 de setembro de 2008

Não

Não esqueci do blog...

sexta-feira, 22 de agosto de 2008

JustJava 2008

E o Just Java 2008 tá chegando!!
E eu estou preparando minha palestra sobre computação musical. :)

Pretendo fazer uma introdução sobre computação musical e depois falar um pouco sobre como a tecnologia Java trabalha com sons.

Confira a grade de palestras e o site do evento.

Playback de Áudio

Existem dois tipos de line que podem ser usados para tocar som: Clip e SourceDataLine. A diferença principal entre estas duas interfaces é que com um Clip você especifica todas as informações do som uma única vez antes da execução. Com um SourceDataLine, escrevemos continuamente em buffers de informação durante a execução. Embora hajam situações em que ambas as classes possam ser utilizadas, o critério seguinte ajuda a identificar que tipo de line é melhor para determinada situação:
  • Utilize um Clip quando você não tem informações de som em tempo real que podem ser pré-carregadas na memória.
    Ex.: Loops, iniciar o playback em uma posição arbitrária.
  • Utilize um SourceDataLine para stream de informações tais como um arquivo de som muito longo que não irá caber todo na memória de uma vez, ou um som cuja informações não podem ser conhecidas antes do playback.
    Ex.: síntese interativa de sons.

quinta-feira, 21 de agosto de 2008

Permissões para utilizar recursos de áudio

A API Java Sound inclui uma classe chamada AudioPermission que indica quais tipos de acesso uma applet (ou uma aplicação executando com um gerenciador de segurança) pode ter para o sistema de áudio. A permissão para gravação de som é controlada separadamente.

Se o seu programa não possui permissão para gravar (ou executar) som, uma exceção será lançada quando ele tentar abrir um Line. Não há nada que você possa fazer no seu programa a não ser capturar a exceção e apresentá-la ao usuário, pois as permissões não podem ser modificadas por meio da API. (caso contrário tudo seria inseguro). Geralmente as permissões são setadas em arquivos de configuração.

Como recuperar um Line

Existem duas maneiras:
  1. Diretamente do objeto AudioSystem
  2. A partir de um Mixer que você já obteve de um objeto AudioSystem
Recuperando um Line diretamente de um AudioSystem
Assumindo que ainda não obtemos um mixer e é preciso recuperar um line, podemos utilizar o método static Line getLine(Line.Info info) da classe AudioSystem. A classe Line.Info usada como argumento deste método não armazena informação textual para especificar uma linha desejada, ela armazena informações da classe de linha desejada.

Line.Info é uma classe abstrata, então utilizamos uma de suas sub-classes Port.Info ou DataLine.Info para obter uma linha. O trecho de código abaixo usa a classe DataLine.Info para obter e abrir um target data line:

TargetDataLine line;
DataLine.Info info = new DataLine.Info(TargetDataLine.class, format); // format is an AudioFormat object
if (!AudioSystem.isLineSupported(info)) {
// Handle the error.
}
// Obtain and open the line.
try {
line = (TargetDataLine) AudioSystem.getLine(info);
line.open(format);
} catch (LineUnavailableException ex) {
// Handle the error.
//...
}

Para portas, podemos utilizar instâncias estáticas de Port.Info:

if (AudioSystem.isLineSupported(Port.Info.MICROPHONE)) {
try {
line = (Port) AudioSystem.getLine(
Port.Info.MICROPHONE);
} catch(Exception e) { //... }
}

Lembre-se que um sourceLine é uma entrada para um mixer, especificamente, um objeto Port se o mixer representa um dispositivo de entrada de áudio e um objeto SourceDataLine ou Clip se o mixer representa um dispositivo de saída de áudio.

Podemos utilizar métodos de AudioSystem para conhecer mais sobre source e target lines de um tipo específico que é suportado por qualquer mixer instalado.

static Line.Info[] getSourceLineInfo(Line.Info info)
static Line.Info[] getTargetLineInfo(Line.Info info)

Note que o array retornado por cada um desses métodos indicam tipos únicos de linha, não necessariamente todas as linhas. Por exemplo, se duas linhas de um mixer ou duas linhas de diferentes mixers possuem objetos Line.Info idênticos, as duas linhas serão representadas por apenas um Line.Info no array.

A interface Mixer inclui variações nos métodos de acesso aos source e target lines do AudioSystem. Além dos métodos que requerem um argumento do tipo Line.Info, o Mixer também inclui métodos que não possuem argumentos:

Line.Info[] getSourceLineInfo()
Line.Info[] getTargetLineInfo()

Estes métodos retornam arrays de objetos Line.Info de um mixer específico.

Os métodos apresentados para recuperar Lines são aplicados também na recuperação de portas (Ports). Podemos abrir um porta invocando o método open da interface Line. A abertura de uma porta significa permitir que o som entre ou saia por esta porta. De maneira análoga, podemos fechar portas.

No geral, é recomendado que o programa não abra/feche portas a não ser pelo desejo explícito do usuário. Deve-se respeitar as configurações que o usuário ou o Sistema Operacional já tenha selecionado. (Imagine um usuário que se encontra em um ambiente extremamente silencioso executando um programa que abre a porta dos alto-falantes sem sua devida autorização)

Como recuperar um Mixer

Na maioria das vezes a primeira coisa que um programa que utliza a API Java Sound precisa fazer é obter um objeto Mixer ou pelo menos uma linha (Line) de um mixer para que seja possível manipular o som entrando ou saindo do computador. Para isso é necessário conhecer quais tipos de mixer estão instalados no sistema.

O método static Mixer.Info[] getMixerInfo() recupera o objeto de informação dos mixers que estão instalados. Cada objeto Mixer.Info retornado por este método identifica um tipo de mixer que está instalado no sistema. Um objeto Mixer.Info inclui as seguintes strings para identificar o tipo de mixer:
  • nome
  • versão
  • fabricante
  • descrição
Estas strings são arbitrárias. Assim, uma aplicação que precisa de um mixer específico deve saber o que esperar e deve saber com o quê comparar. A empresa que fornece o mixer deve incluir esta informação em sua documentação.
Uma vez que o mixer apropriado é encontrado, o programa invoca o método seguinte da classe AudioSystem para obter o mixer desejado:

static Mixer getMixer(Mixer.Info info)

Como acessar os recursos de som do seu sistema?

A API Java Sound provê maneiras de informar os componentes de áudio disponíveis no seu sistema e maneiras do seu programa acessá-los.

A classe AudioSystem

A classe AudioSystem atua como um coletor e distribuidor de informações para componentes de áudio, incluindo serviços nativos e serviços instalados separadamente por meio de providers de terceiros. Por exemplo, um programa pode ser iniciado solicitando a classe AudioSystem onde existe um mixer que possua uma certa configuração.

Alguns recursos que um programa pode obter da classe AudioSystem:

  • Mixers: um sistema geralmente possui vários mixers instalados. Existe pelo menos um para entrada de áudio e outro para saída de áudio. A classe AudioSystem provê uma lista de todos os mixers instalados.
  • Lines: como as linhas estão associadas a mixers, um programa pode recuperar uma linha diretamente da classe AudioSystem.
  • Conversões de formatos: um programa pode querer traduzir um formato de áudio em outro.
  • Arquivos e streams: a classe AudioSystem provê métodos para traduzir arquivos de áudio e streams de áudio.

Objetos de Informação

Algumas classes na API Java Sound provêem informações úteis sobre interfaces associadas. Por exemplo, Mixer.Info provê detalhes (nome do fabricante, descrição e versão) sobre um mixer instalado.


Um pouco na correria... Em breve vou postar mais informações de como utilizar a classe AudioSystem.

Até mais!

domingo, 17 de agosto de 2008

3 Conceitos Principais - Line

Um line é um caminho de movimentação do áudio para dentro e para fora de um sistema, geralmente um mixer (embora tecnicamente um mixer também seja um tipo de line).

As portas de entrada e saída de áudio são lines. Além de microfones e alto-falantes, também são tipos de lines caminhos de informações que um programa pode enviar ou receber áudio de um mixer.

A única diferença entre lines na API Java Sound e as lines de um mixer físico é que o fluxo de informações de áudio em uma linha na API Java Sound pode ser mono ou multicanal. No caso do mixer físico, cada entrada e saída é um único canal de som. Na API Java Sound o número de canais em uma linha é especificado pela classe AudioFormat da informação sendo transmitida nesta linha.

O tipo de linha chamado Clip funciona basicamente para a execução do áudio. O tipo SourceDataLine aceita streams de áudio em tempo-real. Ambos são lines de entrada.

O tipo TargetDataLine é uma linha (saída do mixer) que contém a mistura de streams de entrada.

A hierarquia de Interfaces de Line.



A interface base, Line, descreve funcionalidades mínimas comuns a todas as linhas:
  • Controles: DataLines e Ports geralmente possuem um conjunto de controles que afetam o sinal de áudio atravessando uma linha. A API Java Sound especifica classes de controle que podem ser usadas para manipular aspectos do som tais como ganho, pan, reverb e taxa de amostragem.
  • Status aberto ou fechado: a correta abertura de uma linha garante que os recursos sejam alocados à linha. Um mixer tem um número finito de linhas. O fechamento de uma linha indica que os recursos utilizados pela linha podem então ser liberados.
  • Eventos: uma linha gera eventos quando é aberta ou fechada. Entretanto, sub-interfaces de Line podem introduzir outros tipos de eventos. Quando uma linha gera um evento, o evento é enviado para todos os objetos que estão registrados para ouvirem por eventos naquela linha.
Ports são linhas simples para entrada e saída de áudio.

Um Mixer é definido tendo um ou mais source lines e uma ou mais target lines. A interface Mixer foi criada para satisfazer a uma variedade de dispositivos. A interface Mixer suporta sincronização, ou seja, você pode especificar que duas ou mais linhas de um mixer sejam tratadas como um grupo sincronizado. Então você pode iniciar, parar ou fechar todas as linhas de informações apenas enviando uma simples mensagem para qualquer linha no grupo, ao invés de ter que controlar cada uma individualmente.

A interface DataLine provê as seguintes características adicionais à Line:
  • Formato de audio: cada data line tem um formato de áudio associado com as informações do stream.
  • Media position: um data line pode dizer sua posição atual, expressa em sample frames. Isto representa o número de janelas de amostras capturadas de um data line desde que este foi aberto.
  • Tamanho do buffer: este é o tamanho do buffer interno do data line.
  • Level: a amplitude corrente do sinal de áudio.
  • Iniciar ou parar playback ou captura.
  • Pausar ou resumir playback ou captura.
  • Flush: descartar informações não processadas da fila.
  • Drain: bloqueio até que toda a informação não processada seja drenada da fila e o buffer do data line esteja vazio.
  • Status ativo: um data line é considerado ativo se está envolvido em uma captura ou apresentação ativa de informações de áudio de/para um mixer.
  • Eventos: eventos START e STOP são produzidos quando apresentações ou capturas ativas de informações de/para um data line são iniciadas ou paradas.
Um TargetDataLine recebe informações de áudio de um mixer. Esta interface provê métodos para ler informações do buffer de um TargetDataLine e para determinar quanta informação ainda está disponível para ser lida.

Um SourceDataLine recebe informações de áudio para playback. Provê métodos para escrever informações ao buffer do SourceDataLine para playback e para determinar quanta informação a linha está preparada para receber sem bloqueio.

Um Clip é um DataLine em que as informações de áudio podem ser carregadas principalmente para playback. Pelo fato das informações já estarem pré-carregadas, a duração do clip é conhecida antes do playback e é possível escolher qualquer ponto de início de execução. Clips podem ser repetidos, ou seja, é possível criar loops com Clip.


Com este post, finalizo a apresentação dos principais conceitos da API Java Sound. Até o próximo!

terça-feira, 12 de agosto de 2008

3 Conceitos Principais - Mixer

Muitas APIs que trabalham com som fazem uso da noção de dispositivo de áudio. Um dispositivo geralmente é uma interface de software para um dispositivo físico de entrada e saída.
Na API Java Sound, dispositivos são representados por objetos da classe Mixer. O propósito de um mixer é manipular um ou mais streams de entrada ou saída de áudio. Tipicamente, o mixer mescla múltiplos streams de entrada em um stream de saída.

Na API Java Sound, um componente tal como um microfone conectado a uma placa de som não é considerado um dispositivo (como o mixer), mas é chamado de porta (port) entrando ou saindo do mixer. Tipicamente, uma porta provê um único stream de áudio para dentro ou para fora do mixer. O Mixer pode ter vários tipos de portas. Por exemplo, um mixer que representa a capacidade de saída de uma placa de som pode misturar vários streams de áudio juntos e então enviar o sinal mixado para qualquer uma das várias portas de saída conectadas ao mixer. Estas portas de saída podem ser, por exemplo, um fone de ouvido ou um alto falante.

A imagem abaixo ajuda a compreender a noção de mixer na API Java Sound (inclusive, algumas imagens que estou colocando aqui foram tiradas do Java Sound Programmer Guide) e mostra o console de um mixer físico.Imagine um show ao vivo que está sendo gravado em modo estéreo. Cabos vindos de muitos microfones e instrumentos elétricos do palco são plugados nas entradas do aparelho de mixagem. Cada entrada possui um canal específico no mixer. O engenheiro de som decide sobre as configurações de ganho, pan, e controles de reverb. A saída de todos os canais e a unidade de reverb são mixadas juntamente em 2 canais. Estes canais vão para duas saídas no mixer por cabos que estão plugados a um gravador e que também podem ser enviados, via um amplificador, para alto-falantes.

Agora imagine um estúdio de gravação em que cada instrumento é gravado em uma trilha particular de uma fita de gravação multi-trilhas. Após instrumentos e vocais serem gravados, o engenheiro de som executa um "mixdown" para combinar todas as trilhas gravadas em uma gravação de 2 canais. Novamente o engenheiro pode decidir os valores de ganho, pan e reverb para cada trilha.

Estes 2 exemplos ilustram dois diferentes usos de um mixer:
  1. capturar múltiplos canais de entrada, combiná-los em algumas trilhas
  2. executar múltiplas trilhas enquanto as mixamos em poucas trilhas.

Na API Java Sound, um mixer pode ser usado tanto para captura de áudio quanto para playback. No primeiro caso, a origem do áudio para o mixer é fornecida por uma ou mais portas de entrada. O mixer envia o áudio capturado e mixado para um target (um objeto com um buffer onde o programa pode recuperar as informações do áudio mixado). No caso de playback, as origens de áudio do mixer são objetos contendo buffers e os targets são as portas de saída.

segunda-feira, 11 de agosto de 2008

3 Conceitos Principais - File Format

Um formato de arquivo especifica a estrutura de um som. Inclui não apenas as informações de áudio em sua forma crua, mas também outras informações. Na API Java Sound, um formato de arquivo é representado por um objeto AudioFileFormat, que contém:
  • o tipo do arquivo (WAVE, AIFF, etc.)
  • o tamaho do arquivo em bytes
  • o número de frames da informação de áudio contida no arquivo
  • um objeto AudioFormat que especifica as informações do formato do áudio contido no arquivo.
A classe AudioSystem provê métodos para leitura e escrita de sons em diferentes formatos de arquivos e formatos de informações. Ler um arquivo de som como AudioInputStream, tem-se acesso imediato às amostras sem ter que se preocupar com a estrutura do arquivo.

3 Conceitos Principais - Data Format

Para trabalhar com a API Java Sound, é necessário conhecer 3 conceitos principais: Format, Mixer e Line.

Informações de áudio formatadas referem-se ao som em qualquer um dos formatos padrões. A API Java Sound diferencia formatos de informações (data formats) e formatos de arquivos (file formats).

Formatos de Informação (Data Formats)
Um formato de informação nos diz como interpretar uma seqüência de bytes de informações de áudio amostrados, a forma crua (raw) do som, ou seja, da maneira como as amostras foram lidas de um arquivo de som ou como as amostras foram capturadas por um microfone. É de extrema importância conhecer quantos bits compõem uma amostra (a representação do menor instante do som) e a taxa de amostragem (qual a freqüência com que tais amostras foram tomadas).

Na API Java Sound, um formato de informação é representado por uma instância da classe AudioFormat, que inclui os atributos seguintes:
  • Técnica de codificação (geralmente pulse code modulation - PCM)
  • Número de canais (1 para mono, 2 para estéreo, etc.)
  • Taxa de amostragem (número de amostras por segundo, por canal)
  • Número de bits por amostras (por canal)
  • Frame rate
  • Tamanho do frame em bytes
  • Ordem dos bytes (big-endian ou little-endian)
PCM é um tipo de codificação da forma de onda do som. A API Java Sound inclui 2 codificações PCM que usam a quantização linear de amplitudo e valores inteiros com sinal e sem sinal.
QUANTIZAÇÃO LINEAR significa que o número armazenado em cada amostra é diretamente proporcional (exceto por alguma distorção) à pressão original do som naquele instante - e proporcional ao deslocamento de um alto-falante com a vibração do som naquele instante.
Outras formas de codificação do som são Mu-law e a-law. São codificações não-lineares que provêem uma forma mais comprimida das informações de áudio (são tipicamente utilizadas na telefonia e gravações de voz). Por ser uma codificação não-linear, tais codificações podem dar maior resolução de amlitude em uma certa faixa de freqüência.

Um frame contém a informação de todos os canais em um instante particular. Para informações codificadas em PCM, um frame é o conjunto de amostras simultâneas em todos os canais para um dado instante no tempo, sem qualquer informação adicional. Neste caso, a frame rate (taxa de janela) é igual a taxa de amostragem, e o tamanho do frame em bytes é o número de canais multiplicados pelo tamanho da amostra em bits, dividido pelo número de bits em um byte.

Para outros tipos de codificação, um frame pode conter informações adicionais entre as amostras. Assim, a frame rate pode ser completamente diferente da taxa de amostragem. No MP3, cada frame contém um conjunto de informações comprimidas para uma série de amostras, não apenas uma amostra por canal. Pelo fato de cada frame encapsular um conjunto de amostras, a frame rate é menor que a taxa de amostragem. No MP3, cada frame contém um cabeçalho. Apesar do cabeçalho, o tamanho do frame em bytes é menor que o tamanho em bytes do número equivalente de frames PCM. (por isso o MP3 é mais compacto que o PCM)

domingo, 10 de agosto de 2008

javax.sound.sampled

O foco do pacote javax.sound.sampled é o de playback e captura de informações de áudio. Para isso é necessário conhecer 3 conceitos fundamentais: formato de informação de áudio, line e mixer.

A tarefa principal da API Java Sound é saber como mover bytes de áudio formatados para dentro e para fora do sistema. Esta tarefa envolve a abertura dos dispositivos de entrada e saída e o gerenciamento de buffers que são preenchidos com as informações de áudio em tempo real. Também envolve a mistura de múltiplos streams de áudio em apenas um stream. O transporte de som para dentro e fora do sistema tem que ser corretamente manipulado pois é preciso contemplar as necessidades do usuário quando este solicita que o fluxo de som seja iniciado, parado, resumido ou interrompido.

Manipulação de áudio com e sem buffer
A API Java Sound manipula o transporte de áudio nas formas de streaming, com buffer e sem buffer. O termo "streaming" é usado de forma genérica para referenciar a manipulação de bytes de áudio em tempo-real. Não se refere ao envio de áudio pela Internet. Em outras palavras, um stream de áudio é um conjunto simples de bytes de áudio que chegam mais ou menos na mesma taxa de amostragem que serão manipulados.
As operações nos bytes começam antes de toda a informação chegar. No modelo de streaming, particularmente no caso de entrada, não é necessário conhecer antecipadamente o tamanho do som e quando ele irá terminar. Devemos manipular um buffer de informações por vez até que a operação seja suspendida. No caso de saída, devemos entregar os bytes de áudio para a engine de som e ela cuida de tocar cada amostra no momento correto.

sábado, 9 de agosto de 2008

Service Provider Interfaces

As "interfaces provedoras de serviço", SPIs, permitem que desenvolvedores criem novos recursos de áudio ou MIDI separadamente, de forma que estes possam ser plugados a uma implementação existente da API Java Sound. É possível implementar, por exemplo:
  • um novo mixer
  • um novo sintetizador MIDI
  • um novo parser de arquivo que possa ler ou escrever um novo tipo de arquivo de áudio ou MIDI
  • um novo conversor entre diferentes formatos de som.
Uma implementação da API Java Sound contém um conjunto básico de serviços. As SPIs permitem que terceiros criem novos serviços. As classes AudioSystem e MidiSystem atuam como coordenadores, permitindo que os programas acessem os serviços explicitamente ou implicitamente.

Bem, finalizo aqui uma parte da introdução sobre a API Java Sound. O próximo passo é explicar de forma mais aprofundada as características do Java Sound e como esta API lida com as informações de áudio. Até lá!

Links sobre Computação Musical

Quebrando a seqüência de posts introdutórios sobre a API Java Sound, hoje coloco alguns links interessantes sobre computação musical.


Obrigado ao pessoal da lista CompMus-l pelas dicas!

MIDI

MIDI, ou Musical Instrument Digital Interface, descreve uma série de eventos que afetam o som que um sintetizador produz. Os eventos podem ser interpretados como ações sobre um teclado musical ou ações em pedais, sliders, dentre outros dispositivos.

Embora grande parte das vezes estes eventos sejam acionados por um instrumento musical (o hardware), é possível também criar tais eventos via software. Além disso, este conjunto de eventos podem ser armazenados em arquivo, permitindo a posterior edição e execução do mesmo.

Um programa que possui a capacidade de criar, editar e executar estes arquivos é chamado de sequencer.

Um arquivo MIDI padrão contém trilhas (tracks), cada uma delas com uma lista de eventos MIDI. O sequencer pode enviar as mensagens MIDI para algum outro dispositivo como um sintetizador, por exemplo. O sintetizador lê um arquivo de banco de sons (soundbank) contendo instruções para emular os sons de certos instrumentos musicais e executa tais instrumentos de acordo com o evento MIDI recebido do sequencer.

A imagem abaixo exemplifica como é esse esquema:
Neste exemplo, um arquivo MIDI contendo várias trilhas com eventos MIDI é carregado. A maioria dos eventos são representados por notas musicais. O arquivo MIDI é lido e é então executado por um sequencer. O sequencer envia as mensagens MIDI para outro dispositivo tal como um sintetizador interno ou externo. O sintetizador, pode ler um banco de sons contendo as informações necessárias para emular os sons de um instrumento musical. Caso contrário as notas serão executadas usando-se qualquer som que esteja carregado no sintetizador.

Como visto, as mensagens MIDI podem ser enviadas para um sintetizador externo por meio das portas de saída. Da mesma forma, um dispositivo externo (um teclado musical) pode enviar mensagens MIDI (via portas de entrada) diretamente para um sintetizador ou para que um sequencer armazene para futura execução.

Por hoje é só. Em breve mais detalhes. Estamos apenas na introdução do basicão.

quinta-feira, 7 de agosto de 2008

Áudio Amostrado (Sampled)

Nesse post, tento explicar como é a idéia de um sinal de áudio amostrado e como a API Java Sound aborda este conceito.

Imagine uma pessoa falando ao microfone. O microfone converte o sinal acústico da voz da pessoa em um sinal elétrico analógico correspondente (este processo se dá pela captura da variação da pressão do ar que é causada pela fala da pessoa). Um conversor AD (analógico-digital) transforma então este sinal analógico para uma forma digital amostrada conforme o gráfico a seguir:

O gráfico desenha a pressão do som (amplitude) no eixo vertical e o tempo no eixo horizontal. A amplitude de uma onda sonora é medida periodicamente a uma certa taxa, resultando em amostras discretas (os pontos vermelhos do gráfico) que compreendem o sinal de áudio digital. A precisão da aproximação do sinal analógico depende de sua resolução no tempo (taxa de amostragem) e sua quantização (ou resolução em amplitude - o número de bits usados para representar cada amostra).

A API Java Sound não possui uma configuração de hardware específica. É projetada para permitir que diferentes tipos de componentes de áudio sejam instalados em um sistemas e acessados pela API.
A figura anterior mostra o exemplo de uma placa de som contendo várias portas de entradas e saídas. O mixer geralmente recebe informções de áudio de alguma fonte: arquivo, streaming de rede, sintetizador MIDI, dentre outros. O mixer combina todas as entradas de áudio em um único stream, podendo ser enviado para um dispositivo de saída.

Voilà! Lembro que isto é apenas uma introdução.

Introdução a Java Sound



Este é o primeiro de uma série de posts que serão feitos sobre a API Java Sound.

Java Sound é uma API de baixo nível utilizada para controlar a entrada e saída de som de um computador.  Tais sons podem ser tanto sinais de áudio amostrados quanto eventos MIDI (Musical Instrument Digital Interface).

Esta API possui basicamente as seguintes utilizações:
  • Frameworks de comunicação (conferência e telefonia)
  • Media players
  • Programas interativos, jogos, web com conteúdo dinâmico
  • Criação e edição de conteúdo (composição musical, por exemplo)
  • Ferramentas, toolkits e outras utilidades
Java Sound não inclui editores ou ferramentas gráficas para a sua utilização, mas provê o ferramental necessário para a construção destes programas. Como já foi dito anteriormente, esta API tem por objetivo realizar o controle de baixo nível das operações de áudio de uma máquina.

Existem outras APIs que também contém elementos relacionados ao som. A JMF - Java Media Framework - é uma API que, ao contrário da API Java Sound, é de alto nível. É uma extensão padrão da plataforma Java composta por uma arquitetura unificada, protocolo de mensagens e interface de programação para a captura e execução de mídia com base no tempo (time-based). A JMF permite a sincronização de tipos de mídias diferentes, tais como áudio e vídeo.

Os pacotes principais da API Java Sound são:
  • javax.sound.sampled: este pacote especifica interfaces para captura, mixagem e playback de áudio digital amostrado
  • javax.sound.midi: provê interfaces para síntese MIDI, sequencer e transporte de eventos
  • javax.sound.sampled.spi e javax.sound.midi.spi: permite que provedores de serviços (services providers) criem componentes de software customizados que extendem as capacidades de uma implementação da API Java Sound.

A priori, é isso. Até mais!

Iniciando os trabalhos


Sejam muito bem vindos neste novo ponto de encontro e concentração de informações relacionadas à computação, música e a misturas das duas coisas. Espero que as informações neste blog possam ajudar as pessoas que, assim como eu, se interessam pelos temas mencionados.

Este blog surgiu da necessidade de compartilhar um pouco do que venho estudando nas últimas semanas. Não pretendo atualizá-lo todos os dias, mas o farei sempre que possível.

Espero que gostem!
Que Deus abençoe este blog!