Usando técnicas de "Amazon Echo" reverso em um apito de trem

apito de trem

A análise e controle direcional do campo sonoro é uma área ótima para explorarmos. Um exemplo conhecido é o dispositivo de automação residencial de alto-falante inteligente, como Amazon Echo, Google Home ou Apple HomePod, que pode usar as fases das ondas sonoras que chegam para determinar a direção da qual o áudio de interesse para o dispositivo está chegando. Isso permite que o dispositivo se concentre em uma única fonte de voz e ignore as vozes de baixo nível ou o ruído de fundo de outras direções - melhorando muito a precisão do reconhecimento de fala.

 

Dispositivos como o Amazon Echo determinam a direção do som recebido e o isolam dos sons de fundo usando uma variedade de microfones. As descrições de detalhamento do funcionamento interno do Amazon Echo estão disponíveis na Internet e mostram uma série de sete microfones próximos à parte superior do dispositivo. Eles estão dispostos com um speaker no centro e seis speakers espaçados de forma equidistante em torno de um círculo de aproximadamente 75 mm. Cada microfone dirige seu próprio canal conversor AD analógico / digital. O software de processamento de sinais correlaciona as amplitudes, fases e tempos de chegada dos sinais sonoros e pode determinar o rumo do sinal de voz predominante. O software também pode usar algoritmos para aumentar o sinal de voz da direção predominante com interferência construtiva, enquanto suprime os sinais de ruído de fundo das outras direções com interferência destrutiva. Essas técnicas permitem que o dispositivo reduza muitos tipos de ruídos de fundo e forneça um sinal de voz muito mais limpo aos algoritmos de reconhecimento de voz, resultando em maior sensibilidade e precisão no reconhecimento de fala.

 

Projetando um apito de trem para som direcional

 

E se pudéssemos reverter esse processo? Poderíamos construir uma série de alto-falantes e aplicar o inverso das técnicas descritas acima para captar um sinal de áudio de entrada, calcular formas de onda e direcionar o som preferencialmente para fora em uma direção, enquanto suprimia sua aparente amplitude em outras direções. Um excelente caso de uso em potencial para essa técnica é um apito de trem. Devido às normas de segurança do transporte, quando um trem se aproxima de uma encruzilhada, ou passagem de mesmo nível - onde a ferrovia atravessa uma rodovia no mesmo nível - os trens são obrigados a acionar um padrão específico de toque de buzina (longo, longo, curto, longo). O problema é que as buzinas dos trens modernos não são muito direcionais, muito altas (algumas produzem 145dB a 1m) e, para emitir som suficiente no cruzamento da rodovia que se aproxima, para manter o tráfego seguro, os edifícios próximos aos trilhos também recebem sons muito altos. Isso já resultou em inúmeras brigas entre ferrovias, que querem usar seus trilhos com segurança 24 horas por dia, 7 dias por semana, e residentes / municípios locais, que querem que seus bairros sejam pacíficos - especialmente à noite. Os compromissos geralmente limitam a operação dos trens durante a noite. Isso pode reduzir o lucro das ferrovias.

 

Então, aqui está a idéia: coloque um conjunto de alto-falantes XY ou XYZ fora da locomotiva - talvez no teto da cabine - e use técnicas de processamento de sinal digital para moldar o campo sonoro de saída, de modo que a amplitude máxima dos sinais de alerta atinja o rodovia, enquanto a amplitude nos prédios próximos aos trilhos é bastante reduzida. A cadeia de sinal começa com uma fonte de áudio. Pode ser um tom simples, multi-tons - um apito de trem tem de duas a cinco notas na faixa de 250-500Hz - ou qualquer arquivo de som digital. Um controlador mestre sabe onde fica a locomotiva, onde estão as passagens de nível e a distância/direção para as áreas onde os avisos devem ser altos e outras regiões próximas onde o som deve ser suprimido. Os algoritmos de processamento de sinal dividem a fonte de som digital em vários canais e calculam formas de onda para a amplitude, fase e atraso de cada canal, para que os campos sonoros resultantes se combinem construtivamente em áreas que precisam ser altas (como a via que se aproxima) e combinem destrutivamente em áreas tranquilas. Esses sinais passam por um banco de conversores digital-analógico (DAC) e amplificadores de áudio (ou diretamente para amplificadores classe D), e saem para uma série de alto-falantes de alta potência fora da locomotiva. Como o Amazon Echo, cerca de sete canais podem ser adequados para fornecer controle direcional, mas uma dúzia ou mais de canais podem fornecer um controle muito mais preciso sobre a direção e a distância das regiões de interferência construtiva.

 

O comprimento de onda de 250Hz a 20 graus Celsius é 1,376m. Alguns dos alto-falantes de nossa matriz devem ter essa ordem de espaçamento para fornecer direcionalidade básica para os sons de menor frequência. O quarto de comprimento de onda de um som de 500Hz é 17,2 cm, portanto, outros alto-falantes da matriz devem estar espaçados a essa distância para dar ao algoritmo de processamento de sinal mais pontos de controle, o que fornecerá um controle mais preciso da direcionalidade dos sons de frequência mais alta. Felizmente, é possível encontrar alto-falantes apropriados que atendam a essa pegada, e a locomotiva é fisicamente grande o suficiente para transportar a matriz necessária.

 

Indo um passo adiante

 

Podemos ir além de simplesmente transmitir sons altamente direcionais em direção ao cruzamento. A matriz pode criar "ilhas" de som de alto volume em ângulos e faixas específicos da fonte. Se o GPS da locomotiva souber sua posição e o controlador souber a localização da rodovia, o sistema poderá criar um campo sonoro em forma de "T", com muito volume na estrada e pouco em outros lugares. Os processadores de sinais ajustam continuamente os sinais do canal para alterar a distância conforme a locomotiva se aproxima do cruzamento. Se for um trem de passageiros, o processador de sinal pode alterar o arquivo de áudio e ajustar o campo sonoro para cobrir uma plataforma atrás e ao lado da locomotiva, para emitir um alerta de "todos a bordo" enquanto o trem se prepara para partir ou para avisar as equipes de manutenção na via está prestes a se mover. E, é claro, ainda haverá um botão de buzina manual, provavelmente gerando um padrão de radiação mais omnidirecional. Técnicas semelhantes podem ser aplicadas a veículos rodoviários e marítimos, aumentando muito a sofisticação de seus avisos sonoros.

 

Para saber mais

 

Se você quiser saber mais, a patente US 7.095.861 fornece detalhes adicionais sobre a formação de campos sonoros. A formação de campos sonoros dessa maneira pode oferecer muitas possibilidades para o uso criativo de aplicações de sinalização sonora e de som específicas do ouvinte / local.

 

Pontos chave:

  • Os projetistas podem reverter as técnicas direcionais de microfone para direcionar as matrizes dos alto-falantes e modelar os campos sonoros.
  • As fontes de áudio são processadas pelos algoritmos DSP para calcular os sinais a serem direcionados ao conjunto de alto-falantes.
  • Um apito de trem é o exemplo perfeito de aplicação, oferecendo alto volume de som em uma rodovia que se aproxima, mas com apito de trem em baixo volume em direção a prédios vizinhos.

 

 

Artigo escrito originalmente por Charles Byers para Mouser Electronics: Using “Reversed Amazon Echo” Techniques on a Train Whistle. Traduzido por Equipe Embarcados.

 

Para artigos como esse, acesse o link.

Licença Creative Commons Esta obra está licenciada com uma Licença Creative Commons Atribuição-CompartilhaIgual 4.0 Internacional.

Receba os melhores conteúdos sobre sistemas eletrônicos embarcados, dicas, tutoriais e promoções.

Hardware » Usando técnicas de "Amazon Echo" reverso em um apito de trem
Talvez você goste:
Comentários:

Deixe um comentário

avatar
 
  Notificações  
Notificar

Séries

Menu

WEBINAR
 
Linux Embarcado: Desvendando o Pin Control Subsystem - Kernel Linux

Data: 26/02 às 19:30 h | Apoio: Mouser Electronics
 
INSCREVA-SE AGORA »



 
close-link