Direito de imagem Getty Images Image caption Aparelhos como Amazon Echo, Google Home e Sonos One podem definir o futuro da indústria da música

Alto-falantes inteligentes, aqueles dispositivos ativados por voz que permitem checar a previsão do tempo, ouvir podcasts ou pedir comida, estão cada vez mais comuns em alguns países. Em menos de cinco anos, marcas por trás de aparelhos como Amazon Echo, Google Home e Sonos One ganharam mercado enquanto que assistentes de voz como Alexa e Siri se tornaram parte do dia a dia das famílias.

Estes dispositivos nos permitem interagir com a música de formas surpreendentes e estão melhores a cada mês. Sugerir uma playlist ou encontrar uma música específica é uma tarefa cada vez mais fácil para essas tecnologias, que hoje conseguem selecionar com eficiência pedidos como "toque músicas alegres" ou "toque as mais recentes de Ed Sheeran".

Usar a voz para filtrar e acessar músicas é uma ideia relativamente nova e, por isso, traz um imenso desafio tecnológico para empresas de streaming, gravadoras e startups de aprendizado de máquina. O uso adequado dessa nova interface e dos metadados subjacentes pode ser a diferença entre afundar ou flutuar no mercado. Chegou a hora de planejar o futuro do consumo de música.

Direito de imagem Nielsen Research Image caption Tocar música é o pedido mais popular de alto-falantes inteligentes

Estima-se que o mercado de alto-falantes inteligentes atinja a marca de US$ 7 bilhões (R$ 27,5 bilhões) em 2019, tornando-se a categoria de dispositivos conectados que cresce mais rapidamente no mundo, segundo a consultoria Deloitte Global. Em 2017, apenas 7% dos americanos tinham o aparelho, índice que, segundo a consultoria Nielsen, subiu para 24%. Em 2022, a Juniper Research projeta que 55% dos domicílios dos EUA tenham um alto-falante inteligente, o que representa cerca de 175 milhões de aparelhos em 70 milhões de casas.

Apesar de oferecer recursos complexos como controlar o termostato, pedir táxi ou entregar pizza, a pesquisa da Deloitte mostrou que, na maioria dos mercados, seu principal uso é tocar música, seguido de pesquisar a previsão do tempo. Há indicativos de que a Amazon capitalize esse comportamento lançando nos Estados Unidos um serviço de streaming de música gratuito e patrocinado por anúncios, que seriam divulgados pelo alto-falante Echo.

Como esses dispositivos inteligentes fizeram sucesso rápido e saltaram direto para o mainstream, isso traz um desafio para a indústria musical. E trata-se de um desafio que mergulha nas águas escuras e profundas dos algoritmos. Para gravadoras e artistas, fazer sucesso nas caixas de som inteligentes significará otimizar os metadados de suas músicas.

Conversa feliz

Antes de surgirem Alexa, Siri e outros softwares ativados por voz, gravadoras e serviços de streaming trabalhavam com algoritmos muito mais simples. Nomes de artistas, títulos de faixas, etiquetas de gênero, batidas por minuto e datas de lançamento estão entre esses metadados mais básicos. "Essas etiquetas vêm sendo usadas para facilitar a busca", diz Lydia Gregory, co-fundadora da FeedForward, empresa independente de aprendizado de máquina. "Normalmente, elas são colocadas em uma taxonomia, uma hierarquia ou uma estrutura."

Agora, em um mundo ativado por streaming e por voz, as descrições precisam levar em consideração a maneira como a música é solicitada e as plataformas nas quais são distribuídas. Quanto mais precisa e específica a identificação, maior a probabilidade de a música ser distribuída nas listas de reprodução apropriadas e chegar aos ouvintes certos. "Há 30 mil músicas lançadas na internet diariamente", diz Hazel Savage, cofundador da startup Musiio, de inteligência artificial. "É humanamente impossível ouvir tudo." Os metadados nos poupam de gastar horas antes de encontrar uma música de que gostamos.

Direito de imagem Getty Images Image caption Termos de pesquisa ativada por voz geralmente levam em conta o humor da pessoa

Para as gravadoras, desvendar seu funcionamento é essencial, pois os metadados adequadamente otimizados podem ganhar ou perder um lugar em buscas e listas de reproduções.

Duas das áreas mais importantes a se explorar são as playlists e os gêneros pré-construídos em serviços de streaming como o Spotify. "Happy" é um gênero reconhecido pelo Spotify, com várias playlists sob o seu guarda-chuva. Quando um usuário diz "toque uma música feliz no Spotify", o dispositivo provavelmente pesquisa a lista mais popular do gênero "feliz": "Happy Hits!". Se as gravadoras conseguirem otimizar suas etiquetas para alinhá-las com as das músicas que estão na playlist - ou, melhor, para entrar na playlist - há mais chances de suas produções serem escolhidas pelo algoritmo em futuras buscas de happy music (ou "música feliz").

Ainda assim, nem as etiquetas talvez sejam suficientes para destacar determinadas músicas. Usuários de alto-falantes inteligentes também buscam músicas cantando um trecho de letra, segundo Paul Firth, diretor da Amazon Music UK. À medida que a Amazon vai melhorando a capacidade da Alexa de entender pedidos de música, as empresas devem começar a considerar a letra como outra parte dos metadados. Do contrário, podem perder solicitações de música cuja letra está na ponta da língua mas que não aparece no título ou no refrão, como por exemplo "Toque a música que diz 'Tell me what you want, what you really, really want'".

Escravo do algoritmo

Sem praticamente nenhuma orientação das grandes empresas de tecnologia sobre como fazer isso, as gravadoras dizem que estão navegando com uma bússola quebrada. "Não recebemos nenhuma informação", critica Kara Mukerjee, ex-diretora do setor digital da RCA Records. "Tem sido uma corrida armamentista".

Encontrar maneiras de se antecipar é parte do jogo para aquelas com recursos para investir em novas ideias.

"Todo mundo está contratando pessoas para entender esses dispositivos e seus problemas. A Sony Music contratou uma equipe para fazer a engenharia reversa dos algoritmos em torno da Alexa", conta Stuart Dredge, autor de um relatório de 2017 para a Music Ally sobre alto-falantes inteligentes. "Todo mundo está se debruçando no assunto e todo mundo está tentando descobrir como isso funciona".

Algumas gravadoras e serviços de streaming optaram por terceirizar o processo para empresas independentes de aprendizado de máquina. Usando algoritmos altamente sofisticados, empresas como a Musiio e a FeedForward podem tirar um pouco da adivinhação na caça por metadados relevantes. Seus sistemas identificam automaticamente as etiquetas importantes, dando a gravadoras a chance de aplicar os dados mais úteis ao seu material.

Mas combinar essas redes de dados com voz, onde as solicitações podem ser mais vagas e conversacionais do que uma busca por escrito, é onde o verdadeiro desafio começa. Frases simples como "Alexa, toque música" - um pedido incrivelmente comum, de acordo com Firth, da Amazon Music do Reino Unido - deixam algoritmos com grande liberdade interpretativa. Títulos de músicas difíceis de pronunciar, nomes semelhantes ou de artistas correm o risco de não serem encontrados, e por isso os selos precisam pensar em quão diferente, pronunciáveis e memoráveis são os nomes de seus artistas e faixas.

Direito de imagem Getty Images Image caption Metadados precisam incluir solicitações como "Toque a música que diz 'Tell me what you want, what you really, really want'"

Dos três grandes produtores de alto-falantes inteligentes, o Google parece ser o líder no ramo, diz Gregory, da FeedForward. E vale a pena ser o garoto mais inteligente da vizinhança. Aproveitar o potencial dos metadados significa ter conteúdo curado com mais precisão para empresas de alto-falantes inteligentes e, em última análise, melhor experiência para o cliente.

Para gravadoras e executivos de Artistas e Repertório (A&R), isso também significa descobrir novos talentos antes dos concorrentes. Embora ainda não seja uma realidade para a maioria, o raciocínio é o seguinte: as gravadoras que entendem como navegar por pedidos populares e etiquetas de metadados podem começar a medir o sucesso de combinações específicas. Se músicas "relaxantes" com "violões" e letras sobre "a praia" parecem ter um bom desempenho, elas podem, em teoria, procurar artistas promissores cujo material combina com essas etiquetas.

Duas tribos

Algoritmos avançados, embora certamente uma fonte de poder, não resolvem a tensão entre companhias de alto-falantes e gravadoras. Em um mundo em que grandes empresas de tecnologia têm a chave do mercado musical, quando a indústria da música conseguirá um lugar à mesa? O artista ou a Alexa deveriam ser os únicos a decidir em quais categorias criativas uma música deve ser colocada?

"Ambos os lados argumentam que podem fazer isso muito bem", afirma Dredge. "Em um mundo ideal, eles se uniriam para criar metadados brilhantes para as músicas."

Críticos dos alto-falantes inteligentes focam a situação dos ouvintes. Embora animados com a perspectiva de um novo público de streaming, eles acreditam que o cenário pode ampliar ainda mais a distância entre músicos mais e menos populares. Uma lista dos álbuns mais solicitados à Alexa no ano passado mostrou que as pessoas tendem a pedir o que já conhecem, em vez de artistas novos. O usuário do dispositivo, diz Firth, tende a ser mais mainstream no gosto musical. Em vez de se aprofundar para descobrir novos produtos, as pessoas tendem a selecionar músicas já muito populares, explica.

Se as pessoas buscam artistas do Top 40 e singles feitos para a rádio, os nomes independentes são excluídos da equação. Isso preocupa as gravadoras menores, segundo Mukerjee, já que a maioria não tem recursos ou largura de banda para investir em pesquisas de metadados. Elas conseguem se concentrar, no máximo, no lançamento de seus artistas.

Direito de imagem Getty Images Image caption O álbum '÷', de Ed Sheeran, foi o mais pedido nos alto-falantes ativados por voz da Amazon no ano passado

Sem muita comunicação com as gravadoras, a Amazon e outras empresas de tecnologia é que vão ditar como o relacionamento se desenvolve. Firth acredita que o papel da Alexa na indústria da música não seja de muito controle ou influência, pois manter a integridade da música é onde se encontra um ponto em comum entre todos.

"Devemos garantir que uma boa música encontre sua base de fãs e que os fãs encontrem a música que amam", comenta Firth. "Esse é o nosso papel. Deveríamos fazer isso da maneira mais fácil possível.

No entanto, gravadoras e artistas preocupados com o futuro precisam acompanhar as novas interfaces, por exemplo dos alto-falantes inteligentes, se quiserem sair na frente. Não é muito difícil prever que a situação caminha para se pensar nas faixas já com um olho nos metadados. Se os dados se tornarem parte da composição do artista - digamos, criar músicas "felizes" com "guitarras acústicas" sobre "a praia" em resposta a uma tendência de metadados -, adequar-se a isso pode garantir-lhe um salto de popularidade.

Mas é aí que Firth coloca limites. "Não acho que uma tecnologia poderosa deva atrapalhar o processo criativo", pondera. "Não importa o quão inteligente é a tecnologia de voz ou o quão precisos são os aplicativos ou o quão eficiente é o marketing. Precisamos de música."

Leia a versão original desta reportagem (em inglês) no site BBC Culture.

Já assistiu aos nossos novos vídeos no YouTube? Inscreva-se no nosso canal!