Uncanny Valley: Traçar uma nova era de criatividade musical
Catherine Jewell, Divisão de Informações e Divulgação Digital, OMPI
Em 2010, o cantor e compositor australiano Charlton Hill e o tecnólogo musical Justin Shave uniram-se para criar a Uncanny Valley, uma empresa de tecnologia progressiva com sede em Sydney, na vanguarda da indústria musical. Charlton Hill, que também é responsável pela inovação na Uncanny Valley, fala sobre as ambições da empresa de acelerar, democratizar e reformatar a produção de música através do uso de inteligência artificial (IA). Em 2020, a Uncanny Valley e a colega Caroline Pegram formaram a Team Australia e ganharam o primeiro Festival Eurovisão da Canção IA.
A Uncanny Valley está relacionada, de uma maneira geral, com uma sensação desagradável que os seres humanos têm sobre coisas que não são completamente humanas. Como você veio a denominar sua empresa Uncanny Valley?
Foi sugestão do meu cofundador Justin Shave. Depois de desdobrar seu significado, aceitei o fato de que estávamos destinados a ser uma empresa de tecnologia musical progressiva, num setor que conhecemos bem.
Justin é pianista de formação clássica e musicólogo com passagem pela ciência da computação e eu sou compositor e cantor. Ambos temos um forte interesse em inovação. Em 2010, quando criamos a empresa, havia areia movediça na indústria da música. Por isso, fazia sentido trabalhar com um parceiro de futuro. Sempre tivemos uma abordagem aberta em relação aos colaboradores, não nos limitando aos músicos e produtores tradicionais. Acho que nos identificamos com o nome da empresa. Poderíamos dizer que crescemos junto com o nome da empresa, que estamos tentando superar o “uncanny valley” da música, o vale misterioso do futuro insondável, que é provavelmente um dos mais interessantes desafios do nosso tempo.
Fale-nos sobre seu modelo de negócios.
Temos dois fluxos de receitas. O primeiro cobre comissões para criar música original ou remixar música (neste caso, partimos de uma música conhecida, licenciada e a recriamos com um novo vocalista) e o segundo refere-se aos royalties que recebemos quando esses programas são transmitidos. Na Austrália, trabalhamos em uma variedade de projetos, entre os quais o Australian Survivor, que precisa de muita música para ser desenvolvido. Essas receitas impulsionam as operações diárias da empresa e financiam nossas atividades mais progressivas de IA e aprendizado mecânico.
Explique-nos em que consiste o seu trabalho com criatividade aumentada.
É extremamente empolgante. Começou formalmente em 2019, quando colaborávamos com o Laboratório Criativo do Google e com artistas australianos emergentes sobre um experimento em que usávamos o aprendizado mecânico com vista à construção de algumas ferramentas progressivas que eles poderiam utilizar em seu processo de composição. O feedback desses artistas durante a fase de projeto foi inestimável.
De uma maneira geral, eles apreciaram a experiência, mas resmungavam quando as ferramentas lhes pisavam nos dedos. Por exemplo, nosso aplicativo AD LIBBER, que foi projetado para estimular ideias líricas, foi bem recebido por um artista que tinha dificuldade com as letras das canções, mas não agradou a um outro que não tinha nenhum problema para compor letras. Um outro aplicativo chamado Demo Memo permitia aos artistas cantarolar ou assobiar uma melodia e depois transformá-la em um instrumento de sua escolha, acelerando assim significativamente o processo de demonstração. Todos apreciaram isso.
Esse experimento foi uma grande oportunidade de lidar com esses conceitos. Continuamos a desenvolvê-los através do nosso motor de música, o MEMU, que é uma acumulação contínua da nossa busca. Com a arquitetura do MEMU, acreditamos que podemos resolver o problema da quantificação da música e da emoção.
O MEMU oferece aos músicos a oportunidade de expressarem suas músicas em diferentes modos de emoção e mídia.
Pode explicar isso mais detalhadamente?
Nosso interesse reside em compreender e quantificar a resposta emocional que a música gera e os processos associados à composição de melodias e canções. Não se trata de resolver a fórmula para uma canção de sucesso: é mais profundo do que isto. Estamos explorando a justaposição de letras, melodias e sequências de acordes e o que inspiram, para compreender melhor a impressão digital musical de uma música. É a ideia de se sentir feliz ou triste e de explicar isto a um computador. É bastante complexo. É surpreendente que tenhamos à nossa disposição hoje em dia a potência de cálculo e a inteligência necessários para analisar as letras e as melodias do conjunto da obra de um artista e que possamos gerar novas ideias que poderiam se transformar em novas canções ou representar a evolução da obra dessa pessoa.
E o que pode dizer mais sobre o MEMU?
O MEMU é um possante motor para mixagem e reconfiguração em tempo real da obra dos artistas. É realmente emocionante. Ele anuncia uma nova era na produção musical. Vemos isto como um ecossistema em evolução de contribuidores e colaboradores que permitirá que os artistas sejam descobertos e seguidos e que sejam pagos por qualquer divulgação de suas obras. A capacidade do MEMU de compreender e mixar um fluxo infinito de música em tempo real é realmente fantástico.
Como as pessoas estão reagindo ao MEMU?
Algumas pessoas acham incrível, mas estão preocupadas com o fato de que vamos tirar o trabalho dos músicos. Não é esta a nossa intenção. Vemos o MEMU como uma possante máquina que democratizará a produção, acelerando o processo e tornando-o mais acessível. Assim como o Spotify tem por objetivo oferecer a melhor playlist de todos os tempos, o MEMU quer oferecer a melhor paisagem musical de todos os tempos.
Como vocês desenvolveram o software?
Foi um processo interessante que envolveu cientistas de dados e tecnólogos criativos que trabalham com músicos, produtores de música e uma equipe mais ampla de acadêmicos.
No início, treinamos o MEMU com nosso próprio material proprietário. Em seguida, começamos a usar prudentemente material protegido por direitos de autor, mas, para evitar o risco de violação involuntária de direitos de autor, começamos a explorar obras de uma comunidade ampliada de usuários, entre as quais gravadoras. Isto nos permitiu aprofundar a noção de direitos de autor e de remixagem. Descobrimos uma escala móvel de reações em função da notoriedade do artista.
Quando os artistas entram no universo do MEMU, aceitam permitir-lhe que faça coisas maravilhosas e extraordinárias com sua arte. O MEMU rastreia as micro contribuições de cada artista e a maneira como são utilizadas. É uma maneira eficaz de garantir a remuneração dos artistas.
Quando necessário, utilizamos material de código aberto para treinar o MEMU, mas, de uma forma geral, desenvolvemos nossa própria solução proprietária, com vista a criar a arquitetura sob medida do MEMU, simplesmente porque as soluções de que precisávamos não existiam no mercado.
Você pode explicar os diferentes canais do MEMU?
O MEMU é maleável e dispõe agora de uma variedade de canais que nos permitem isolar os universos. Por exemplo, se pedirmos a uma gravadora os próximos lançamentos de dois de seus artistas para que o MEMU faça a mixagem, podemos criar um universo fechado para essa colaboração.
Os diferentes canais do MEMU são incorporados em sua arquitetura. Inicialmente, lançamos canais programados para ensinar ao MEMU determinados gêneros, emoções e o modo musical eólico, que são o alicerce da música pop. A tecnologia tem evoluído rapidamente, permitindo-nos adaptar as contribuições que recebemos a todos os gêneros. Por exemplo, o MEMU pode pegar uma obra que naturalmente se encaixa em um canal de relaxamento e adaptá-la a um canal de alta energia.
Estamos trabalhando para acelerar a mecânica da produção musical, melhorar a capacidade de rastreamento e o uso da música e abrir a noção do que é uma música para que ela possa ser apreciada de todas as formas. A IA pode ajudar a construir esse cenário amplo.
Como isso ajuda os músicos?
O MEMU oferece aos músicos a oportunidade de expressarem suas músicas em diferentes modos de emoção e mídia. Os artistas que desejarem ser descobertos poderão dar-nos acesso a algumas de suas obras, para que sejam escutadas de diferentes maneiras, atraindo público para seus catálogos. Que artista não deixaria a sua música ser utilizada em todas essas plataformas e de todas essas maneiras extraordinárias?
O MEMU também democratiza o processo de produção musical. Tem a capacidade de pegar obras musicais e mixá-las de uma forma jamais antes vista e de remunerar os artistas. Existe uma ridícula fome de música que venha a completar o conteúdo sob todas as suas formas, antigas e novas. O MEMU ajuda a atender a essa demanda.
As experiências do Twitch e de outras plataformas mostram que o setor está em modo “não autorizar”. O futuro da música, que o MEMU representa, é “permitir, atrair e remunerar”, para que todos ganhem e possam seguir em frente.
Que impacto você acha que a IA terá junto aos músicos?
As ferramentas de IA poderão democratizar a maneira como os artistas se envolvem com o setor, permitindo-lhes gerar novas receitas a partir de sua obra. As ferramentas que nós, e outros como nós, desenvolvemos foram concebidas para integrar o progresso e a tecnologia de forma ética e centrada no artista.
A IA vem complementar as ferramentas disponíveis para os músicos, podendo suprimir as barreiras na entrada, acelerando o processo de produção e permitindo que os músicos se expressem de forma traduzível em gráficos.
“Estamos trabalhando para acelerar a mecânica da produção musical, aperfeiçoar a rastreabilidade e a utilização da música, ampliando a noção do que é uma canção, para que possa ser apreciada sob quaisquer formas. A IA pode ajudar a construir essa paisagem ampliada.”
As ferramentas de IA poderão democratizar a maneira como os artistas se envolvem com o setor, permitindo-lhes gerar novas receitas a partir de sua obra.
A IA permite que as pessoas que não dispõem dos meios necessários possam ter acesso à música como forma de expressão. É provavelmente a coisa mais empolgante que a IA pode fazer no setor da música.
As ferramentas baseadas na IA podem criar música que realmente sensibilize as pessoas?
Sim. A IA pode sem dúvida ajudar a criar canções que sensibilizem os seres humanos, mas os humanos sempre terão de intervir no processo. Não estamos tentando recriar um desempenho humano, embora o que fazemos se baseie em um desempenho humano, transformando-o em dados e convertendo-o num outro desempenho. A noção de avatar de artista ou de transferência de desempenho já é uma realidade.
Estou convencido de que uma das coisas que a IA fará é permitir que os humanos sejam mais humanos e que escrevam melhores músicas.
Em que campos você acha que veremos a adoção e a adaptação antecipada da música de IA?
Os artistas experimentais têm trabalhado com a IA já há muito tempo. A IA tem-se encaminhado constantemente em direção à corrente dominante da música. Por exemplo, o LifeScore, o software de música de IA da Abbey Road, lançou recentemente um protótipo com a Bentley para música no automóvel, que utiliza pontos de dados como a velocidade e a localização por GPS. Isto é muito promissor.
Afinal de contas, os humanos estão em busca simplesmente de meios interessantes, úteis e divertidos de encarar a vida. A música desempenha um importante papel nessa esfera, e a IA só vem acelerar o processo de produção musical. É por isso que a utilizamos. A IA certamente ampliará o desempenho humano, mas dificilmente o substituirá.
O que está impulsionando o crescente interesse pela IA no setor da tecnologia musical?
A razão primeira é o receio de estar perdendo algo e a segunda é o desejo de corrigir os erros do passado. Há uma percepção de que o poder da IA pode acertar no alvo e nos abrir a porta para uma remuneração proporcional para os artistas.
Como você gostaria de ver o sistema de direitos de autor evoluir?
Por vezes, pusemos os direitos de autor na linha de frente, em particular na fase incipiente do desenvolvimento do MEMU, mas nossa postura atual é: “Se não emperrar”, vamos tocar pra frente. Por isso, vamos continuar a jogar obedecendo às regras, até que as regras sejam alteradas.
Existe alguma área específica na qual você gostaria de ver as regras mudarem?
Penso que é necessário fazer algo em torno da noção de utilização da obra de um artista para gerar novas artes ou novas fontes de receitas, especialmente quando a tecnologia se mostra tão capaz de se apoderar dela e de a utilizar de maneira útil.
Afinal de contas, os humanos estão em busca simplesmente de meios interessantes, úteis e divertidos de encarar a vida. A música desempenha um importante papel nessa esfera, e a IA só vem acelerar o processo de produção musical.
Estou muito dividido diante desta questão, porque não acho que de repente possamos ter o direito de pegar o catálogo de um artista e transformá-lo em novas obras, simplesmente porque dispomos da tecnologia necessária. Talvez haja uma outra solução, que consistiria em autorizar essa utilização em contrapartida de uma contribuição para um fundo comum destinado a prestar assistência aos músicos principiantes.
Quais são seus planos para o futuro?
Nós nos demos o prazo de um ano após termos vencido o concurso AI Song Contest para provarmos que dispomos de uma ferramenta válida para músicos e autores-compositores. O que temos feito suscita grande interesse, o que nos faz tentar sinceramente encontrar os colaboradores ideais, com vista a desenvolver algo que preste assistência às empresas e às comunidades musicais no sentido amplo. Na Austrália, contribuímos para a criação do primeiro centro de música de IA do país, que reúne professores universitários, parceiros comerciais, cientistas e artistas emergentes.
E o futuro do MEMU é criar música nova e empolgante, enquanto gera novos fluxos de receitas para os artistas. Se conseguirmos isto, teremos logrado criar um centro para uma entidade centralizada para reunir uma comunidade de artistas que poderá continuar o diálogo sobre a IA e a música.
A Revista da OMPI destina-se a contribuir para o aumento da compreensão do público da propriedade intelectual e do trabalho da OMPI; não é um documento oficial da OMPI. As designações utilizadas e a apresentação de material em toda esta publicação não implicam a expressão de qualquer opinião da parte da OMPI sobre o estatuto jurídico de qualquer país, território, ou área ou as suas autoridades, ou sobre a delimitação das suas fronteiras ou limites. Esta publicação não tem a intenção de refletir as opiniões dos Estados Membros ou da Secretaria da OMPI. A menção de companhias específicas ou de produtos de fabricantes não implica que sejam aprovados ou recomendados pela OMPI de preferência a outros de semelhante natureza que não são mencionados.