Uncanny Valley: la gestación de una nueva era de creatividad musical
Catherine Jewell, División de Información y Difusión por Medios Digitales, OMPI
En 2010, el cantante y compositor australiano Charlton Hill y el tecnólogo musical Justin Shave unieron sus fuerzas para crear Uncanny Valley, una empresa de tecnología progresiva con sede en Sídney que está a la vanguardia de la industria musical. Charlton Hill, que también es jefe de innovación de Uncanny Valley, habla de las ambiciones de la empresa de acelerar, democratizar y remodelar la producción musical mediante el uso de la inteligencia artificial (IA).En 2020, Uncanny Valley y su colega Caroline Pegram representaron a Australia y ganaron el primer concurso de Eurovisión de canciones generadas por IA.
En inglés, uncanny valley se refiere generalmente a la sensación de incomodidad que generan en los seres humanos las cuestiones que no son del todo humanas. ¿Cómo se les ocurrió llamar a su empresa Uncanny Valley?
Se le ocurrió a Justin Shave, mi socio. Después de desentrañar su significado, comprendí que estábamos destinados a ser una empresa de tecnología musical progresiva en un sector que ambos conocíamos.
Justin es pianista de formación clásica y tecnólogo musical con formación en informática, y yo soy compositor y cantante. Los dos estamos muy interesados en la innovación. En 2010, cuando creamos la empresa, el sector de la música era un terreno movedizo, de modo que era razonable trabajar con un socio con visión de futuro. Siempre hemos tenido un enfoque abierto a los colaboradores y no nos hemos limitado a trabajar con músicos y productores tradicionales. Creo que nos hemos transformado en lo que transmite el nombre. Se podría decir que estamos intentando cruzar el valle misterioso (uncanny valley) en el ámbito de la música, lo que probablemente sea uno de los retos más interesantes de esta época.
Háblenos de su modelo de negocio.
Tenemos dos fuentes de ingresos. Una son los encargos para crear música original o remezclar música (se toma una canción conocida y con licencia y se recrea con un nuevo vocalista) y la otra son los derechos de autor que recibimos cuando se emiten los programas. En Australia trabajamos en una serie de proyectos, por ejemplo, en Australian Survivor, que necesita mucha música para cada programa. Esos ingresos impulsan las operaciones cotidianas de la empresa y financian nuestras actividades más avanzadas de IA y aprendizaje automático.
Háblenos de su trabajo sobre la creatividad aumentada.
Es realmente apasionante. Comenzó formalmente en 2019, cuando colaboramos con el Laboratorio Creativo de Google y con varios artistas australianos emergentes en un experimento que utilizaba el aprendizaje automático para crear algunas herramientas progresivas que esos artistas pudieran utilizar en su proceso de composición. Sus observaciones durante la fase de diseño fueron muy valiosas.
En general, disfrutaron del proceso, pero se mostraron muy elocuentes cuando sintieron que las herramientas les pisaban los talones. Por ejemplo, nuestra aplicación AD LIBBER, concebida con el fin de suscitar ideas para escribir letras, fue bien recibida por un artista a quien le costaba esa parte de la composición, pero no interesó a otro que tenía talento para ello. Otra aplicación, llamada Demo Memo, permitía a los artistas tararear o silbar una melodía y transformarla en un instrumento de su elección, lo que agilizaba considerablemente el proceso de grabación de maquetas. Todos valoraron positivamente esta ayuda.
El experimento ha sido una gran oportunidad para profundizar en esos conceptos. Hemos seguido perfeccionándolos mediante nuestro motor musical, MEMU, que es una acumulación continua de nuestra investigación. A nuestro juicio, con la arquitectura de MEMU, podemos descifrar la cuantificación de la música y la emoción.
MEMU ofrece a los músicos la oportunidad de expresar su música a través de diferentes modos de emoción y medios.
¿Puede explicar mejor esa idea?
Nuestro interés radica en comprender y cuantificar la respuesta emocional que genera la música y los procesos asociados a la escritura de melodías y canciones. No se trata de descifrar la fórmula de una canción de éxito; es más profundo que eso. Analizamos la yuxtaposición de determinadas letras, melodías y secuencias de acordes y la forma en que hacen sentir a una persona, para comprender mejor la huella musical de una pieza musical. Es la idea de sentir felicidad o tristeza y explicársela a un ordenador. Es bastante complejo. Es increíble que dispongamos actualmente de la potencia informática y la inteligencia necesarias para analizar las letras y melodías de toda la obra de un artista y generar nuevas ideas que puedan convertirse en nuevas canciones o representar el avance de la obra de esa persona.
Cuéntenos más sobre MEMU
MEMU es un potente motor para mezclar y fusionar en tiempo real el trabajo de los artistas. Es realmente fascinante. Anuncia una nueva era en la producción musical. Lo consideramos un ecosistema en evolución de contribuidores y colaboradores que permitirá descubrir a los artistas y hacer un seguimiento de su obra y cobrar por cualquier radiodifusión de esta. La capacidad de MEMU para entender y mezclar un flujo interminable de música en tiempo real es realmente notable.
¿Cómo reacciona la gente ante MEMU?
A algunos les parece asombroso, pero les preocupa que vayamos a dejar a los músicos sin trabajo. Esa no es nuestra intención. Consideramos que MEMU es un potente motor para democratizar la producción, que permite acelerar el proceso y hacerlo más asequible. Al igual que Spotify aspira a conseguir la mejor lista de reproducción de la historia, MEMU aspira al mejor paisaje musical de la historia.
¿Cómo han desarrollado el software?
Fue un proceso interesante en el que participaron científicos de datos y tecnólogos creativos que trabajaron con músicos, productores musicales y un equipo más amplio de expertos.
Al principio, entrenamos a MEMU con nuestro propio material. Después empezamos a jugar con la idea de utilizar material protegido por derecho de autor, pero para evitar el riesgo de infringirlo sin darnos cuenta, empezamos a recurrir a las obras de una amplia comunidad de usuarios, en particular de sellos discográficos. Eso nos ha permitido profundizar en el concepto de los derechos de autor y la remezcla. Descubrimos una escala variable de reacciones en función de la notoriedad del artista.
Cuando los artistas entran en el universo MEMU, aceptan que este haga cosas maravillosas y extraordinarias con su arte. MEMU hace un seguimiento de las microcontribuciones de cada artista y de cómo se utilizan. Es una forma eficaz de garantizar la remuneración de los artistas.
Cuando nos ha hecho falta, hemos utilizado material de código abierto para entrenar a MEMU, pero normalmente hemos desarrollado nuestra propia solución para crear la arquitectura a medida de MEMU, simplemente porque las soluciones que necesitábamos no estaban disponibles en el mercado.
¿Puede explicar los diferentes canales de MEMU?
MEMU es maleable y ahora tiene varios canales que nos permiten aislar los universos. Por ejemplo, si pedimos a un sello discográfico los próximos lanzamientos de dos de sus artistas para que MEMU los mezcle, podemos crear un universo cerrado para esa colaboración.
Los diferentes canales de MEMU están integrados en su arquitectura. Al principio, pusimos en marcha canales centrados en entrenar a MEMU en ciertos géneros, emociones y el modo eólico de la música, que sustentan la música pop. La tecnología evoluciona rápidamente y nos permite adaptar a todos los géneros las contribuciones que recibimos. Por ejemplo, MEMU puede tomar una obra que normalmente se encuentra en un canal chill-out y procesarla para un canal de high energy.
Trabajamos para acelerar la mecánica de la producción musical, mejorar la rastreabilidad y el uso de la música y ahondar en el concepto de qué constituye una canción para que se pueda disfrutar de todo tipo de formas. La IA puede ayudar a construir ese amplio panorama.
¿Qué ayuda brinda a los músicos?
MEMU ofrece a los músicos la oportunidad de expresar su música a través de diferentes modos de emoción y medios. Los artistas que buscan ser descubiertos pueden permitirnos acceder a algunas de sus obras para que se escuchen de diferentes maneras y atraigan a la gente a su catálogo. ¿Qué artista no permitiría que su música se utilizara en todas estas plataformas y formas extraordinarias?
MEMU también democratiza el proceso de producción musical. Tiene la capacidad de tomar obras musicales y fusionarlas de una manera que nunca antes habíamos visto, y además los artistas son remunerados. Hay muchísima hambre de música para complementar los contenidos en todas sus formas, antiguas y nuevas. MEMU ayuda a satisfacer esa demanda.
Las experiencias de Twitch y otras plataformas ponen de manifiesto que las empresas del sector están en modo “no permitir”. El futuro de la música, que MEMU representa, es “permitir, atraer y remunerar” para que todos ganen y puedan progresar.
¿Qué repercusión cree que tendrá la IA en los músicos?
Las herramientas de IA pueden democratizar la forma en que los artistas se relacionan con las empresas del sector y permitirles generar nuevos ingresos con su trabajo. Las herramientas que nosotros y otras personas estamos desarrollando están concebidas para integrar el progreso y la tecnología de una manera ética y centrada en el artista.
La IA complementa las herramientas a disposición de los músicos y puede echar abajo las barreras de entrada al acelerar el proceso de producción y permitir a los músicos expresarse a diferentes niveles.
Trabajamos para acelerar la mecánica de la producción musical, mejorar la rastreabilidad y el uso de la música y ahondar en el concepto de qué constituye una canción para que se pueda disfrutar de todo tipo de formas. La IA puede ayudar a construir ese amplio panorama.
Las herramientas de IA pueden democratizar la forma en que los artistas se relacionan con las empresas del sector y permitirles generar nuevos ingresos con su trabajo.
La IA permite que las personas que no tienen medios sigan participando en la música como forma de expresión. Probablemente ese aspecto sea lo más fascinante que la IA puede hacer en el sector musical.
¿Pueden las herramientas basadas en la IA crear música que realmente conmueva a la gente?
Sí. La IA puede, sin duda, ayudar a crear canciones que hagan sentir a las personas, pero las personas siempre estarán involucradas en ese proceso. No intentamos recrear una interpretación o ejecución humana, aunque lo que hacemos se apoya en una interpretación o ejecución humana, la convierte en datos y la traduce en otra interpretación o ejecución. El concepto de avatar de un artista o de transferencia de interpretación o ejecución es ya una realidad.
Estoy convencido de que una de las cosas que hará la IA es permitir a las personas ser más humanas y componer mejor música.
¿En qué ámbito cree que veremos una pronta adopción y adaptación de la música con IA?
Los artistas experimentales llevan mucho tiempo haciendo incursiones en la IA. La IA se está adentrando paulatinamente en la corriente dominante de la música. Por ejemplo, LifeScore, el software de música con IA de Abbey Road, lanzó recientemente un prototipo con Bentley para la música que suena en el coche, que utiliza como referencia la velocidad y la ubicación GPS. Eso es muy alentador.
Al fin y al cabo, los seres humanos solo buscan formas interesantes, útiles y entretenidas de relacionarse con la vida. La música es una parte importante y la IA acelera el proceso de producción musical. Por eso la usamos. La IA aumentará sin duda la interpretación o ejecución humana, pero tendrá dificultades para sustituirla.
¿Qué es lo que impulsa el creciente interés por la IA en el sector de la tecnología musical?
En primer lugar, el miedo a estar perdiéndose algo y, en segundo lugar, el deseo de corregir los errores del pasado. Existe la sensación de que la capacidad de la IA puede permitirnos sacar partido y abrir la puerta a la remuneración prorrateada de los artistas.
¿Cómo le gustaría que evolucionara el sistema de derechos de autor?
Hemos analizado el concepto de los derechos de autor desde varios ángulos, especialmente en las primeras etapas del desarrollo de MEMU, pero nuestra idea actual es seguir trabajando con él, si funciona, así que seguiremos jugando según las reglas hasta que cambien.
¿Hay algún aspecto concreto de la normativa que le gustaría que cambiara?
Creo que hay que hacer algo en torno a la idea de utilizar la obra de un artista para generar nuevo arte o nuevas fuentes de ingresos, sobre todo cuando la tecnología es tan capaz de tomarla y utilizarla de forma valiosa.
Al fin y al cabo, los seres humanos solo buscan formas interesantes, útiles y entretenidas de relacionarse con la vida. La música es una parte importante y la IA acelera el proceso de producción musical.
Estoy muy dividido en relación con este tema porque no creo que de repente tengamos derecho a tomar todo el catálogo de un artista y hacer nuevas obras con él solo porque dispongamos de la tecnología para hacerlo. Tal vez haya otra manera: algo parecido a permitir ese uso a cambio de contribuir a un fondo común para apoyar a las personas que aspiran a ser músicas.
¿Cuáles son sus planes para el futuro?
Nos dimos un año desde que ganamos el concurso de Eurovisión con IA para demostrar que tenemos una herramienta útil para los músicos y compositores. Hay mucho interés en lo que estamos haciendo, y realmente estamos tratando de encontrar los colaboradores adecuados para desarrollar algo que ayude a la empresa y a la comunidad musical en general. Estamos contribuyendo a crear el primer centro de IA musical de Australia, que reúne a expertos, asociados comerciales, científicos y artistas emergentes.
El futuro de MEMU es crear música nueva y emocionante al tiempo que se generan nuevas fuentes de ingresos para los artistas. Si lo conseguimos, habremos logrado crear una plataforma centralizada para que una comunidad de artistas mantenga el diálogo entre la IA y la música.
El propósito de OMPI Revista es fomentar los conocimientos del público respecto de la propiedad intelectual y la labor que realiza la OMPI, y no constituye un documento oficial de la Organización. Las denominaciones empleadas en esta publicación y la forma en que aparecen presentados los datos que contiene no entrañan, de parte de la OMPI, juicio alguno sobre la condición jurídica de ninguno de los países, territorios o zonas citados o de sus autoridades, ni respecto de la delimitación de sus fronteras o límites. La presente publicación no refleja el punto de vista de los Estados miembros ni el de la Secretaría de la OMPI. Cualquier mención de empresas o productos concretos no implica en ningún caso que la OMPI los apruebe o recomiende con respecto a otros de naturaleza similar que no se mencionen.