Uncanny Valley montre la voie d’une nouvelle ère de créativité musicale
Catherine Jewell, Division de l’information et de la communication numérique, OMPI
En 2010, les Australiens Charlton Hill, auteur-compositeur-interprète, et Justin Shave, technologue de la musique, fondent à Sydney Uncanny Valley, une société de technologie progressive à la fine pointe de l’industrie de la musique. Charlton Hill, qui est également directeur de l’innovation, parle ici de l’ambition de la société d’utiliser l’intelligence artificielle pour accélérer, démocratiser et remodeler la production musicale. En 2020, Uncanny Valley s’est associée à Caroline Pegram pour représenter l’Australie au premier concours de chansons de l’Eurovision composées à l’aide de l’intelligence artificielle – et pour remporter ce concours.
L’expression “Uncanny Valley” désigne “la vallée de l’étrange” – une impression de malaise que ressentent les humains face à quelque chose qui n’est pas tout à fait humain. Qu’est-ce qui vous a conduit à appeler votre société Uncanny Valley?
C’est mon cofondateur Justin Shave qui a eu l’idée. Une fois que j’en ai déchiffré la signification, j’ai pleinement adhéré à l’idée que nous étions destinés à être une entreprise de technologie musicale progressive, dans un secteur que nous connaissions bien tous les deux.
Justin est pianiste de formation classique, technologue de la musique et informaticien, et pour ma part, je suis auteur-compositeur-interprète. Nous avons tous les deux un intérêt marqué pour l’innovation. Lorsque nous avons créé la société, en 2010, le secteur de la musique était en pleine mutation, et il était donc logique de travailler avec un associé tourné vers l’avenir. Nous avons toujours donné beaucoup de latitude à nos collaborateurs, et nous ne les avons pas limités à des rôles de musiciens et de producteurs traditionnels. Je pense que ce que nous sommes devenus correspond à ce que signifie notre nom. On pourrait dire que nous essayons d’aller au-delà de la vallée de l’étrange du domaine de la musique, et cela représente probablement l’un des défis les plus intéressants de notre époque.
Parlez-nous de votre modèle d’entreprise.
Nous avons deux sources de revenus. Une partie de notre chiffre d’affaires provient de commandes de création de musique originale ou de remixage (une technique qui consiste à prendre sous licence une chanson connue pour la recréer avec une nouvelle voix), et l’autre est constituée par les redevances qui nous sont versées lorsque ces morceaux sont diffusés. En Australie, nous travaillons sur tout un éventail de projets dont Australian Survivor, par exemple, une émission dont le rythme nécessite beaucoup de musique. Ces revenus couvrent les frais de fonctionnement courant de notre entreprise, et nous permettent de financer des activités plus novatrices, dans les domaines de l’intelligence artificielle et de l’apprentissage automatique.
Parlez-nous de votre travail sur la créativité augmentée.
C’est un travail incroyablement prometteur. Il a commencé officiellement en 2019, lors d’une collaboration avec le groupe Google Creative Lab et des artistes émergents australiens qui voulaient utiliser l’apprentissage automatique pour construire des outils progressifs susceptibles de les aider dans la composition de chansons. Les commentaires qu’ils ont faits au cours de la phase de conception ont été extrêmement utiles.
D’une manière générale, le procédé leur a plu, mais ils ne se sont pas gênés pour dire que dans certains cas, ils trouvaient que les outils marchaient sur leurs plates-bandes. Par exemple, notre application AD LIBBER, qui est conçue pour susciter des idées de paroles, a plu à un artiste qui éprouvait des difficultés dans ce domaine, mais pas à un autre qui avait du talent pour l’écriture de textes. Une autre application appelée Demo Memo permettait aux artistes d’enregistrer une mélodie en la fredonnant ou en la sifflant et de remplacer le résultat par l’instrument de leur choix, ce qui leur permettait de faire des démos beaucoup plus rapidement. L’approbation a cette fois été unanime.
Cette expérience a été une excellente occasion d’expérimenter ces concepts. Nous avons continué à les développer depuis dans le cadre de MEMU, notre moteur de musique, qui évolue en permanence, à mesure que nous y intégrons les résultats de nos recherches. Nous pensons que l’architecture de MEMU nous permettra de résoudre le problème de quantification de la musique et des émotions.
MEMU offre aux musiciens la possibilité d’exprimer leur musique dans des registres émotionnels et par des moyens différents.
Pouvez-vous nous expliquer cela un peu plus?
Nous cherchons à comprendre et à quantifier la réaction émotionnelle que suscitent la musique et les processus liés à l’écriture de mélodies et de chansons. Notre objectif n’est pas de découvrir la formule qui permet de faire une chanson à succès; il va plus loin que cela. Nous étudions la juxtaposition de paroles, de mélodies et de séquences d’accords particulières et l’impression qu’elles produisent sur les sens, afin de nous faire une meilleure idée de ce qu’est l’empreinte musicale d’un morceau de musique. Il s’agit de comprendre si ce dernier suscite de la joie ou de la tristesse et d’expliquer cela à un ordinateur. C’est une chose plutôt complexe. Il est extraordinaire de penser que nous avons aujourd’hui la puissance de calcul et l’intelligence nécessaires pour analyser les paroles et les mélodies de l’intégralité de l’œuvre d’un artiste et la capacité de générer de nouvelles idées qui pourraient se transformer en nouvelles chansons ou traduire l’évolution de l’œuvre de cette personne.
Dites-nous-en plus sur MEMU.
MEMU est un puissant moteur qui permet de mixer et de combiner de la musique en temps réel à partir d’œuvres d’artistes. C’est vraiment spécial. Cela annonce une nouvelle ère dans le domaine de la production musicale. Nous considérons qu’il s’agit d’un écosystème évolutif de contributeurs et de collaborateurs qui permettra aux artistes d’être découverts, de suivre la diffusion de leurs œuvres et d’être rémunérés en conséquence. La capacité de MEMU à comprendre et à mixer un flux infini de musique en temps réel est vraiment remarquable.
Que pensent les gens de MEMU?
Certains trouvent que c’est une chose extraordinaire, mais craignent que nous ne mettions des musiciens au chômage. Ce n’est pas notre intention. Nous voyons MEMU comme un puissant moteur qui démocratisera la production en accélérant le processus et en le rendant plus abordable. Tout comme Spotify, qui cherche à créer la meilleure sélection musicale de tous les temps, MEMU cherche à créer le meilleur “paysage musical” de tous les temps.
Comment avez-vous fait pour développer le logiciel?
Ce fut un processus intéressant, dont les participants étaient des spécialistes de la science des données et des technologues créatifs travaillant avec des musiciens, des producteurs de musique et une équipe plus large d’universitaires.
Nous avons commencé par alimenter MEMU avec notre propre musique. Ensuite, nous avons fait des essais avec du matériel protégé, mais pour éviter de nous rendre involontairement coupables d’atteinte au droit d’auteur, nous avons commencé à puiser dans les œuvres d’une communauté élargie d’utilisateurs, y compris des maisons de disques. Cela nous a permis d’expérimenter avec la notion de droit d’auteur et de remixage. Nous avons découvert toute une variété de réactions, selon la notoriété des artistes concernés.
Lorsque les artistes entrent dans l’univers de MEMU, ils acceptent de laisser le moteur faire des choses merveilleuses et extraordinaires avec leur art. MEMU garde une trace des microcontributions de chaque artiste et de la manière dont elles sont utilisées. C’est un moyen efficace de garantir la rémunération des artistes.
Lorsque c’était nécessaire, nous avons utilisé du matériel sous licence ouverte pour “éduquer” MEMU, mais d’une manière générale, nous avons élaboré nos propres solutions pour créer son architecture sur mesure, pour la simple raison que celles dont nous avions besoin n’existaient pas sur le marché.
Pouvez-vous nous expliquer les différents canaux de MEMU?
MEMU est malléable, et dispose maintenant d’un éventail de canaux qui nous permettent d’isoler des univers. Par exemple, si nous demandons à une maison de disques les prochaines sorties de deux de ses artistes en vue d’un mixage par MEMU, nous pouvons créer un univers fermé pour cette collaboration.
Les différents canaux de MEMU font partie intégrante de son architecture. Nous avons d’abord lancé des canaux ciblés pour enseigner à MEMU certains genres, des émotions et le mode musical éolien, qui sont à la base de la musique pop. La technologie évolue rapidement et nous permet d’adapter les contributions que nous recevons à tous les genres. MEMU peut prendre, par exemple, une œuvre dont la place naturelle est dans un canal de relaxation, et la modifier pour un canal de haute énergie.
Nous nous efforçons d’accélérer les mécanismes de production musicale, d’améliorer la traçabilité et l’utilisation de la musique et d’élargir la notion de chanson, pour que celle-ci puisse être appréciée de toutes sortes de manières. L’intelligence artificielle peut contribuer à construire ce vaste paysage.
Qu’est-ce que cela apporte aux musiciens?
Pour les musiciens, MEMU offre la possibilité d’exprimer leur musique dans des registres émotionnels et par des moyens différents. Un artiste qui cherche à se faire connaître peut nous faire entendre un morceau sous plusieurs formes et nous donner ainsi envie de connaître le reste de son catalogue. Quel artiste refuserait que sa musique soit utilisée sur toutes ces plateformes et de toutes ces manières extraordinaires?
MEMU permet en outre de démocratiser le processus de production musicale. Il a la capacité de prendre des œuvres musicales, d’en faire des mixages comme nous n’en avons jamais vraiment vu et de rémunérer les artistes. Il existe une soif incroyable de voir la musique utilisée pour compléter des contenus, anciens et nouveaux, quelle que soit leur forme. MEMU contribue à répondre à cette demande.
Les expériences de Twitch et d’autres plateformes montrent que le secteur est en mode “interdiction”. L’avenir de la musique, celui que représente MEMU, consiste à “permettre, attirer et rémunérer”, pour que tout le monde soit gagnant et puisse aller de l’avant.
À votre avis, quelles seront les répercussions de l’intelligence artificielle pour les musiciens?
Les outils de l’intelligence artificielle peuvent démocratiser la relation des artistes avec l’industrie de la musique et leur permettre de générer de nouveaux revenus avec leur travail. Ceux que nous – et d’autres comme nous – élaborons, ce sont des outils conçus pour intégrer le progrès et la technologie d’une manière éthique et axée sur l’artiste.
L’intelligence artificielle apporte un complément aux outils dont disposent les musiciens et peut éliminer les obstacles qui gênent leur entrée sur le marché en accélérant le processus de production et en leur permettant de s’exprimer avec un niveau de qualité digne des grands studios.
Nous nous efforçons d’accélérer les mécanismes de production musicale, d’améliorer la traçabilité et l’utilisation de la musique et d’élargir la notion de chanson, pour que celle-ci puisse être appréciée de toutes sortes de manières. L’intelligence artificielle peut contribuer à construire ce vaste paysage.
Les outils de l’intelligence artificielle peuvent démocratiser la relation des artistes avec l’industrie de la musique et leur permettre de générer de nouveaux revenus avec leur travail.
L’intelligence artificielle permet aux personnes qui n’en ont pas les moyens de s’éveiller à la musique en tant que forme d’expression. C’est probablement la chose la plus excitante qu’elle puisse faire pour l’industrie de la musique.
Les outils basés sur l’IA peuvent-ils faire de la musique qui touche vraiment les gens?
Tout à fait. Il est certain que l’intelligence artificielle peut contribuer à créer des chansons qui suscitent des émotions chez les humains, mais des humains interviendront toujours dans ce processus. Nous n’essayons pas de recréer une prestation humaine, même si ce que nous faisons consiste à partir d’une prestation humaine, à la transformer en données et à la traduire en une autre prestation. La notion d’avatar d’artiste ou de transfert de performance est déjà une réalité.
J’ai la conviction que l’une des choses que fera l’intelligence artificielle sera de permettre aux humains d’être plus humains et d’écrire de la meilleure musique.
À votre avis, quels domaines seront les plus rapides à adopter la musique IA et à l’adapter?
Il y a longtemps que les artistes expérimentaux s’intéressent à l’intelligence artificielle. Cette dernière prend graduellement sa place dans le monde de la musique. Par exemple, LifeScore, le logiciel de musique IA d’Abbey Road, a récemment lancé avec Bentley un prototype pour la musique embarquée, qui utilise des paramètres comme la vitesse et la localisation GPS. C’est très encourageant.
En fin de compte, les humains cherchent simplement des moyens intéressants, pratiques et divertissants de vivre leur vie. La musique y entre pour une grande part, et l’intelligence artificielle accélère le processus de production musicale. C’est pour cela que nous l’utilisons. Il est certain que l’intelligence artificielle augmentera les performances humaines, mais elle aura du mal à les remplacer.
Qu’est-ce qui alimente l’intérêt croissant pour l’IA dans le secteur de la technologie musicale?
Premièrement, la peur de manquer quelque chose et deuxièmement, le désir de corriger les erreurs du passé. Il y a ce sentiment que la puissance de l’intelligence artificielle va permettre de tout régler et ouvrir la porte à une rémunération au prorata pour les artistes.
Comment aimeriez-vous voir évoluer le système du droit d’auteur?
Nous avons un peu exploré la question de la protection par le droit d’auteur, surtout dans les débuts du développement de MEMU, mais pour l’instant, nous considérons que “tant qu’une chose n’est pas cassée, on la garde comme elle est”. Nous jouerons donc le jeu selon les règles jusqu’à ce que les règles changent.
Y a-t-il un domaine particulier dans lequel vous aimeriez que les règles changent?
Je pense qu’il faut faire quelque chose en ce qui concerne le concept qui consiste à utiliser l’œuvre d’un artiste pour en créer une autre ou pour générer de nouveaux flux de revenus, et cela à plus forte raison lorsque l’on sait avec quelle facilité la technologie peut le faire.
En fin de compte, les humains cherchent simplement des moyens intéressants, pratiques et divertissants de vivre leur vie. La musique y entre pour une grande part, et l’intelligence artificielle accélère le processus de production musicale.
Je suis assez partagé à ce sujet, car je ne trouve pas normal que nous ayons tout à coup le droit de prendre tout le catalogue d’un artiste et de l’utiliser pour produire de nouvelles œuvres, simplement parce que nous avons une technologie qui nous permet de le faire. Il y a peut-être une autre façon de s’y prendre – par exemple une solution qui consisterait à permettre une telle utilisation en échange d’une contribution à un fonds commun d’aide aux futurs musiciens.
Quels sont vos projets pour l’avenir?
Après notre victoire au concours AI Song, nous avons décidé de nous donner un an pour démontrer que nous avions un outil valable pour les musiciens et les auteurs-compositeurs. Notre travail suscite beaucoup d’intérêt, et nous voudrions vraiment trouver les bons collaborateurs pour développer quelque chose qui permette de soutenir notre entreprise et la communauté musicale en général. En Australie, nous participons à la création du premier centre d’intelligence artificielle musicale du pays, qui réunit des universitaires, des partenaires commerciaux, des scientifiques et des artistes émergents.
Pour ce qui est de MEMU, son avenir consistera à créer de la musique nouvelle et captivante, tout en générant de nouvelles sources de revenus pour les artistes. Si nous y parvenons, nous aurons réussi à créer une plateforme centralisée permettant à une communauté d’artistes de poursuivre leur cheminement dans le domaine de l’intelligence artificielle et de la musique.
Le Magazine de l’OMPI vise à faciliter la compréhension de la propriété intellectuelle et de l’action de l’OMPI parmi le grand public et n’est pas un document officiel de l’OMPI. Les désignations employées et la présentation des données qui figurent dans cette publication n’impliquent de la part de l’OMPI aucune prise de position quant au statut juridique des pays, territoires ou zones concernés ou de leurs autorités, ni quant au tracé de leurs frontières ou limites territoriales. Les opinions exprimées dans cette publication ne reflètent pas nécessairement celles des États membres ou du Secrétariat de l’OMPI. La mention d’entreprises particulières ou de produits de certains fabricants n’implique pas que l’OMPI les approuve ou les recommande de préférence à d’autres entreprises ou produits analogues qui ne sont pas mentionnés.