IA et musique, deux termes qui jusqu’il y a peu ne semblaient pas pouvoir être combinés. Pourtant, comme nous l’avons vu ensemble dans les deux premières parties de cet édito, les résultats obtenus ces dernières années sont de plus en plus impressionnants. Revenons à l’image pour tenter d’anticiper l’avenir en matière de musique.
Les récentes séries de l’univers Star Wars nous ont dévoilé un Luke Skywalker à peine sorti de l’adolescence, alors que Mark Hamill qui l’avait jusque-là incarné à l’écran accuse ses 70 printemps. Comme l'IA est en mesure de composer "dans le style de", elle est également en mesure de reproduire des images "qui ressemblent à". Ce que vous pouvez d'ailleurs constater tous les soirs sur TF1 dans l'émission C'est Canteloup. Peu importe la piètre qualité des dernières productions Disney ou la confusion des genres entre imitation et humour. Vous aurez sans doute remarqué des imperfections visuelles au passage. Comme je vous le précisais dans la première partie, la machine doute. Elle ne produit qu'une probabilité, qui présente donc encore des défauts apparents.
Ce n’est d'ailleurs pas tant les travaux de Disney à ce sujet qui ont été impressionnants, mais la réponse des fans quasi immédiate. Quelques jours après la diffusion des images produites par le mastodonte du cinéma, une copie améliorée de ce Luke Skywalker juvénile voyait le jour de la main d’obscurs amateurs. Les progrès actuels de l’intelligence artificielle et son accessibilité sont au moins aussi fulgurants que les résultats qu’elle est en train d’accomplir. Si je doute qu’une IA soit donc un jour capable d’achever la symphonie de SCHUBERT de façon satisfaisante pour les raisons mentionnées en seconde partie, on peut déjà se poser des questions sur ses futurs accomplissements.
Quid du requiem de MOZART, que l’artiste n’avait également pas été en mesure d’achever rappelons-le, à titre d’exemple ? Si SCHUBERT innovait dans sa symphonie, le salzbourgeois bien au contraire, ne faisait qu’améliorer sur un plan technique ce que Michael HAYDN avait déjà composé 20 ans auparavant. Le Pluto de MATTHEWS qui succédait aux planètes de HOLST en témoigne, l’une des grandes difficultés de tous les compositeurs qui ont cherché à écrire « dans le style de », a toujours été de se défaire de leurs propres influences. Ce qui ne devrait donc pas être un problème pour une IA. Ne pourrait-on pas imaginer, en partant du catalogue d’œuvres que MOZART connaissait ou aurait pu connaître de son vivant, que l’une d’entre elles soit en mesure d’achever son requiem ? Au moins de façon plus satisfaisante que SUSSMAYR, l'élève de MOZART qui n’a pas franchement brillé par ailleurs, ou que tous les compositeurs romantiques qui se sont cassés les dents sur l'exercice depuis ? La structure d’une messe est déjà connue, l’histoire est déjà racontée… Nous avons à notre disposition, de plus, des partitions « corrigées » de la main de MOZART de travaux plus anciens dont il s’est inspiré (le Messie d’HANDEL en particulier). Celles-ci pourraient également servir pour dissocier les motifs dont MOZART aurait pu s’inspirer de ceux qu’il aurait, à cette même époque et en toute probabilité, écartés. A défaut de nous en livrer une version "satisfaisante" clé en main, le résultat ne pourrait-il pas servir de base à un compositeur hautement plus inspiré que CANTOS ou SUSSMAYR pour achever le chef-d’œuvre ?
Si les résultats spectaculaires que l’on obtient actuellement avec l’IA peuvent susciter bien des fantasmes, il semble que le facteur humain devra toujours être présent pour les finitions. N’est-ce pas déjà une histoire que nous avons d’ores et déjà vécue par ailleurs ? Est-ce que ce n’est pas précisément en remettant de l’analogique dans son numérique et de l’acoustique dans son électrique que l’électro est finalement parvenue à sortir de sa niche, seule en mesure d'appréhender son carcan originel, trop artificiel ?
Il faut en outre savoir que l’intelligence artificielle est déjà utilisée aujourd’hui en musique à d’autres fins que la composition. On peut d’ailleurs s’étonner que ce soit cette prouesse qui semble focaliser toute l’attention. Le label Snafu Record, toujours d’après le même article du Figaro (cf. partie II), serait en mesure de détecter de futurs succès plus efficacement par analyse comportementale. En extrapolant les réactions des premiers auditeurs d’une œuvre, le label serait en mesure d'en estimer son succès potentiel. Une utilité plus mercantile qu’artistique, vous en conviendrez. Mais si cela peut faciliter la détection d’anonymes talentueux à plus grande échelle, qui s’en plaindra ? Le risque, encore une fois, serait de ne faire confiance qu'aux machines et d’écarter tout succès potentiel auprès d’une niche, à cause de vulgaires projections statistiques. Le vrai problème, dans l'usage des IA, reste les humains qui s'en servent et qui pourraient limiter leur potentiel dans un unique but de rentabilité à court terme. Une histoire qui se répète. Espérons que l’accès démocratique à ces capacités permettra au moins en partie de contrer les desseins les plus néfastes à ce sujet.
Cette capacité d’apprentissage de l’IA devrait en outre pouvoir être utilisée pour d'autres applications. Un article de Diapason d’il y a quelques années précisait déjà que la compression de données était employée à l’identification d’œuvres non attribuées. Le taux de réutilisation d’un motif (et donc de compression) étant différent d’un compositeur à l’autre, et ce de façon étonnamment régulière. Nul doute que l’IA, capable d’identifier des styles, à partir de critères que l’oreille humaine n’est peut-être pas toujours en mesure de repérer, devrait pouvoir grandement améliorer cela, si ce n’est déjà fait. Il existe aujourd’hui des tonnes de partitions non attribuées qui croupissent dans les bibliothèques, attendant d’être redécouvertes. On sait par exemple qu’un tiers de la production de BACH a disparu après sa mort. L’est-elle totalement ou serait-elle enfouie dans des piles de partitions non attribuées ? Une IA pourrait être en mesure de confirmer ou d'infirmer de tels doutes, ou au contraire, pointer du doigt des similitudes que l’on aurait jusque-là ignorées. Dans ce domaine, tout n'est qu’analyse à grande échelle et taux de probabilité.
Outre l’identification, on peut imaginer des applications du côté de la qualité du son. En traitement des images, de nouveau, il est aujourd’hui possible de réaliser des choses encore inenvisageables il y a quelques années. Contrairement à ce que Hollywood a essayé de nous faire gober, lire une plaque d’immatriculation à partir d’une bouillie de pixels, comme dans Les experts, a toujours été impossible. En revanche, il est aujourd’hui possible de créer des détails manquants de façon « probable », en reproduisant un style. En partant d’une grande quantité de photos de forêt en basse et haute résolution, une IA peut par apprentissage générer un procédé d’amélioration automatique d’images du même type. Il suffit ensuite de lui fournir de nouvelles images de mauvaise qualité pour qu’elle soit en mesure d’en proposer une version plausible de haute qualité. C’est ce qu’est parvenu à proposer le « moguri mod » du jeu Final Fantasy IX, qui a permis de passer les décors d’origine du jeu, fortement pixélisés, en leurs équivalents HD. L’IA permet donc de reproduire voire de créer des détails « à la manière de », même si ceux-ci ne sont pas authentiques. Notez que l’amélioration en question a cependant requis quelques retouches par la suite pour obtenir le résultat tant apprécié.
En appliquant ce procédé en musique, on pourrait donc imaginer qu’il soit possible d’ici peu, et selon une méthode similaire, de pouvoir grandement améliorer la qualité sonore d’enregistrements anciens. Imaginez que l’on puisse réentendre Alessandro Moreschi, dernier castrat ayant été enregistré au début du XXème, dans des conditions correctes ? De même concernant tous les cadors du jazz de la première moitié du XXème ? On devrait même pouvoir améliorer les techniques de conversion mono vers stéréo, sans passer par les méthodes de filtrage usuelles, qui laissent toujours quelques artéfacts synthétiques derrière elles.
Pourquoi ne pas d’ailleurs pousser le principe encore plus loin, et obtenir d’une simple partition une version orchestrale s'apparentant à un enregistrement ? Ce sans avoir à recruter le moindre musicien. Une IA devrait pouvoir, par simple mimétisme, reproduire le procédé de l’interprétation. Sans saveur certes, mais ne serait-ce pas déjà plus satisfaisant, en particulier pour des compositeurs en pleine phase de création et désireux d’avoir une idée de rendu final, que de simples versions midi ? De parfaits inconnus n'auraient-ils pas plus de facilité à convaincre des studios d'enregistrements de passer à la caisse avec des proto-versions générées grâce à des IA, donnant un avant-goût du rendu final ? On pourrait même envisager de le faire « dans le style de » tel ou tel chef d’orchestre. Il y aurait bien sûr quelques subtilités qui échapperaient à ce procédé. Difficile d’imaginer une IA capable d’imiter l’audace de Giovani Antonini (Il Giardino Armonico). Mais je ne serais pas surpris de découvrir en rayon l’intégrale des symphonies de HAYDN "dans le style d’" un perfectionniste tel que Karajan un beau jour, et ce grâce à une IA, quand bien même il ne les a pas toutes enregistrées de son vivant.
Nous sommes actuellement à l'aube d'une révolution dont nous ne cernons pas encore toutes les possibilités. Comme tout outil, l'intelligence artificielle n’a pour vocation que de faire gagner du temps, même si celle-ci a la capacité de le faire dans des proportions inédites. Si l'on peut craindre que bien des métiers aujourd'hui indispensables à la production musicale disparaissent à l'avenir, nous ne sommes pas encore parvenus au point où l'art se passerait de l'humain. Quels que soient les outils, on peut encore légitimement penser qu’il y aura toujours des génies en mesure de transcender leurs capacités. La différence, c'est que les génies de demain gagneront peut-être du temps grâce aux IA et, qui sait, seront peut-être en mesure d’atteindre de nouveaux sommets de la création.
Reste toutefois la question du conseil, qui est la principale utilité de Forces Parallèles. Youtube, Amazon Prime ou Netflix rivalisent aujourd’hui d’ingéniosité afin de vous proposer la prochaine vidéo susceptible de vous plaire. Bandcamp, Qobuz, Soundcloud ou Spotify font ou feront semble-t-il de même en matière de musique. Les chiffres démontrent que 70% des vidéos visualisées sur Youtube le sont suite à une suggestion de la plateforme. Nul doute que ces sociétés cravachent à augmenter cette statistique le plus efficacement possible. Leur objectif ? Vous faire visualiser de la pub ou succomber à leur système d’abonnement. Moi-même le premier, je dois reconnaitre que les conseils de Youtube m’ont amené sur des territoires musicaux inattendus et de qualité. Notre fonction de conseil serait-elle donc menacée ? Si vous avez déjà passé des heures sur Youtube ou Netflix, nul doute que vous avez un jour eu la sensation d’être quelque peu pris pour des abrutis, ou tout du moins de tourner en rond. Comme j’ai tenté de vous l’expliquer, les IA ne savent pas gérer les exceptions. Mais c’est bien de l’exception que naissent la surprise, l’innovation, et de manière plus générale, la créativité.
Pourtant, combien de fois nous a-t-on réclamé à Forces Parallèles de nous focaliser sur un genre particulier ou, pire, de poursuivre une ligne éditoriale imaginaire ? Ces plateformes semblent ne faire que répondre à une certaine demande, sans doute inconsciente. Dans un monde où les machines prennent de plus en plus le pas sur nos décisions, c’est indéniablement l’originalité, la diversité et le subversif qui seront les clés de l’affirmation de l’humain de demain. Plus que jamais, les libertés éditoriales que nous nous octroyons à FP se présentent à nous comme une alternative, certes de bien peu de moyens, mais définitivement disruptive en comparaison des conseils des grandes plateformes qui envahissent aujourd’hui notre quotidien. Si vous en avez marre de tout le temps écouter la même chose, tentez donc le dernier 5/5 en date paru sur le site. Si ce n’est pas le cas, remettez peut-être en question vos dernières écoutes ? Nous nous sommes probablement trompés lors de nos derniers conseils mais, qui sait, vous pourriez être surpris.
|