Technologie klonování hlasu: tvorba a etika v umění

Platformy pro klonování hlasu, jako je ElevenLabs, umožňují komukoli replikovat hlas pouze na základě několika sekund zvuku a za malý poplatek. Tyto technologie přetvářejí kulturní a uměleckou expresi.

V roce 2023 kanadská hudebnice Grimes zveřejnila klon svého hlasu s prohlášením, že „je skvělé být spojen s strojem“. Podobně americká skladatelka Holly Herndon představila v roce 2021 nástroj Holly+, který zpívá hudbu pomocí „výrazně zpracovaného hlasu“.

Tyto příklady vedené ženami ukazují, jak se vypořádat s tvůrčími výzvami spojenými s hlasovými technologiemi, a v mnoha ohledech nejsou nové: průkopnice elektronické hudby a skladatelka Suzanne Ciani vyvinula už před desetiletími technologický přístup, jak do svých skladeb zahrnout mužskou osobnost zvanou „Steve“, když byla potřebná mužská hlasová stopa.

Technologie pro výměnu hlasu jsou také používány některými mužskými producenty k tomu, aby se prezentovali jako ženské umělkyně. Britská výzkumnice a hudebnice Helen Reddington pozorovala, že: „Stejně jako mužský pohled je mužský sluch skrytý a jeho moc se uplatňuje za scénou.“

Reddington to napsala v roce 2018 s ohledem na to, jak muži spisovatelé/producenti využívají ženské zpěvačky k dosažení publika. Avšak aplikované na umělou inteligenci, to ukazuje na kulturní dynamiku, kde manipulace s hlasem, jakožto rozšíření mužského pohledu a sluchu, může odrážet hlubší touhy kontrolovat ženské identity – zejména v hudbě, kde je hlas klíčový pro emocionální vyjádření a identitu.

Na začátku tohoto měsíce zpěvačka Jorja Smith obvinila producenta Harrisona Walkera z použití technologie AI k naklonování jejích vokálů pro jeho singl „I Run“. Walker uvedl: „Nemělo by být žádným tajemstvím, že jsem k transformaci použil zpracování asistované AI pouze svého vlastního hlasu.“ Nicméně, label Smithové reagoval tím, že se zdá, že producent a jeho distributoři si užívají veřejného zmatení, které vzniklo.

Technologie hlasu umělé inteligence jsou formou informační technologie. Jakmile je hlas převeden na informace a simuluje se, ztrácí svou fyzickou formu. Kombinace beztvářného hlasu a kvality jeho simulace může lidem usnadnit představit si počítače jako něco podobného člověku. To znamená, že hlas je slyšet, zda mluví stroj nebo člověk. Právě toto spojení s osobou narušuje klonování hlasu.

Britský umělec AI Oliver McCann, známý jako imoliver, otevřeně přiznává, že „nemá žádný hudební talent … neumí zpívat, neumí hrát na nástroje a nemá žádné hudební zázemí.“ Přesto prostřednictvím AI vyvinul písně, které zdůrazňují ženskou osobnost. Podobně významný producent Timbaland vynalezl fialovovlasou ženskou umělkyni, TaTa, v novém žánru, který označuje jako a-pop nebo umělou pop.

Má však gender tvůrce vliv na vývoj AI umělců a širších fanouškovských základen?

Noonoouri, digitální avatar podepsaný Warner Music Central Europe v roce 2024, přestože není zcela generován umělou inteligencí, je kompozitem digitálních nástrojů, představeným jako mladá ženská módní ikona proměněná v popovou hvězdu. Instagramový profil Noonoouri ukazuje každodenní aktivity – konzumaci těstovin, ukazování mírových znamení, dokonce i vyjádření podpory hnutí Black Lives Matter. Vzhled avataru je proměnlivý. Avšak tyto gesta a modifikovaný vzhled, i když se zdají empatické, mohou být spíše performativní než transformativní.

Tvorce Noonoouri, Jeorg Zuber, použil svůj vlastní hlas – digitálně feminizovaný – a motion capture jeho pohybů k animaci avataru. Zuberovo ztvárnění ženskosti je zde zobrazeno, aby nakonec vytvořilo přizpůsobivého brand ambasadora. Jak uvedl Marec Lerche, vedoucí A&R manažer Warnera: „Její styl můžeme změnit za minutu … můžeme ji nechat létat, pokud chceme.“

Britská autorka Laura Bates, zakladatelka Everyday Sexism Project, poukázala na to, že aplikace používané k vývoji těchto ženských avatarů a postav se opírají o misogynistickou představu o tom, „co je žena a co by měla být. Nikdy ti neodpoví, nikdy ti neodporuje.“ To není AI, kdo se impersonalizuje, ale lidská společnost.

Technologie mohou rozmazat hranice, ale také odhalují, kdo drží moc. Když muži tvůrci používají AI k simulaci ženských hlasů a osobností, rozšiřují umělecké možnosti nebo neustále zakládají nový formu genderové apropriační, ventrilokvizmus a misogynie? Jedna výzva k akci proti růstu manosféry spočívá v posílení přítomnosti ženských hlasů, aby čelily misogynii. Přesto technologie simulace hlasu mohou toto narušit.

V éře AI nabírá impersonace nový význam. Když jsou tyto technologie převážně ovládány cisgender muži a technologickými platformami, ženská impersonace riskuje, že se stane nástrojem dominance spíše než vyjádřením. Otázka se již netýká pouze umělecké svobody – ale také toho, kdo má právo mluvit, a kým je mluveno.

Tento článek je součástí naší série Stavu umění. Tyto články se zabývají výzvami v oblasti umění a kulturního dědictví – a také oslavují úspěchy.