Sú tieto mimoriadne pôsobivé hlasy AI audiokníh dobré alebo zlé?

Obsah:

Sú tieto mimoriadne pôsobivé hlasy AI audiokníh dobré alebo zlé?
Sú tieto mimoriadne pôsobivé hlasy AI audiokníh dobré alebo zlé?
Anonim

Kľúčové poznatky

  • DeepZen používa AI (umelú inteligenciu) na vytváranie prekvapivo realistických audiokníh z textu.
  • Technológia využíva skutočné ľudské hlasové hercov, ktorí poskytujú stavebné kamene.
  • Amazon a Audible momentálne neakceptujú počítačom generované audioknihy.
Image
Image

DeepZen je spoločnosť, ktorá vytvára počítačové hlasy používané v audioknihách na základe skutočných hlasov ľudských hercov. Kvalita je strašidelná - dostatočne dobrá na to, aby ste ju mohli počúvať celé hodiny. Trikom je tu zložka AI (umelá inteligencia), ktorá dokáže prečítať text a na základe kontextu odvodiť správnu emocionálnu reakciu. Potom vloží túto emóciu do hlasu.

Je to pôsobivé a veľmi pohodlné. Naozaj však chceme homogenizovaný zážitok z audioknihy? A čo tí hlasoví herci?

„Z pohľadu nezávislého vydavateľa je všetko, čo znižuje náklady na výrobu audiokníh, veľmi zaujímavé,“povedal Rick Carlile, majiteľ nezávislého vydavateľstva Carlile Media, Lifewire e-mailom.

"Ale táto príťažlivosť predpokladá, že produkt bude mať rovnakú kvalitu ako tradičné rozprávanie. Nemyslím si, že sme tam ešte na sto percent. Nechápte ma zle, DeepZen je prekvapivo dobrý. Je to obrovský prielom a jeho tvorcovia si zaslúžia nesmiernu chválu a úspech. Ale ešte to nie je dokonalé."

Audio, ktoré je „dostatočne dobré“

Najlepší spôsob, ako pochopiť kvalitu DeepZen, je vypočuť si ukážky. Ak by ste nevedeli, že boli vytvorené počítačom, možno by ste si to ani neuvedomili. Aj tak na chvíľu nie. Predpokladajme, že umelá inteligencia DeepZen je dokonalá a že nikdy nesprávne interpretuje emocionálne poznámky, ktoré by mala zasiahnuť.

Image
Image

Aj vtedy môže človek ponúknuť jemnejšie a často prekvapivejšie interpretácie. Herec by mohol vložiť nečakaný zvrat do slov, o ktorých by počítač nikdy ani neuvažoval. A v skutočnosti interpretácia AI určite ešte nie je taká dobrá ako u profesionálneho hlasového herca.

„Ako človek, ktorý pracuje na filmoch a najnovšie vo svete audio rozprávania, na mňa zapôsobila AI – viem určite, že existujú hlboké hĺbky významu, ktoré stroj nedokáže interpretovať,“profesionálny hlas herec Paul Cram povedal Lifewire e-mailom.

"Bude to nával neznámych autorov, ktorí to budú používať? Garantujem, že áno, pretože je to 'dosť dobré'."

Byť dosť dobrý v kombinácii s pohodlím a úsporou nákladov môže stačiť na to, aby do tejto služby priviedli nezávislých vydavateľov.

„Audioknihy môžu stáť až 500 USD za dokončenú hodinu zvuku (v prípade hlasu celebrít oveľa viac) a to nezahŕňa časové náklady na správu a správu,“hovorí Carlile. „Schopnosť znížiť tieto náklady na polovicu jednoduchým nahraním rukopisu poskytovateľovi, akým je DeepZen, je mimoriadne atraktívna.“

Talking Trouble

Zatiaľ to nie je také jednoduché, ako prepustiť hlasových hercov a nahrať rukopisy do DeepZen. V súčasnosti existuje jedna prekážka ľahkej umelej inteligencie audiokníh, a to od Amazonu.

Image
Image

"V súčasnosti ACX, cesta vlastného vydavateľa k distribúcii audiokníh Audible a Amazon, nebude akceptovať audioknihy, ktoré človek nenahral," hovorí Carlile.

Prečo? Kvalita. Tu je záznam FAQ z webovej stránky:

"Prevod textu na reč alebo iné automatizované nahrávky nie sú povolené. Počuteľní poslucháči si vyberajú audioknihy podľa obsahu materiálu, ako aj príbehu. Ak chcete splniť toto očakávanie, vašu audioknihu musí nahrať človek."

To znamená, že audioknihy generované DeepZen sú prinajmenšom momentálne mimo. Toto je čistá špekulácia, ale DeepZen by sa zdal ako celkom dobrá akvizícia pre Amazon, ktorý by mu umožnil predať službu a ponechať si ju výlučne pre knihy Audible. A aj keby sa tak nestalo, ak je kvalita počítačom vytvorených audiokníh taká dobrá ako táto, zdá sa, že nie je dôvod neurobiť výnimku z tohto pravidla.

Chceli by ste počúvať audioknihy vyrobené týmto spôsobom? Keď sa to stane, väčšina ľudí ani nebude mať podozrenie. Niektorí môžu uprednostňovať dokonalosť počítačom generovaných hlasov, pretože budú zbavené vokálnych tikov a zvykov, ktoré môžu niekedy rozptyľovať. Táto technológia je vhodná aj pre videohry, televízne a rozhlasové reklamy a akýkoľvek iný scenár, kde by ste si najali hlasového herca.

Technológia DeepZen by bola tiež skvelým spôsobom, ako automaticky vytvárať spravodajské podcasty z napísaných článkov, čo by sa mohlo hodiť pri dochádzaní.

A čo tí hlasoví herci? No, bude tu aspoň jedna príležitosť: Môžu ísť pracovať pre DeepZen.

Odporúča: