Kľúčové poznatky
- Nové technológie by mohli viesť k počítačom, ktoré lepšie rozumejú ľudskej reči.
- Microsoft a NVIDIA nedávno oznámili novú metódu interpretácie jazyka založenú na AI.
- Kvantové výpočty môžu byť ďalším spôsobom, ako pokročiť v oblasti spracovania jazykov.
V dnešnej dobe existuje množstvo inteligentných gadgetov, ktorým môžete dávať príkazy, ale stále sme veľmi ďaleko od počítačov, ktoré rozumejú konverzačnej reči.
Spoločnosti Microsoft a NVIDIA nedávno oznámili novú metódu interpretácie reči založenú na AI, ktorá by mohla zmeniť spôsob, akým chatujeme s našou elektronikou. Je súčasťou rastúceho hnutia, ktoré mení spôsob, akým počítače rozumejú reči, nazývané aj spracovanie prirodzeného jazyka (NLP).
"Modely poháňajúce NLP sú čoraz väčšie a pokročilejšie a približujú sa ľudskému chápaniu," povedal expert na AI Hamish Ogilvy pre Lifewire v e-mailovom rozhovore.
„Jedným z veľkých pokrokov je, že NLP ide nad rámec jednoduchých kľúčových slov. Možno ste dnes zvyknutí na to, že na získanie výsledkov vyhľadávania zadáte alebo vyslovíte jedno alebo dve kľúčové slová, no novšie modely spracovania prirodzeného jazyka využívajú kontext na poskytovanie bohatších výsledkov.."
Četovací roboti
NVIDIA a Microsoft sa spojili, aby vytvorili model Megatron-Turing Natural Language Generation (MTNLG), o ktorom dvojica tvrdí, že je to „najvýkonnejší model monolitického transformačného jazyka, ktorý bol doteraz trénovaný“. Model AI beží na superpočítačoch.
Vedci však zistili, že model MTNLG zachytil ľudské predsudky, keď prečesal hory vzoriek ľudskej reči.
„Zatiaľ čo obrovské jazykové modely napredujú v oblasti tvorby jazykov, trpia aj problémami, ako je zaujatosť a toxicita,“napísali vedci v blogovom príspevku. "Naše pozorovania s MT-NLG sú také, že model preberá stereotypy a predsudky z údajov, na ktorých je trénovaný."
Počítače, ktoré lepšie rozumejú reči, nevylepšia len inteligentné reproduktory ako Alexa, tvrdí Ogilvy. Webové stránky s textovým vyhľadávaním, ako je Amazon, tiež lepšie pochopia zadávané dopyty.
„Google tu mal očividné prvenstvo, ale technológia NLP bude všade,“povedal Ogilvy. „Pri textovom a hlasovom vyhľadávaní môžu byť používatelia popisnejší, pretože NLP rozumie viac než len textu; chápe kontext toho, čo hľadáte, aby sa dosiahli lepšie výsledky."
Kvantové čety?
Kvantové výpočty môžu byť jedným zo spôsobov, ako napredovať v oblasti NLP. V stredu spoločnosť Cambridge Quantum oznámila lambeq, o ktorom tvrdí, že je prvým kvantovým súborom nástrojov pre NLP.
…NLP rozumie viac než len textu; rozumie kontextu toho, čo hľadáte, aby ste dosiahli lepšie výsledky.
Spoločnosť tvrdí, že tento nástroj umožňuje preklad viet v prirodzených jazykoch pomocou kvantových obvodov bežiacich na kvantových počítačoch. Kvantové počítanie je typ výpočtu, ktorý na vykonávanie výpočtov využíva nezvyčajné vlastnosti kvantových stavov, ako je superpozícia, interferencia a zapletenie.
"Spôsob, akým kvantové počítače zvládajú NLP, je veľmi odlišný od klasických strojov. V skutočnosti je NLP 'kvantovo natívne'," povedal Bob Coecke, hlavný vedec v Cambridge Quantum, pre Lifewire v e-mailovom rozhovore. "Je to kvôli objavu, ktorý sme urobili pred niekoľkými rokmi, že gramatika riadiacich viet a význam má veľmi podobnú štruktúru ako matematika používaná na programovanie kvantových počítačov."
Coecke povedal, že kvantové NLP by mohlo viesť k lepším hlasovým asistentom a prekladateľským nástrojom.
Ďalší sľubný prístup k zlepšeniu rozpoznávania reči s názvom Zac Liu, dátový vedec zo spoločnosti Hypergiant, povedal Lifewire v e-mailovom rozhovore. „Skrátka, keď dátoví vedci zlepšia údaje NLP, takmer zaručí, že budú mať lepší model NLP a lepšiu schopnosť NLP.“
Ďalším krokom je integrácia modelov počítačového videnia s NLP, ako je trénovanie modelu AI na sledovanie videí a vytváranie textového zhrnutia tohto videa, povedal Liu.
"Použitie tohto pokroku môže byť neobmedzené, od zdravotnej starostlivosti, čítania rádiologických filmov a poskytovania predbežnej diagnózy až po navrhovanie domov, odevov, šperkov alebo podobných predmetov," dodal. „Zákazník mohol vysvetliť požiadavky ústne alebo písomne a tento popis je možné pre lepšiu vizualizáciu automaticky previesť na obrázky alebo videá."