Kľúčové poznatky
- Nový model strojového učenia vytvára halucinácie obrazu vzhľadu vety v jazyku, aby pomohol prekladu.
- Systém AI s názvom VALHALLA bol navrhnutý tak, aby napodobňoval spôsob, akým ľudia vnímajú jazyk.
- Nový systém je súčasťou rastúceho hnutia za používanie AI na pochopenie jazyka.
Ľudská metóda vizualizácie obrázkov pri prekladaní slov by mohla pomôcť umelej inteligencii (AI) vám lepšie porozumieť.
Nový model strojového učenia halucinuje obraz toho, ako vyzerá veta v jazyku. Podľa nedávneho výskumného dokumentu táto technika potom využíva vizualizáciu a ďalšie stopy na pomoc pri preklade. Je súčasťou rastúceho hnutia používať AI na pochopenie jazyka.
„To, ako ľudia hovoria a píšu, je jedinečné, pretože všetci máme trochu iné tóny a štýly,“povedala Beth Cudney, profesorka dátovej analýzy na Maryville University, ktorá sa na výskume nezúčastnila, v e-mailovom rozhovore pre Lifewire.. "Porozumieť kontextu je ťažké, pretože je to ako narábať s neštruktúrovanými dátami. Tu je užitočné spracovanie prirodzeného jazyka (NLP). NLP je odvetvie AI, ktoré rieši rozdiely v tom, ako komunikujeme pomocou strojového čítania s porozumením. Kľúčový rozdiel v NLP, ako odvetvie AI, sa nezameriava len na doslovný význam slov, ktoré hovoríme alebo píšeme. Pozerá sa na význam."
Choď sa opýtať Alice
Nový systém AI s názvom VALHALLA, ktorý vytvorili výskumníci z MIT, IBM a Kalifornskej univerzity v San Diegu, bol navrhnutý tak, aby napodobňoval spôsob, akým ľudia vnímajú jazyk. Podľa vedcov používanie zmyslových informácií, ako sú multimédiá, v spojení s novými a neznámymi slovami, ako sú kartičky s obrázkami, zlepšuje osvojovanie a uchovávanie jazyka.
Tieto systémy zvyšujú výkon chatbotov, ktorí sú v súčasnosti iba vyškolení a schopní konkrétnej konverzácie…
Tím tvrdí, že ich metóda zlepšuje presnosť strojového prekladu oproti prekladu iba textu. Vedci použili architektúru kódovača a dekodéra s dvoma transformátormi, typ modelu neurónovej siete vhodný pre sekvenčne závislé údaje, ako je jazyk, ktorý môže venovať pozornosť kľúčovým slovám a sémantike vety. Jeden transformátor generuje vizuálnu halucináciu a druhý vykonáva multimodálny preklad pomocou výstupov z prvého transformátora.
"V scenároch reálneho sveta možno nebudete mať obrázok s ohľadom na zdrojovú vetu," uviedol v tlačovej správe Rameswar Panda, jeden z členov výskumného tímu. „Naša motivácia teda bola v podstate: Namiesto použitia externého obrazu počas dedukcie ako vstupu môžeme použiť vizuálnu halucináciu – schopnosť predstaviť si vizuálne scény – na zlepšenie systémov strojového prekladu?“
Porozumenie AI
Značný výskum je zameraný na pokrok v NLP, zdôraznil Cudney. Napríklad Elon Musk spoluzaložil Open AI, ktorá pracuje na GPT-3, modeli, ktorý dokáže konverzovať s človekom a je dostatočne dôvtipný na generovanie softvérového kódu v Pythone a Jave.
Spoločnosti Google a Meta tiež pracujú na vývoji konverzačnej AI so systémom LAMDA. "Tieto systémy zvyšujú výkon chatbotov, ktorí sú v súčasnosti len vyškolení a schopní viesť špecifické konverzácie, čo pravdepodobne zmení tvár zákazníckej podpory a help desk," povedal Cudney.
Aaron Sloman, spoluzakladateľ CLIPr, technologická spoločnosť AI, v e-maile uviedol, že veľké jazykové modely, ako je GPT-3, sa môžu naučiť z veľmi malého počtu príkladov školení, aby zlepšili súhrny textu založené na ľudskej spätnej väzbe. Povedal napríklad, že veľkému jazykovému modelu môžete zadať matematický problém a požiadať AI, aby premýšľala krok za krokom.
„Môžeme očakávať, že z veľkých jazykových modelov sa získajú lepšie poznatky a úvahy, keď sa dozvieme viac o ich schopnostiach a obmedzeniach,“dodal Sloman. „Očakávam tiež, že tieto jazykové modely vytvoria viac ľudských procesov, pretože modelári vyvinú lepšie spôsoby, ako doladiť modely pre konkrétne úlohy, ktoré nás zaujímajú.“
Georgia Tech computing profesor Diyi Yang v e-mailovom rozhovore predpovedal, že v našom každodennom živote uvidíme viac využívania systémov na spracovanie prirodzeného jazyka (NLP), od personalizovaných asistentov založených na NLP až po pomoc s e-mailmi a telefonátmi, na informované dialógové systémy na vyhľadávanie informácií pri cestovaní alebo zdravotnej starostlivosti.„Okrem spravodlivých systémov umelej inteligencie, ktoré dokážu vykonávať úlohy a pomáhať ľuďom zodpovedným a nezaujatým spôsobom,“dodal Yang.
Obrovské modely AI využívajúce bilióny parametrov, ako sú GPT-3 a DeepText, budú pokračovať v práci na jedinom modeli pre všetky jazykové aplikácie, predpovedal Stephen Hage, inžinier strojového učenia v Dialexa, v e-mailovom rozhovore. Povedal, že budú existovať aj nové typy modelov vytvorené na špecifické použitie, ako je napríklad hlasové nakupovanie online.
„Príkladom môže byť kupujúci, ktorý povie „Ukáž mi tento očný tieň v polnočnej modrej s väčšou svätožiarou“, aby ukázal daný odtieň na očiach danej osoby s určitou kontrolou nad tým, ako sa nanáša,“dodal Hage.