Kľúčové poznatky
- Nový kolektív vývojárov vytvára modely umelej inteligencie s otvoreným zdrojom.
- Skupina využíva rozsiahle modely jazykového vzdelávania, ktoré bude vydávať pod otvorenými licenciami.
- Umelá inteligencia s otvoreným zdrojovým kódom by mohla pomôcť znížiť potenciálne meniacu sa silu novej technológie, aby bola menej náchylná na predsudky a chyby.
Veľké spoločnosti (AI) skúmajú umelú inteligenciu veľa, ale jedna online skupina chce tento proces demokratizovať.
EleutherAI je nedávno vytvorený kolektív dobrovoľných výskumníkov, inžinierov a vývojárov zameraných na výskum AI s otvoreným zdrojom. Organizácia používa kódové základne GPT-Neo a GPT-NeoX na trénovanie rozsiahlych jazykových modelov, ktoré plánuje vydať pod otvorenými licenciami.
„Open source dáta sú prínosom pre výskumníkov, pretože vedci majú viac voľných zdrojov, ktoré môžu použiť na trénovanie modelov a dokončenie výskumu,“povedal Edward Cui, generálny riaditeľ spoločnosti Graviti pre umelú inteligenciu, Lifewire v e-mailovom rozhovore. Jeho spoločnosť nie je zapojená do EueutherAI. „Vieme, že množstvo projektov umelej inteligencie bolo zdržané všeobecným nedostatkom vysokokvalitných údajov zo skutočných prípadov použitia, takže je nevyhnutné vytvoriť usmernenia, ktoré zaistia kvalitu údajov, s pomocou zúčastnenej komunity.“
Toto je cesta
Začiatky EleutherAI boli skromné. Minulý rok nezávislý výskumník AI menom Connor Leahy uverejnil na serveri Discord nasledujúcu správu: „Hej, chlapci, dovoľte, aby [SIC] zarobil OpenAI za svoje peniaze ako za starých dobrých čias.“
A tak vznikla skupina. Teraz má stovky prispievateľov, ktorí uverejňujú svoj kód na online softvérovom úložisku GitHub.
Snahy o umelú inteligenciu s otvoreným zdrojom nie sú novinkou. V skutočnosti platforma Airbnb na riadenie pracovného toku Airflow a nástroj na zisťovanie údajov Lyft sú výsledkom používania nástrojov s otvoreným zdrojom, ktoré umožňujú dátovým tímom lepšie pracovať s údajmi, zdôraznil Ali Rehman, projektový manažér softvérovej spoločnosti CloudiTwins v e-mailovom rozhovore pre Lifewire..
„Rovnako ako revolúcia v oblasti open source viedla k transformácii vývoja softvéru, viedla aj k rozvoju a demokratizácii dátovej vedy a umelej inteligencie,“povedal Rehman. „Open source sa stal kritickým faktorom, ktorý umožňuje podnikové riešenia pre vedu o údajoch, pričom väčšina vedcov údajov používa nástroje s otvoreným zdrojom.“
Otváranie dverí
Vývoj umelej inteligencie s otvoreným zdrojovým kódom by mohol pomôcť znížiť potenciálne meniacu sa silu novej technológie, aby bola menej náchylná na zaujatosti a chyby, tvrdia niektorí pozorovatelia.
Výskum umelej inteligencie sa v súčasnosti uskutočňuje predovšetkým otvoreným spôsobom, pričom takmer všetky spoločnosti, výskumné laboratóriá a univerzity prezentujú svoje výsledky okamžite v odborných publikáciách, povedal Kush Varshney, výskumník AI v IBM, v e-mailovom rozhovore Lifewire.
„Táto otvorená komunita je nevyhnutná, pretože poskytuje zvýšenú úroveň bŕzd a protiváh, aby sa zabezpečilo, že AI sa bude skúmať, vytvárať, nasadzovať a aplikovať zodpovedne,“dodal Varshney. "Toto je obzvlášť dôležité v situáciách, keď tieto systémy môžu ovplyvniť životy našich najzraniteľnejších členov spoločnosti. Táto otvorenosť platí nielen pre všeobecné strojové učenie a algoritmy hlbokého učenia, ale aj pre prvky dôveryhodnej AI."
Rehman povedal, že jedným z kritických rozdielov medzi proprietárnym a open-source softvérom je flexibilita a prispôsobenie. Proprietárny výskum AI bude mať problémy so zabezpečením, aktualizáciami a optimalizáciami.
„Je to preto, že prístup založený na komunite s otvoreným zdrojovým kódom získava cenné informácie od tisícok odborníkov z odvetvia, ktorí identifikujú potenciálne bezpečnostné chyby, ktoré sú potom rýchlejšie napravené,“dodal Rehman.„Konsenzus komunity znamená, že kvalita je zaručená a nové príležitosti sa dajú ľahšie identifikovať.“
Ďalším problémom je, že vlastný výskum umelej inteligencie nebude interoperabilný, čo znamená, že nemôže pracovať s rôznymi formátmi údajov a bude pravdepodobne viazaný na dodávateľa, čo spoločnostiam bráni testovať a skúšať softvér predtým, ako sa zaviažu k riešeniu, Rehman povedal.
Nie každý aspekt výskumu AI však musí mať otvorený zdroj, povedal Chris Kent, generálny riaditeľ spoločnosti Reveal Surgical pre umelú inteligenciu, Lifewire v e-mailovom rozhovore. „Je dôležité chrániť ekonomické stimuly, ktoré poháňajú komerčný vývoj kľúčových aplikácií AI,“povedal.
Výskum AI však potrebuje robustný open source komponent, povedal Kent. Dodal, že open source funguje na budovaní dôvery a využívaní dátových množín, ktoré nie sú alebo by nemali byť kontrolované jednotlivými inštitúciami alebo spoločnosťami.
„Prístup s otvoreným zdrojom je najlepší spôsob, ako identifikovať a kompenzovať základné zaujatosti, ktoré môžu existovať v tréningových súboroch a povedie k holistickejším, kreatívnejším a spoľahlivejším aplikáciám AI,“povedal Kent.