Stručnjaci u Nvidiji tvrde da su modeli malih jezika (SLM) ključni za budućnost sektora umjetne inteligencije (AI).
Međutim, većina ulaganja i dalje se ulaže u modele velikih jezika (LLM). Ako se ova situacija nastavi, industrija bi se mogla usporiti i posljedično naštetiti američkom gospodarstvu.
SLM-ovi u odnosu na LLM-ove
SLM-ovi se treniraju na čak 40 milijardi parametara, izvrsno izvršavajući uski skup specifičnih zadataka uz znatno manje trošenja resursa. Drugim riječima, jeftiniji su.
LLM-ovi su skupi. U travnju je izvršni direktor OpenAI-a Sam Altman slavno izjavio da vodeći proizvod njegove tvrtke, ChatGPT, OpenAI košta desetke milijuna dolara kada korisnici kažu „molim“ i „hvala“. To daje naslutiti koliko su LLM-ovi skupi. Tu SLM-ovi kradu predstavu jer im nisu potrebni skupi podatkovni centri za dovršetak zadataka.
SLM-ovi, na primjer, mogu poslužiti kao chatbotovi za podršku klijentima i ne moraju puno učiti o raznim temama. Prema istraživačkom radu tvrtke Nvidia objavljenom u lipnju, SLM agenti su budućnost umjetne inteligencije, a ne LLM agenti:
„…modeli malih jezika (SLM) su dovoljno moćni, inherentno prikladniji i nužno ekonomičniji za mnoge pozive u agentskim sustavima te su stoga budućnost agentske umjetne inteligencije.“
LLM-ovi također pomažu u obuci SLM-ova kako ne bi morali apsorbirati sve podatke ispočetka. Učinkovito i brzo uče iz velikih modela te postaju gotovo jednako dobri u rješavanju specifičnih zadataka bez potrebe za trošenjem mnogo resursa.
Mogučnost rada na običnim CPU-ima
Najmanji jezični modeli treniraju se na milijardu parametara i mogu raditi na običnim CPU-ima. Tvrtkama ne trebaju virtualna ljudska bića s enciklopedijskim znanjem. Umjesto toga, potrebni su im alati koji brzo i precizno rješavaju određene zadatke.
Zato su jeftini SLM agenti puno unosnija ulaganja od LLM-ova. Važno je napomenuti da GPT-5 koristi nekoliko modela , uključujući i male, ovisno o specifičnim zadacima.
nothing more humiliating than when GPT-5 router determines that your request was too low IQ and re-routes you to the small model pic.twitter.com/GjkLyPxPIW
Što se događa ako sektor umjetne inteligencije doživi neuspjeh
Kripto i blockchain tvrtke sve više koriste LLM-ove za pojednostavljenje poslovanja i poboljšanje donošenja odluka. DeFi platforme poput Zignalyja koriste LLM-ove za sažimanje trgovina i upravljanje uvidima u društvena ulaganja, dok ih infrastrukturne tvrtke poput Platonica i Network3 koriste za podršku programerima i optimizaciju radnih procesa na lancu.
Trgovačke tvrtke također kombiniraju LLM-ove s drugim AI alatima za tržišnu inteligenciju i prediktivnu analitiku. Ali najveći projekti su Googleov Gemini, OpenAI-jev GPT, Anthropicov Claude i xAI-jev Grok. Svaki od njih zahtijeva ogromne podatkovne centre (puno električne energije) i mnogo kapitala.
Sektor umjetne inteligencije u SAD-u prikupio je 109 milijardi dolara ulaganja samo u 2024. godini. Ove su godine američke tvrtke za umjetnu inteligenciju već potrošile 400 milijardi dolara na infrastrukturu. U kolovozu je objavljeno da OpenAI želi prodati svoje dionice u vrijednosti od 500 milijardi dolara. Prema Andrewu Sheetsu iz Morgan Stanleyja, tvrtke za umjetnu inteligenciju mogle bi potrošiti 3 bilijuna dolara na podatkovne centre do 2029. godine.
Prema istraživanju IDC-a, do 2030. godine svaki dolar potrošen na poslovna rješenja temeljena na umjetnoj inteligenciji donijet će 4,6 dolara globalnom gospodarstvu.
Utjecaj na gospodarstvo
Ipak, problem i dalje postoji. Ako se ne izgradi dovoljno podatkovnih centara, to bi moglo imati značajan utjecaj na gospodarstvo i uplašiti velike investitore. Nakon što investitori smanje svoja ulaganja u tvrtke koje se bave umjetnom inteligencijom, potrošnja će se smanjiti.
Usporavanje tvrtki koje se bave umjetnom inteligencijom i koriste LLM-ove može biti uzrokovano čimbenicima poput problematične opskrbe električnom energijom, visokih kamatnih stopa, trgovinskog rata i rastuće potražnje za SLM-ovima, između ostalog.
Što je još gore, neki primjećuju da napuhavanje podatkovnih centara stvara balon, a to nije tako lijepo kao dot-com era koja je pomogla da internet dosegne nove visine. Problem s podatkovnim centrima je taj što koriste čipove koji će s vremenom zastarjeti.
Trebat će samo nekoliko godina. Dakle, iako su ovi čipovi skupi, neće se ponovno koristiti u druge svrhe.
Kako izbjeći kolaps
Kako bi izbjegli kolaps, istraživači Nvidije preporučuju da se tvrtke koje se bave umjetnom inteligencijom odluče za korištenje SLM-ova i pojačaju specijalizaciju SLM agenata.
Zaključak
Takav pristup pomoći će uštedjeti resurse te povećati učinkovitost i konkurentnost. Istraživači sugeriraju da će stvaranje modularnih agentskih sustava pomoći u održavanju fleksibilnosti i korištenju LLM-ova samo za složeno zaključivanje.
Hvala svima što čitate naše članke na kriptoentuzijasti.io! 🚀 Ako vam se sviđa ono što čitate, podijelite ih na društvenim mrežama i pomozite nam širiti kripto znanje. Zajedno gradimo svijet kripta! 💪🔗 #Kriptoentuzijasti #Dijeliznanje crypto #Kriptoedukacija #EtherX #društevenamreža #Crypto # binance istraga
👍