Stručnjaci u Nvidiji tvrde da su modeli malih jezika (SLM) ključni za budućnost sektora umjetne inteligencije (AI).
Međutim, većina ulaganja i dalje se ulaže u modele velikih jezika (LLM). Ako se ova situacija nastavi, industrija bi se mogla usporiti i posljedično naštetiti američkom gospodarstvu.
SLM-ovi u odnosu na LLM-ove
SLM-ovi se treniraju na čak 40 milijardi parametara, izvrsno izvršavajući uski skup specifičnih zadataka uz znatno manje trošenja resursa. Drugim riječima, jeftiniji su.
LLM-ovi su skupi. U travnju je izvršni direktor OpenAI-a Sam Altman slavno izjavio da vodeći proizvod njegove tvrtke, ChatGPT, OpenAI košta desetke milijuna dolara kada korisnici kažu „molim“ i „hvala“. To daje naslutiti koliko su LLM-ovi skupi. Tu SLM-ovi kradu predstavu jer im nisu potrebni skupi podatkovni centri za dovršetak zadataka.
SLM-ovi, na primjer, mogu poslužiti kao chatbotovi za podršku klijentima i ne moraju puno učiti o raznim temama. Prema istraživačkom radu tvrtke Nvidia objavljenom u lipnju, SLM agenti su budućnost umjetne inteligencije, a ne LLM agenti:
„…modeli malih jezika (SLM) su dovoljno moćni, inherentno prikladniji i nužno ekonomičniji za mnoge pozive u agentskim sustavima te su stoga budućnost agentske umjetne inteligencije.“
LLM-ovi također pomažu u obuci SLM-ova kako ne bi morali apsorbirati sve podatke ispočetka. Učinkovito i brzo uče iz velikih modela te postaju gotovo jednako dobri u rješavanju specifičnih zadataka bez potrebe za trošenjem mnogo resursa.
Mogučnost rada na običnim CPU-ima
Najmanji jezični modeli treniraju se na milijardu parametara i mogu raditi na običnim CPU-ima. Tvrtkama ne trebaju virtualna ljudska bića s enciklopedijskim znanjem. Umjesto toga, potrebni su im alati koji brzo i precizno rješavaju određene zadatke.
Zato su jeftini SLM agenti puno unosnija ulaganja od LLM-ova. Važno je napomenuti da GPT-5 koristi nekoliko modela , uključujući i male, ovisno o specifičnim zadacima.
nothing more humiliating than when GPT-5 router determines that your request was too low IQ and re-routes you to the small model pic.twitter.com/GjkLyPxPIW
Što se događa ako sektor umjetne inteligencije doživi neuspjeh
Kripto i blockchain tvrtke sve više koriste LLM-ove za pojednostavljenje poslovanja i poboljšanje donošenja odluka. DeFi platforme poput Zignalyja koriste LLM-ove za sažimanje trgovina i upravljanje uvidima u društvena ulaganja, dok ih infrastrukturne tvrtke poput Platonica i Network3 koriste za podršku programerima i optimizaciju radnih procesa na lancu.
Trgovačke tvrtke također kombiniraju LLM-ove s drugim AI alatima za tržišnu inteligenciju i prediktivnu analitiku. Ali najveći projekti su Googleov Gemini, OpenAI-jev GPT, Anthropicov Claude i xAI-jev Grok. Svaki od njih zahtijeva ogromne podatkovne centre (puno električne energije) i mnogo kapitala.
Sektor umjetne inteligencije u SAD-u prikupio je 109 milijardi dolara ulaganja samo u 2024. godini. Ove su godine američke tvrtke za umjetnu inteligenciju već potrošile 400 milijardi dolara na infrastrukturu. U kolovozu je objavljeno da OpenAI želi prodati svoje dionice u vrijednosti od 500 milijardi dolara. Prema Andrewu Sheetsu iz Morgan Stanleyja, tvrtke za umjetnu inteligenciju mogle bi potrošiti 3 bilijuna dolara na podatkovne centre do 2029. godine.
Prema istraživanju IDC-a, do 2030. godine svaki dolar potrošen na poslovna rješenja temeljena na umjetnoj inteligenciji donijet će 4,6 dolara globalnom gospodarstvu.
Utjecaj na gospodarstvo
Ipak, problem i dalje postoji. Ako se ne izgradi dovoljno podatkovnih centara, to bi moglo imati značajan utjecaj na gospodarstvo i uplašiti velike investitore. Nakon što investitori smanje svoja ulaganja u tvrtke koje se bave umjetnom inteligencijom, potrošnja će se smanjiti.
Usporavanje tvrtki koje se bave umjetnom inteligencijom i koriste LLM-ove može biti uzrokovano čimbenicima poput problematične opskrbe električnom energijom, visokih kamatnih stopa, trgovinskog rata i rastuće potražnje za SLM-ovima, između ostalog.
Što je još gore, neki primjećuju da napuhavanje podatkovnih centara stvara balon, a to nije tako lijepo kao dot-com era koja je pomogla da internet dosegne nove visine. Problem s podatkovnim centrima je taj što koriste čipove koji će s vremenom zastarjeti.
Trebat će samo nekoliko godina. Dakle, iako su ovi čipovi skupi, neće se ponovno koristiti u druge svrhe.
Kako izbjeći kolaps
Kako bi izbjegli kolaps, istraživači Nvidije preporučuju da se tvrtke koje se bave umjetnom inteligencijom odluče za korištenje SLM-ova i pojačaju specijalizaciju SLM agenata.
Zaključak
Takav pristup pomoći će uštedjeti resurse te povećati učinkovitost i konkurentnost. Istraživači sugeriraju da će stvaranje modularnih agentskih sustava pomoći u održavanju fleksibilnosti i korištenju LLM-ova samo za složeno zaključivanje.
Hvala svima što čitate naše članke na kriptoentuzijasti.io! 🚀 Ako vam se sviđa ono što čitate, podijelite ih na društvenim mrežama i pomozite nam širiti kripto znanje. Zajedno gradimo svijet kripta! 💪🔗 #Kriptoentuzijasti #Dijeliznanje crypto #Kriptoedukacija #EtherX #društevenamreža #Crypto # binance istraga
Da bismo pružili najbolje iskustvo, koristimo tehnologije poput kolačića za čuvanje i/ili pristup informacijama o uređaju. Suglasnost s ovim tehnologijama će nam omogućiti da obrađujemo podatke kao što su ponašanje pri pregledavanju ili jedinstveni ID-ovi na ovoj web stranici. Nepristanak ili povlačenje suglasnosti može negativno utjecati na određene karakteristike i funkcije.
Funkcionalni
Uvijek aktivni
Tehničko skladištenje ili pristup je striktno neophodan za legitimnu svrhu omogućavanja korištenja određene usluge koju izričito traži pretplatnik ili korisnik, ili u jedinu svrhu izvršenja prijenosa komunikacije preko elektronske komunikacijske mreže.
Postavke
Tehničko skladištenje ili pristup su neophodni za legitimnu svrhu čuvanja podešavanja koje ne traži pretplatnik ili korisnik.
Statistika
Tehničko skladište ili pristup koji se koristi isključivo u statističke svrhe.Tehničko skladište ili pristup koji se koristi isključivo u anonimne statističke svrhe. Bez sudskog naloga, dobrovoljne suglasnosti od strane vašeg dobavljača internet usluge ili dodatnih zapisa treće strane, informacije sačuvane ili preuzete samo za ovu svrhu obično se ne mogu koristiti za vašu identifikaciju.
Marketing
Tehničko skladište ili pristup su potrebni za kreiranje korisničkih profila za slanje reklama ili za praćenje korisnika na web stranici ili na nekoliko web stranica u slične marketinške svrhe.
Da bismo pružili najbolje iskustvo, koristimo tehnologije poput kolačića za čuvanje i/ili pristup informacijama o uređaju. Suglasnost s ovim tehnologijama će nam omogućiti da obrađujemo podatke kao što su ponašanje pri pregledavanju ili jedinstveni ID-ovi na ovoj web stranici. Nepristanak ili povlačenje suglasnosti može negativno utjecati na određene karakteristike i funkcije.
Funkcionalni
Uvijek aktivni
Tehničko skladištenje ili pristup je striktno neophodan za legitimnu svrhu omogućavanja korištenja određene usluge koju izričito traži pretplatnik ili korisnik, ili u jedinu svrhu izvršenja prijenosa komunikacije preko elektronske komunikacijske mreže.
Postavke
Tehničko skladištenje ili pristup su neophodni za legitimnu svrhu čuvanja podešavanja koje ne traži pretplatnik ili korisnik.
Statistika
Tehničko skladište ili pristup koji se koristi isključivo u statističke svrhe.Tehničko skladište ili pristup koji se koristi isključivo u anonimne statističke svrhe. Bez sudskog naloga, dobrovoljne suglasnosti od strane vašeg dobavljača internet usluge ili dodatnih zapisa treće strane, informacije sačuvane ili preuzete samo za ovu svrhu obično se ne mogu koristiti za vašu identifikaciju.
Marketing
Tehničko skladište ili pristup su potrebni za kreiranje korisničkih profila za slanje reklama ili za praćenje korisnika na web stranici ili na nekoliko web stranica u slične marketinške svrhe.
👍