Google julkaisi Gemma 4 12B -mallin, jolla kehittäjät voivat ajaa AI-agentteja paikallisesti kannettavissa. 12 miljardin parametrin malli vaatii 16 GB muistia sujuvaan toimintaan.
Google on julkaissut uudet työkalut, joiden avulla kehittäjät voivat ajaa AI-agenttitoimintoja paikallisesti käyttämällä Gemma 4 12B -mallia. Googlen DeepMindin kehittämä 12 miljardin parametrin malli yhdessä Google AI Edge -pinon kanssa mahdollistaa sovellusten rakentamisen ja testaamisen tavallisilla koneilla. Malli tukee autonomista datan käsittelyä, visuaalisten analyysien luomista, verkkosivujen rakentamista ja työkalujen käyttöä.
Julkaisu sisältää Google AI Edge Galleryn macOS:lle, jossa kehittäjät voivat käyttää Gemma 4 12B -mallia skriptien luomiseen ja suorittamiseen data-analyysin kaltaisiin tehtäviin. Googlen Eloquent-sovellus puheentunnistukseen ja tekstin muokkaukseen toimii nyt täysin paikallisesti macOS:ssä tukien paikallista litterointia ja ääniohjattua tekstin muokkausta. Google on myös laajentanut LiteRT-LM-komentorivityökaluaan uudella serve-komennolla, joka mahdollistaa paikallisen LLM-palvelimen käytön ja Gemma 4 12B:n yhdistämisen tavallisiin työkaluihin paikallisen endpointin kautta.
Paikallisten AI-agenttien käyttöönotto tuo kuitenkin haasteita yrityskäyttöön. Gartner-analyytikko Rishi Padhin mukaan tehokkaasti optimoidutkin mallit kuten Gemma 4 12B vaativat noin 16 GB yhtenäistä muistia tai VRAM:ia toimiakseen tavallisten sovellusten rinnalla. Monet yritykset eivät ole vielä valmiita hallinnoimaan AI:ta työntekijöiden laitteissa, ja turvallisuus- sekä compliance-näkökulmat tuovat lisähaasteita kun AI-agentit pääsevät käsiksi paikallisiin tiedostoihin ja sovelluksiin.
Gartner ennustaa, että vuoteen 2027 mennessä organisaatiot käyttävät pieniä, tehtäväkohtaisia AI-malleja vähintään kolme kertaa enemmän kuin yleiskäyttöisiä suuria kielimalleja. Paikallinen AI ei todennäköisesti korvaa pilvi-AI:ta kokonaan, vaan täydentää sitä erityisesti tilanteissa joissa tarvitaan yksityisyyttä, alhaista latenssia tai offline-toimintaa. Kustannuspuolella paikallinen AI siirtää OpEx-kuluja CapEx:ksi vaatien kalliimpien, suurimuististen kannettavien hankintaa työntekijöille.
Tärkeimmät pointit
- Gemma 4 12B: 12 miljardin parametrin malli Google DeepMindilta paikalliseen agenttitoimintaan
- Google AI Edge Gallery macOS:lle skriptien luomiseen ja data-analyysiin
- Eloquent-sovellus: täysin paikallinen puheentunnistus ja ääniohjattu tekstinmuokkaus macOS:ssä
- LiteRT-LM uudella serve-komennolla paikallisen LLM-palvelimen käyttöön
- Laitteistovaatimus: 16 GB yhtenäistä muistia tai VRAM sujuvaan toimintaan
- Gartner ennustaa 3x kasvua pienille AI-malleille vs. suurille LLM:ille vuoteen 2027
- Haasteet: endpoint-laitteiston rajoitukset, turvallisuus ja compliance-valvonta
- OpEx-CapEx siirto: kalliimmat kannettavat vs. vähemmän pilvikustannuksia
Lähde: infoworld — alkuperäinen artikkeli julkaistu 4.6.2026

