Skip to main content

Google julkaisi Gemma 4 12B -mallin, jolla kehittäjät voivat ajaa AI-agentteja paikallisesti kannettavissa. 12 miljardin parametrin malli vaatii 16 GB muistia sujuvaan toimintaan.

Google on julkaissut uudet työkalut, joiden avulla kehittäjät voivat ajaa AI-agenttitoimintoja paikallisesti käyttämällä Gemma 4 12B -mallia. Googlen DeepMindin kehittämä 12 miljardin parametrin malli yhdessä Google AI Edge -pinon kanssa mahdollistaa sovellusten rakentamisen ja testaamisen tavallisilla koneilla. Malli tukee autonomista datan käsittelyä, visuaalisten analyysien luomista, verkkosivujen rakentamista ja työkalujen käyttöä.

Julkaisu sisältää Google AI Edge Galleryn macOS:lle, jossa kehittäjät voivat käyttää Gemma 4 12B -mallia skriptien luomiseen ja suorittamiseen data-analyysin kaltaisiin tehtäviin. Googlen Eloquent-sovellus puheentunnistukseen ja tekstin muokkaukseen toimii nyt täysin paikallisesti macOS:ssä tukien paikallista litterointia ja ääniohjattua tekstin muokkausta. Google on myös laajentanut LiteRT-LM-komentorivityökaluaan uudella serve-komennolla, joka mahdollistaa paikallisen LLM-palvelimen käytön ja Gemma 4 12B:n yhdistämisen tavallisiin työkaluihin paikallisen endpointin kautta.

Paikallisten AI-agenttien käyttöönotto tuo kuitenkin haasteita yrityskäyttöön. Gartner-analyytikko Rishi Padhin mukaan tehokkaasti optimoidutkin mallit kuten Gemma 4 12B vaativat noin 16 GB yhtenäistä muistia tai VRAM:ia toimiakseen tavallisten sovellusten rinnalla. Monet yritykset eivät ole vielä valmiita hallinnoimaan AI:ta työntekijöiden laitteissa, ja turvallisuus- sekä compliance-näkökulmat tuovat lisähaasteita kun AI-agentit pääsevät käsiksi paikallisiin tiedostoihin ja sovelluksiin.

Gartner ennustaa, että vuoteen 2027 mennessä organisaatiot käyttävät pieniä, tehtäväkohtaisia AI-malleja vähintään kolme kertaa enemmän kuin yleiskäyttöisiä suuria kielimalleja. Paikallinen AI ei todennäköisesti korvaa pilvi-AI:ta kokonaan, vaan täydentää sitä erityisesti tilanteissa joissa tarvitaan yksityisyyttä, alhaista latenssia tai offline-toimintaa. Kustannuspuolella paikallinen AI siirtää OpEx-kuluja CapEx:ksi vaatien kalliimpien, suurimuististen kannettavien hankintaa työntekijöille.

Tärkeimmät pointit

  • Gemma 4 12B: 12 miljardin parametrin malli Google DeepMindilta paikalliseen agenttitoimintaan
  • Google AI Edge Gallery macOS:lle skriptien luomiseen ja data-analyysiin
  • Eloquent-sovellus: täysin paikallinen puheentunnistus ja ääniohjattu tekstinmuokkaus macOS:ssä
  • LiteRT-LM uudella serve-komennolla paikallisen LLM-palvelimen käyttöön
  • Laitteistovaatimus: 16 GB yhtenäistä muistia tai VRAM sujuvaan toimintaan
  • Gartner ennustaa 3x kasvua pienille AI-malleille vs. suurille LLM:ille vuoteen 2027
  • Haasteet: endpoint-laitteiston rajoitukset, turvallisuus ja compliance-valvonta
  • OpEx-CapEx siirto: kalliimmat kannettavat vs. vähemmän pilvikustannuksia

Lähde: infoworld — alkuperäinen artikkeli julkaistu 4.6.2026