Googleの最新AI「Gemma 4」が登場、無料で自由に使える新時代へ
スマホからパソコンまで動く手軽さと、アイデアの実現を後押しするルール変更

Googleが新しく公開したAIモデル「Gemma 4」は、高い計算能力と画像・音声の理解力を備えています。特に今回注目されているのは、利用に際してのルールが大幅に見直された点です。誰もが制限なくAIを組み込めるようになったことで、私たちの働き方やサービスの作り方がどう変わるのかを解説します。

手元の機器で動く「小さな本格派」

2026年4月2日、Googleは新しいAIである「Gemma 4(ジェンマ・フォー)」を発表しました。Gemmaシリーズは、世界トップクラスの性能を持つ「Gemini 3」の技術をベースにしながら、開発者や一般の人が自分たちのパソコンなどでもすぐに動かせるように作られたAIです。

今回発表されたGemma 4には、大きく分けて4つのサイズが用意されています。

スマートフォンのような小型機器での利用を想定した「エフェクティブ2B(E2B)」と「エフェクティブ4B(E4B)」。そして、より複雑な処理をこなすための中心となる「26B」と「31B」というモデルです。日々の暮らしを支える道具から、専門的な研究や開発の現場まで、目的に応じて最適なサイズを選べる仕組みが整えられました。

少ない力で大きな効果を生む仕組み

特に26Bのモデルには、「必要な部分だけを動かす」という賢い設計が採用されています。全体としては260億のパラメータを持っていますが、一度の推論で実際に働くのは38億のみです。

ひとつのAIの中に複数の「専門家」が控えており、与えられた仕事に応じて最適な専門家だけが立ち上がるイメージです。無駄な計算を行わないため、似たような規模のAIのなかでもひときわ速いスピードで回答を作り出すことができます。一般的なパソコンに搭載されているグラフィックボード(画像処理を担う部品)さえあれば、巨大な設備を用意しなくとも、最先端の性能をオフラインで引き出すことが可能です。

また、文章だけでなく、画像や動画、音声といった複数の情報を同時に理解できる「マルチモーダル」な機能も備わっています。カメラ越しに見せたものを認識したり、音声で直接指示を受け取ったりする処理が手元で行え、なおかつ140を超える言語に対応している点も大きな強みです。長文を一度に読み込ませる能力も大幅に高まっており、本を一冊まるごと読み込ませて要約させるといった使い方も現実的になりました。

過去の「壁」を取り払った大きな変更

Gemma 4の発表で、純粋な性能以上に大きな話題を集めているのが「ライセンス」のルール変更です。

かつてGoogleが公開していたAIは、利用にあたって厳しい独自のルールが設けられていました。開発元のルールが更新されれば強制的に従わざるを得ず、場合によっては作ったプログラム全体に制限が及ぶ可能性がありました。不確実な部分が多く、技術を採用する際の心理的なハードルとなっていました。

今回のリリースから、そのルールが「Apache 2.0(アパッチ・ニーテンゼロ)」と呼ばれる、業界で非常によく知られた有名なオープンソースのライセンスへと完全に切り替わりました。

ルールの刷新に伴い、どのような規模のプロジェクトであっても、商用利用を含めて非常に自由で寛容な使い方が可能になりました。過度な制限がなくなり、将来的に突然ルールが変わる心配もありません。自分たちの手でシステムとデータをしっかりと管理できる仕組みが確約されたことで、新しいアイデアを思いのままに形にできる土台が完成しました。

自分たち専用の「賢い相棒」を作りやすく

いままでは、高度なAIを使うためには外部の巨大なデータセンターに頼らざるを得ず、毎月の費用もかさみがちでした。大切な情報を外部のインターネット回線を通じて送ることに抵抗を感じる場面もしばしば見受けられました。

Gemma 4のように、自分たちのパソコンやローカル環境の中に置いておける優秀なAIがあり、しかも自由な条件で使えるルールが整ったことで、状況は劇的に変化します。

技術の進化とルールの緩和が両輪となって進む現在において、特定の巨大サービスに依存し続ける必要性は薄れつつあります。自分たちの環境にぴったりと合う「賢い相棒」を自作し、安全に活用できる世界がすぐそこまで来ています。

用語解説

  • Gemma
    Googleが開発・公開している、軽量で扱いやすいAIモデルのシリーズ。高度な技術を一般の人でも利用しやすい規模に落とし込んでいる。

  • パラメータ
    AIが学習を通じて獲得する内部の数値のこと。この数が多いほど賢くなる傾向にあるが、その分だけ動かすための計算機材が大掛かりになる。

  • 推論
    AIが入力された情報をもとに、内部のデータを計算し、答えや文章を作り出す過程のこと。

  • マルチモーダル
    文字だけでなく、画像や音声、動画など、異なる種類の情報を組み合わせて理解し、処理できる能力のこと。

  • オープンソース
    プログラムの設計図や中身を広く公開し、誰でも自由に利用や改良ができるようにする仕組み。

  • Apache 2.0
    オープンソースの中でも、特に広く普及している代表的なライセンス。商用目的での利用や内容の変更などを、緩やかな条件で認めている。

出典・参考情報

cropped-logo-1.png_noindex

技術とノウハウでデジタルシフトをサポート
中小企業の頼れるパートナー

執筆者: 綾部 一雄(株式会社クロスディーズ 代表取締役)

ネットワーク維持管理、システム開発、ベンダー調整のスペシャリスト。前職では、600名以上の介護事業所で、介護事業用ソフトの導入や契約の電子化、テレワークシステムの導入等に幅広くに携わる。2021年より、株式会社佐々木総研にて業務効率化のためのロボットや最新技術を活用した開発を行っている。