AIの最新動向といえばGPT-5が注目を集めていますが、クラウド依存に伴うセキュリティやコストの課題を背景に、「ローカルLLM(オンプレミスで動かせる大規模言語モデル)」への関心も高まっています。実際、いくつかの有力モデルはすでに“GPT-5に迫る性能”を一部で示し始めています。
その一つが、上海AIラボラトリーが開発したInternVL3.5です。文章だけでなく画像や動画も理解できるマルチモーダル型で、独自の強化学習(Cascade RL)を通じて推論力を向上させています。処理速度も従来比で大幅に改善され、ベンチマークではGPT-5との差をわずか数%まで縮める成果を出しました。これは研究レベルにとどまらず、産業利用を見据えた技術成熟のサインと言えるでしょう。
一方、中国のスタートアップDeepSeekが公開したDeepSeek V3.1は、ユニークな「Thinkモード」と「Non-Thinkモード」を切り替えられる仕組みを備えています。複雑な課題解決にはじっくり考えるThinkモード、日常業務には高速応答のNon-Thinkモード、と使い分けができる点は、業務シーンでの柔軟な導入を後押しします。さらに128Kトークンという長大な文脈処理に対応し、ツール連携能力も強化されています。
またMetaは「Llama 4」シリーズを発表し、その中で研究用にBehemothという強力なモデルの投入を予告しました。正式公開は調整中ですが、同社が「最も強力」と評することからも、今後のAI基盤競争において大きな役割を果たすことが期待されます。
そしてOpenAI自身も、gpt-oss-20b/120bといったオープンモデルを公開しています。これはGPT-4レベルの性能を持ちながら、RTXクラスのGPUを搭載したPC上でローカル実行可能であり、社内専用のAI環境を構築する試みに拍車をかけています。
こうした動きを俯瞰すると、クラウドAIとローカルLLMは競合ではなく補完関係にあり、用途や環境に応じて選び分ける時代が到来していることが見えてきます。クラウドが“公共の図書館”だとすれば、ローカルLLMは“自社の書庫”。外部に頼らず機密を守りながらAIを活用できる道が、確実に広がってきています。
用語解説
- ローカルLLM
インターネットに依存せず、自社のPCやサーバーで動かせる大規模言語モデル。
- マルチモーダル
文章だけでなく画像・音声・動画なども同時に扱える仕組み。
- 強化学習(Cascade RL)
AIに試行錯誤を通じて学ばせ、精度を高める学習手法。
- Thinkモード/Non-Thinkモード
深い推論を重視するか、速度を優先するかを切り替えられる仕組み。
- トークン
AIが文章を処理するときの最小単位。128Kトークンは非常に長い文脈を扱えることを意味する。

技術とノウハウでデジタルシフトをサポート
中小企業の頼れるパートナー
執筆者: 綾部 一雄(株式会社クロスディーズ 代表取締役)
ネットワーク維持管理、システム開発、ベンダー調整のスペシャリスト。前職では、600名以上の介護事業所で、介護事業用ソフトの導入や契約の電子化、テレワークシステムの導入等に幅広くに携わる。2021年より、株式会社佐々木総研にて業務効率化のためのロボットや最新技術を活用した開発を行っている。