自ら考えてタスクをこなす新世代AI「Qwen3.6-Plus」
プログラミングやデザインを自律的に進める 「エージェント機能」の威力

アリババグループのAI研究チームから、自律的にタスクを遂行する新たなモデル「Qwen3.6-Plus」が発表されました。人間の指示を待つだけでなく、自らの判断でパソコンの操作やプログラミングを進める高度な自律性に大きな注目が集まっています。

専門家のように自律して働く新たなAIの登場

コンピューターやソフトウェアの世界では、人工知能の技術が日々進化を続けています。アリババグループのAI研究チームであるQwen(Tongyi Lab)が2026年4月2日に発表した「Qwen3.6-Plus」は、私たちがパソコンやインターネットを通じて行う作業のあり方を根底から覆す可能性を秘めた存在として大きな注目を集めています。数カ月前に発表された前モデルからさらに性能が引き上げられ、第三者機関が実施した性能テストにおいても、正答率や応答時間、回答の一貫性といった各項目で過去最高水準の成績を記録しました。

従来の人工知能は、人間から入力された短い質問に対し回答文を作成する「対話」が主な使われ方でした。Qwen3.6-Plusは、人間が手取り足取り指示を出さなくても、自ら考えて作業の手順を組み立て、実際の作業を実行する驚異的な自律性を備えています。複雑で手順の多い仕事を与えられた場合でも、物事を体系的に分解して深く思考し、プログラムの構築やファイルの操作をよどみなく進めていきます。

「自分で考えて動く」という大きな進化

Qwen3.6-Plusの最大の強みは、自律的にタスクを遂行するエージェントコーディング機能が飛躍的に高まっている点にあります。パソコンの画面の裏側にあるシステムの設定や、専門的なデータ保管場所を操作するといった高度な要求に対しても、人間が普段行っているのと同じようにツールを駆使しながらシームレスに作業を完了させます。

ある場面を想定すると、人間が「ある特徴を持ったWebサイトを作ってほしい」と漠然とした要望を出したとします。Qwen3.6-Plusは、どのような画面表示が必要か、裏側のシステムをどう動かすべきかを自ら判断し、必要なコードを書き上げます。人間が複数のソフトウェアを組み合わせて数日かけて行うようなプログラミングの作業を、ごく短い時間で終わらせてしまいます。

大量の情報と視覚データを一度に理解する賢さ

Qwen3.6-Plusは、一度に読み込んで処理できる情報の量においても卓越しています。標準の状態で100万トークンという膨大な情報の窓を備えており、分厚いマニュアルや大量の過去データ群を丸ごと読み込ませた上で、そこから針の穴を通すような精密さで必要な情報を引き出すことが可能です。

文字のテキストデータだけでなく、画像や動画といった多様な情報を直接理解するマルチモーダル機能も標準で搭載されています。画面のスクリーンショットや、手書きのメモを撮影した写真を入力するだけで、そこに描かれている意図や内容を正確にくみ取ります。その能力の高さゆえに、デザイン案の画像を見せながら「この画像の雰囲気に合わせたシステムを作って」と指示するような、人間の感覚に近い直感的なやり取りが実現します。

デザイナー顔負けのWebサイトを自作する実力

Qwen3.6-Plusの公式ページでは、高い能力を証明する実際のデモンストレーション映像が多数公開されています。実例を挙げると、「余白を広めに取り、特大のフォントを使い、マウスの動きに合わせて背景の画像が変わるウェブサイトをデザインしてほしい」という細かな要望を入力した場面があります。

その要求に対してQwen3.6-Plusは、色彩や動きのタイミングまで完璧に調整された、プロのWebデザイナーが制作したかのような圧倒的な品質のWebサイトを瞬時に構築して見せました。完成した成果物を見ると、もはや人工知能が補助的な役割を果たしたというレベルを越え、高度な技術を持つ開発者やデザイナーとして独立して働いている事実が裏付けられます。

現在Qwen3.6-Plusは、専用のチャットサービスや各種開発ツールと連携して利用できる状態で公開されており、数日以内には小規模なオープンソース版の公開も予定されています。人間と人工知能が共同作業を行う時代は、すでに当たり前の出来事として環境に浸透し始めています。

用語解説

  • エージェントコーディング機能
    人工知能が人間の指示を細かく受けなくても、達成すべき目標に向けて自律的に手順を計画し、プログラムのコードの作成やツールの操作を実行する機能のこと。

  • トークン
    人工知能がテキストなどのデータを処理する際の最小単位のこと。英語では単語やその一部、日本語では文字や単語の断片などが1トークンに相当する。

  • マルチモーダル機能
    人工知能がテキストデータだけでなく、画像や動画、音声など、異なる種類の情報を同時に理解し、組み合わせて処理する能力のこと。

  • オープンソース
    ソフトウェアの設計図に相当する元データを無償で公開し、世界中の誰でも自由に利用・変更・再配布ができるようにする仕組みのこと。

出典・参考情報

  • Qwen3.6-Plus: Towards Real World Agents – Qwen Blog
    公式のQwenチームによるQwen3.6-Plusの技術発表ブログ。ターミナルやリポジトリの自律操作能力の向上、100万トークンのコンテキストウィンドウ、オープンソース化の予定など、システムの根本的な能力や仕様の正確な確認に活用しました。
  • Qwen-3.5 Plus vs Qwen3.6-Plus Benchmark Results – AI BENCHY
    第三者機関AI BENCHYによる性能テストの結果。前モデルであるQwen-3.5 Plusとの比較データを用いて、正答率や応答時間、一貫性の劇的な向上という事実を裏付ける情報として参照しました。
  • Qwen Chat
    Qwen公式のチャットサービス。Qwen3.6-Plusが一般ユーザー向けに利用可能な形式で提供されている窓口として記載内容の正確性を確認しました。
  • Qwen3.6-Plus on OpenRouter
    複数の人工知能が集まるハブサービス「OpenRouter」のページ。外部のプラットフォームでも広く利用できる環境が整っていることを確認する裏付けとして参照しました。
cropped-logo-1.png_noindex

技術とノウハウでデジタルシフトをサポート
中小企業の頼れるパートナー

執筆者: 綾部 一雄(株式会社クロスディーズ 代表取締役)

ネットワーク維持管理、システム開発、ベンダー調整のスペシャリスト。前職では、600名以上の介護事業所で、介護事業用ソフトの導入や契約の電子化、テレワークシステムの導入等に幅広くに携わる。2021年より、株式会社佐々木総研にて業務効率化のためのロボットや最新技術を活用した開発を行っている。