141B.Chinese Open Weights LLM/LLM as as search tool/Agent team/攻殻機動隊 - サイエンス サル
23 February 2026

141B.Chinese Open Weights LLM/LLM as as search tool/Agent team/攻殻機動隊 - サイエンス サル

とにかくヨシ!-Tonikaku Yoshi! | Japanese Meme Society

About

今回のポッドキャストの概要:
中国発オープンウェイトLLMの最新動向と価格感、LLMを検索インターフェースとして使う潮流、エージェントチーム機能の話、そして新作アニメ版『攻殻機動隊』への期待について話しました。

    Chinese Open Weights LLM 中国系企業が公開しているオープンウェイトLLMについて、Qwen 3(アリババ)、MiniMax M2.5、DeepSeek V3.2、GLM-5、Kimi K2.5 などを紹介。 Artificial Analysis のベンチマークで、Claude Opus や GPT-5.2 に肉薄するスコアを出しているモデルがあり、性能面で「遜色ない」レベルになりつつある、という話。 ただし本気の精度でローカル運用するには H200 複数台レベルのハードが必要で現実的ではなく、実務上は AWS Bedrock などクラウド経由API利用が中心になりそう、という整理。 Bedrock の料金を例に、Claude Opus 4.6 と Kimi K2.5 を比較し、100万トークンあたりの単価が 10倍近く違うなど、中国モデルの価格破壊ぶりについて議論。

    ベンチマークの妥当性、日本語性能、自分のユースケースに合うかどうかは個別に検証が必要だよね、という締め。

    Artificial Analysis

    参照しているベンチマークサイトとして軽く紹介。

    OpenAI が DeepSeek を非難しているという報道

    AIの出力を別のAIの学習データに使う「上流学習」を DeepSeek が行っていると OpenAI が非難しているという記事を紹介。 OpenAI モデルをサードパーティールーター経由で叩き、出力を大量収集している疑惑や、DeepSeek が無料でモデル提供して OpenAI のビジネスを「ただ乗り+価格破壊」で脅かしている構図について話した。

    デジタルコピーの容易さゆえの「いたちごっこ」、オープンモデルの安全性(バックドア・特定プロンプトなど)への不安と、サンドボックス化/ネットワーク遮断でどこまで安心できるか、といったセキュリティ面も議論。

    実際に触ってみた各種モデルの印象

    AWS Bedrock 上で DeepSeek, GLM, NVIDIA Nemotron などを試した話。 DeepSeek は処理に時間がかかる一方、GLM は比較的レスポンスが速い印象。 Nemotron はとにかく速いが、出力フォーマット指定などの指示遵守が弱く、用途を選びそう、という感想。

    本物のGPUインフラ(DGXクラス)を自前で買うのは現実的でなく、やはりAPI利用が主流になりそうという結論に。

    LLM as a search tool(Gemini / Grok など)

    LLMサービス自体が検索機能を内蔵し始めている流れを紹介。 Gemini ではツールとして Google 検索が組み込まれており、公式ドキュメント にもなっていること、Grok では X(旧Twitter)のAPIと連携してタイムライン検索などができることを説明。 XのAPIを素で叩くと高価だが、LLM経由だと比較的安く・自然言語でアクセスできる可能性がある、という利用アイデア。

    ただし検索結果にはGoogleやXのフィルターが掛かった状態でしかアクセスできないので、「プラットフォームのアルゴリズムを前提としてよしとするか」が重要な前提条件になるという話も。

    Agent team / スワーム的なエージェント機能

    Claude が最近出している「Agent Teams」機能を取り上げ、中央のエージェントがサブエージェントを立ち上げてタスクを分割し、並列作業させて統合する仕組みを紹介。 コードレビューなら「セキュリティ」「パフォーマンス」「テストカバレッジ」など観点別にエージェントを分けた方が、一体型LLM1つに全部やらせるより偏りが減る、というユースケース。 エージェントが必要なのは「現状のLLMにコンテキスト・計算資源などの制約があるから」なのか、「知性一般が本質的に分業構造を取るべきなのか」という、少し哲学寄りの問いも雑談。

    将来、超高性能な1モデルが実現したらエージェントはいらなくなるのか、それでも多数決や三権分立みたいに複数モデル構成に意味が残るのか、という妄想トーク。

    攻殻機動隊 × サイエンスSARU新作アニメ

    『攻殻機動隊 GHOST IN THE SHELL』の新作アニメが、7月からフジテレビ火曜23時枠+Prime Videoなどで放送予定であることを紹介。 制作はサイエンスSARU(『ダンダダン』『映像研には手を出すな!』など)。映像表現に期待している、という話。 士郎正宗の原作漫画(ヤンマガ海賊版連載)の絵柄・トーンを再現しにいっているらしく、これまでの押井守版映画やSACシリーズ、Netflix 3D版、実写版とはまた別の「原作寄り」攻殻になるのではないか、という期待。 原作漫画は欄外解説が異常に細かく、特に『攻殻機動隊2』はストーリーも概念もかなり難解で「何度読んでもよくわからない」レベルなので、アニメ化したらどう見せるのか楽しみ、という話。 読む順番としては「1 → 2 → 1.5」を推奨。紙本が古くて手に入りにくくても、Kindle版なら入手しやすいので、アニメ前に読んでおくと良さそうだね、という締め。

次回もお楽しみに。