logo
0
0
Login
TencentCloudADPDevRel<adp_devrel@tencent.com>
Docs:update readme ja-jp

Youtu-agent Logo Youtu-Agent:シンプルで強力なエージェントフレームワーク

| 英語 | 🌟 パフォーマンス | 💡 サンプル | ✨ 機能 | 🚀 クイックスタート |

Youtu-Agentは、自律エージェントを構築・実行・評価するための柔軟で高性能なフレームワークです。ベンチマークテストでトップクラスの成績を収めるだけでなく、オープンソースモデルを活用してデータ分析、ファイル処理、深層学習などの高度な機能を実現できる強力なエージェント機能も備えています。

Youtu-agent Logo

主なハイライト:

  • パフォーマンスの検証:WebWalkerQAではpass@1で71.47%、GAIA(純テキストサブセット)ではpass@1で72.8%を達成しました。これはDeepSeek-V3シリーズのモデルのみを使用しており(ClaudeやGPTは使用していません)、強力なオープンソースの出発点を築きました。
  • オープンソースに優しく、コストに敏感:アクセスしやすく、低コストでのデプロイを最適化しており、クローズドなモデルに依存しません。
  • 実際の使用例:CSV分析、文献レビュー、個人ファイルの整理、ポッドキャストやビデオの生成などのタスクを箱から出してすぐにサポートします。(近日公開予定)
  • 柔軟なアーキテクチャopenai-agentsに基づいて構築されており、DeepSeekからgpt-ossまでのさまざまなモデルAPI、ツールの統合、フレームワークの実装と互換性があります。
  • 自動化とシンプルさ:YAMLベースの設定、自動エージェント生成、簡素化された設定により、手動の作業負担が減ります。

🗞️ ニュース

🌟 ベンチマークパフォーマンス

Youtu-Agentはオープンソースモデルと軽量なツールをベースに構築されており、チャレンジングなディープサーチやツール使用のベンチマークテストで優れたパフォーマンスを発揮しています。

  • WebWalkerQADeepSeek-V3-0324を使用して60.71%の精度を達成し、新しくリリースされたDeepSeek-V3.1を使用すると71.47%に向上し、新たなSOTA(State of the Art)のパフォーマンスを記録しました。
  • GAIADeepSeek-V3-0324(ツールで使用されているモデルを含む)を使用して、純テキスト検証サブセットでpass@1で72.8%を達成しました。多モーダルツールを含む完全なGAIAベンチマークの評価を積極的に拡大しており、近日中に完全なトレースを公開予定ですので、ご期待ください!✨

WebWalkerQA

💡 使用例

データ分析
データ分析
CSVファイルを分析し、HTMLレポートを生成します。
ファイル管理
ファイル管理
ユーザーのためにローカルファイルの名前を変更したり分類したりします。
広範な研究
広範な研究
大量の情報を収集して総合的なレポートを作成し、Manusの機能を再現します。
論文分析
論文分析
指定された論文を解析し、分析を行い、関連する文献を整理して最終結果を出します。

🤖 自動エージェント生成

Youtu-Agentの顕著な利点は、エージェントとその設定を自動生成する機能にあります。他のフレームワークでは、特定のタスクを実行するエージェントを定義するために通常コードを記述するかプロンプトを慎重に設計する必要がありますが、Youtu-AgentはYAMLベースのシンプルな設定方式を採用しており、効率的な自動化を実現します。内蔵のメタエージェントがユーザーと対話して要望を把握すると、自動的にエージェント設定を生成して保存します。

# インタラクティブに要件を明確にし、設定を自動生成します python scripts/gen_simple_agent.py # 生成された設定を実行します python scripts/cli_chat.py --stream --config generated/xxx
自動エージェント生成
自動エージェント生成
インタラクティブな対話によって要件を捉え、エージェントの設定を自動生成し、すぐに実行します。

より詳細な例や高度な使用例については、examplesディレクトリおよびドキュメントdocs/examples.mdをご覧ください。

✨ 特徴

features

デザインコンセプト

  • シンプルなデザイン:フレームワークを簡素化し、不必要なコストを避けます。
  • モジュール化と設定可能性:柔軟なカスタマイズと新しいコンポーネントの簡単な統合が可能です。
  • オープンソースモデルのサポートと低コスト:さまざまなアプリケーションのアクセシビリティとコストパフォーマンスを向上させます。

コア機能

  • openai-agentsに基づいて構築:openai-agents SDKを基盤としており、ストリーミング、トレーシング、エージェントループの機能を継承しています。これにより、responseschat.completions APIとの互換性が保証され、gpt-ossなどの多様なモデルにシームレスに対応できます。
  • 完全な非同期:高性能かつ効率的な実行を実現し、特に効率的な評価に有利です。
  • トレーシングと分析システム:OTELに加えて、DBTracingProcessorシステムはツールの呼び出しやエージェントのトレースに関する詳細な分析を提供します。(近日リリース予定)

自動化

  • YAMLベースの設定:構造化され、管理しやすいエージェント設定が可能です。
  • 自動エージェント生成:ユーザーのニーズに応じて、エージェント設定を自動的に生成できます。
  • ツール生成と最適化:ツールの評価と自動化による最適化が可能で、カスタマイズされたツールの生成機能も将来的にサポートされる予定です。

用途例

  • 深層/広範な研究:一般的な検索指向のタスクをカバーします。
  • ページ生成:特定の入力に基づいてページを生成する例があります。
  • トレース収集:トレーニングや研究目的でのデータ収集をサポートします。

🤔 なぜYoutu-Agentを選ぶのか?

Youtu-Agentは、さまざまなユーザーグループに価値を提供することを目的としています:

エージェント研究者や大規模言語モデルのトレーナー向け

  • 基本的なReActよりも強力で、シンプルながらもパワフルなベースラインとなり、モデルトレーニングやアブレーション研究の優れた出発点となります。
  • 実験プロセスを簡素化し、一貫したベンチマークテストを保証するためのワンクリック評価スクリプトがあります。

エージェントアプリケーション開発者向け

  • 実際のエージェントアプリケーションを構築するための検証済みで移植可能なフレームワークです。
  • 使いやすさ:シンプルなスクリプトと豊富な組み込みツールキットにより、迅速に始めることができます。
  • モジュール設計EnvironmentContextManagerなどの重要なコンポーネントは封装されていますが、高度にカスタマイズ可能です。

人工知能やエージェントの愛好家向け

  • 実際の使用例/examplesディレクトリには、ディープラーニングレポートの生成、データ分析、個人ファイルの整理などのタスクが含まれています。
  • シンプルさとデバッグの容易さ:豊富なツールセットと可視化トレーキングツールにより、開発とデバッグが直感的で簡単になります。

🧩 コアコンセプト

  • エージェント(Agent):ヒント、ツール、環境が設定された大規模言語モデル。
  • ツールキット(Toolkit):エージェントが使用できるツールの集合体。
  • 環境(Environment):エージェントが操作する世界(例:ブラウザ、シェル)。
  • コンテキストマネージャー(ContextManager):エージェントのコンテキストウィンドウを管理するための設定可能なモジュール。
  • ベンチマーク(Benchmark):特定のデータセットに対応したワークフローの集合体で、前処理、実行、判断ロジックを含む。

設計および実装の詳細については、オンラインドキュメントをご覧ください。

🚀 すぐに始める

Youtu-Agent は完全なコードとサンプルを提供しており、すぐに使用を開始するのに役立ちます。以下の手順に従って、最初のエージェントを実行するか、docker/README.mdを参照してDockerを使用してインタラクティブなウェブページを備えたサンプルを迅速に実行できます。

環境準備

リポジトリをクローンして依存関係をインストールします:

[!NOTE] このプロジェクトでは Python 3.12+ を使用しています。依存関係の管理には uv の使用をお勧めします。

まず、環境に Python と uv がインストールされていることを確認し、以下の手順に従ってこのプロジェクトをクローンして依存関係を同期させてください。

git clone https://github.com/TencentCloudADP/youtu-agent.git cd youtu-agent uv sync source./.venv/bin/activate cp.env.example.env # NOTE: 関連する環境変数を設定する必要があります!

[!NOTE] .env ファイルに LLM API キーなどの関連する環境変数を設定してください。

すぐに始める

Youtu-Agent には設定ファイルが内蔵されています。例えば、デフォルトの設定ファイル (configs/agents/default.yaml) では、検索ツールを備えたシンプルなエージェントが定義されています:

defaults: - /model/base - /tools/search@toolkits.search - _self_ agent: name: simple-tool-agent instructions: "あなたはウェブを検索できる役立つアシスタントです。"

以下のコマンドを使用してインタラクティブな CLI チャットボットを起動できます:

# NOTE: `.env` に `SERPER_API_KEY` と `JINA_API_KEY` を設定する必要があります(将来的には無料のツールに置き換える予定です) python scripts/cli_chat.py --stream --config default # 検索ツールを使用しない場合は、以下のコマンドを実行できます python scripts/cli_chat.py --stream --config base

📖 詳細については:クイックスタートドキュメント を参照してください。

サンプルの探索

このリポジトリには直接実行できる複数のサンプルがあります。例えば、特定の研究トピックに基づいて自動的に SVG インフォグラフィック を生成することができます:

python examples/svg_generator/main_web.py

[!NOTE] WebUI を使用するには utu_agent_ui パッケージをインストールする必要があります。ドキュメント を参照してください。

研究トピックを指定すると、エージェントは自動的にネットワーク検索を実行し、関連情報を収集して SVG ビジュアライゼーションを出力します。

svg_generator_ui

svg_generator_result

📖 さらに多くのサンプルについては:サンプルドキュメント を参照してください。

評価の実行

Youtu-Agent では標準データセットでのベンチマークテストもサポートしています。例えば、WebWalkerQA 上で評価を実行するには:

# データセットの前処理。このスクリプトは WebWalkerQA データセットをダウンロードして処理し、データベースに保存します。 python scripts/data/process_web_walker_qa.py # ww.yaml の設定を使用して評価を実行します。迅速な評価のために WebWalkerQA_15 という小さなデータセットを選択しました。 # NOTE: `.env` に `JUDGE_LLM_TYPE, JUDGE_LLM_MODEL, JUDGE_LLM_BASE_URL, JUDGE_LLM_API_KEY` を設定する必要があります。`.env.full` を参照してください。 python scripts/run_eval.py --config_name ww --exp_id <your_exp_id> --dataset WebWalkerQA_15 --concurrency 5

結果はローカルに保存され、分析プラットフォームでさらに確認できます。評価分析 を参照してください。

eval_analysis_overview

eval_analysis_detail

📖 詳細については:評価ドキュメント を参照してください。

🙏 お礼の言葉

このプロジェクトは、以下の優れたオープンソースプロジェクトをベースにしています:

📚 引用

この研究が役立つと思われる場合は、引用を検討してください:

@misc{youtu-agent-2025, title={Youtu-agent: A Simple yet Powerful Agent Framework}, author={Tencent Youtu Lab}, year={2025}, publisher = {GitHub}, journal = {GitHub repository}, howpublished = {\url{https://github.com/TencentCloudADP/youtu-agent}}, }

⭐ Star History

Star History Chart