AutoGPT — 全自主 AI Agent 平台

GitHub: Significant-Gravitas/AutoGPT
Stars: 185,000+ | Language: Python (68.2%), TypeScript (30.2%) | License: MIT (经典版) / Polyform Shield (平台版)
官网: agpt.co

项目速览

AutoGPT 由 Toran Bruce Richards（Significant Gravitas）于 2023 年 3 月创建，一经发布便引爆了 AI Agent 浪潮。截至 2026 年 6 月，项目在 GitHub 上已获得超过 185,000 颗 Star，位列 AI Agent 领域 Star 数第一，是整个 AI 开源社区的现象级项目。

AutoGPT 的核心理念是全自主任务执行：用户只需设定一个目标，Agent 便能自主完成规划、执行、反思和调整的全流程，无需持续的人工干预。早期版本以 CLI 形式运行，通过”自我提示”（self-prompting）机制循环调用 LLM 来分解和完成任务。

2025 年，AutoGPT 已从实验性原型演进为双轨制产品：AutoGPT 经典版（Classic）继续作为 MIT 许可的开源 Agent 框架，包含 Forge（Agent 构建工具包）、Benchmark（性能测试框架）和 Frontend（Web 界面）；AutoGPT Platform 则是面向企业的商业化平台，提供 Agent Builder（低代码构建器）、可视化工作流管理、部署控制和监控分析。平台部分采用 Polyform Shield 许可证。两者均遵循 Agent Protocol 标准，确保互操作性。

功能概述

自我提示与自主循环（Self-Prompting Loop）

AutoGPT 的核心创新是自主执行循环：Agent 在每次迭代中自行生成下一步操作，执行工具调用，评估结果，并根据反馈调整策略。这个循环实现了：

目标分解：将自然语言目标自动拆解为可执行的子任务 DAG（有向无环图）
Chain-of-Thought + Tree-of-Thoughts 推理：同时探索多条推理路径，选择最优方案
反思与纠错：内置批评循环（criticism loop），Agent 自我审视输出质量，诊断失败并调整策略
Watchdog 组件：自动检测无限循环，切换到”智能模式”防止 token 浪费

Forge — 组件化 Agent 构建工具包

Forge 是 AutoGPT 经典版中的 Agent 构建框架，采用组件-协议（Component-Protocol）架构：

Components 是实现一个或多个 Protocols（接口）的类
每个 Protocol 提供特定钩子：MessageProvider（消息生成）、CommandProvider（命令执行）、AfterParse（解析后处理）、AfterExecute（执行后处理）
Components 按顺序组成 Pipelines（管道），定义 Agent 的完整行为

内置组件覆盖了 Agent 所需的全套能力：系统生命周期管理、用户交互、文件操作（本地/GCS/S3）、代码执行（Docker 沙箱）、Git 操作、图像生成、Web 搜索与浏览、动作历史压缩和循环检测。

20+ 内置工具

AutoGPT 提供丰富的内置工具集，Agent 可在执行过程中自主选择和使用：

Web 工具：DuckDuckGo / Google 搜索、Selenium 全浏览器自动化（Chrome/Firefox/Safari/Edge）
代码工具：Shell 命令执行、Docker 沙箱化 Python 执行
文件工具：本地文件读写、GCS/S3 云存储操作
开发者工具：Git 克隆与提交、GitHub API 集成
创意工具：DALL·E / HuggingFace / Stable Diffusion 图像生成
企业连接器：Salesforce、Shopify、Slack 等预置集成

Agent Builder — 低代码可视化构建器

AutoGPT Platform 提供基于 Block 的拖拽式 Agent Builder（Blocks SDK），让非技术用户也能构建 Agent 工作流。特性包括：

可视化画布：拖拽 Blocks 构建 Agent 逻辑，无需编写代码
实时监控：通过 WebSocket 实时查看每个节点的执行状态（QUEUED / RUNNING / COMPLETED / FAILED）
Blocks Marketplace：发布、导入和共享自定义 Blocks 组件
一键部署：构建完成后一键部署到云端或自托管环境

Benchmark 与性能评估

AutoGPT 内置了 agbenchmark 测试框架，用于量化评估 Agent 在各类任务上的表现。这为 Agent 能力的持续改进提供了客观的度量标准，也是开源社区中少有的将 Agent 评测纳入框架本身的项目。

记忆系统

短期记忆：保存当前会话的对话上下文和执行状态
长期记忆：使用向量数据库（如 Chroma）配合 RAG 实现跨会话记忆，Agent 能回忆之前项目的经验并从中学习

适用场景

自动化网络研究

AutoGPT 的 Web 搜索和浏览器自动化能力使其非常适合需要多步骤网络研究的场景：收集竞品信息、行业数据、技术文献等。Agent 能自主搜索、浏览网页、提取关键信息并整合成报告。

代码生成与原型开发

AutoGPT 的 Docker 沙箱化代码执行能力支持安全地运行生成的代码。适用于快速原型开发、自动化脚本编写、数据管道搭建等场景。Agent 可以自行编写、测试和迭代代码。

数据收集与报告生成

对于需要从多个来源收集数据并生成分析报告的任务，AutoGPT 可以自主完成：搜索数据源、抓取信息、结构化数据、分析趋势、生成可视化图表和撰写报告。有社区报告显示，某些数据分析任务中 AutoGPT 能节省 90%+ 的人工时间。

内容创作流水线

AutoGPT 可以端到端自动化内容创作流程：研究主题、收集素材、撰写初稿、自我审核和修改、优化 SEO。结合图像生成工具，还能自动为文章配图。

个人 AI 助手

AutoGPT 的”Continuous Mode”允许 Agent 在后台持续运行，作为个人生产力助手处理日常任务：邮件整理、日程安排、信息检索、文档管理等。需要注意的是，完全自主模式在生产环境中仍建议配合人工监督使用。

快速上手

环境要求

Docker 和 Docker Compose（推荐）
或 Python 3.10+（经典版）
LLM API Key（OpenAI、Anthropic 或本地 Ollama）

Docker 部署（推荐）

# 克隆仓库
git clone https://github.com/Significant-Gravitas/AutoGPT.git
cd AutoGPT

# 复制环境配置
cp .env.example .env
# 编辑 .env 文件，填入 API Key：
#   OPENAI_API_KEY=sk-...

# 启动经典版 AutoGPT
docker compose -f docker-compose.yml up -d

使用 Ollama 运行本地模型

# 先安装并启动 Ollama
ollama pull llama3.1

# 在 .env 中配置
#   SMART_LLM_API_KEY=ollama
#   SMART_LLM_MODEL=llama3.1
#   FAST_LLM_MODEL=llama3.1

最简示例：让 AutoGPT 完成一个任务

启动 Docker 后，访问 Web 界面 http://localhost:8000，输入目标：

为一个名为 "GreenMeal" 的植物基餐食配送初创公司制定市场进入策略。
包括：目标客户分析、竞品调研、定价建议和 90 天行动计划。

AutoGPT 会自动：

将目标分解为子任务
搜索行业报告和竞品信息
分析目标客户画像
生成定价策略
撰写完整的市场进入策略文档

源码架构

AutoGPT 仓库采用双轨制结构：

AutoGPT/
├── classic/                       # 经典版（MIT 许可）
│   ├── autogpt/                   #   核心 Agent 引擎
│   │   ├── agents/                #     Agent 实现
│   │   ├── commands/              #     命令系统（20+ 内置工具）
│   │   ├── components/            #     Forge 组件系统
│   │   ├── memory/                #     记忆系统（短期+长期）
│   │   ├── planning/              #     任务规划与分解
│   │   └── processing/            #     文本处理管道
│   ├── forge/                     #   Forge Agent 构建工具包
│   │   └── sdk/                   #     Forge SDK
│   ├── benchmark/                 #   agbenchmark 测试框架
│   └── frontend/                  #   Web 前端界面
├── autogpt_platform/              # 商业平台版（Polyform Shield 许可）
│   ├── backend/                   #   后端服务（Agent 编排引擎）
│   ├── frontend/                  #   前端（Agent Builder + 监控）
│   └── blocks/                    #   Blocks SDK
├── assets/                        # 项目资源文件
└── docs/                          # 文档

**classic/autogpt/**：经典版核心引擎，包含 Agent 循环逻辑、命令系统、Forge 组件框架、记忆系统、任务规划和文本处理管道。
**classic/forge/**：Forge SDK，提供基于组件-协议（Component-Protocol）模式的 Agent 构建工具包。开发者可以通过组合 Components 来定制 Agent 行为。
**classic/benchmark/**：agbenchmark 测试框架，用于量化评估 Agent 性能，包含标准化的任务集和评分标准。
**autogpt_platform/**：商业化平台代码，包含 Agent Builder（可视化构建器）、后端编排服务、Blocks SDK 和企业级功能（OAuth/SAML、RBAC、审计日志等）。

实操 Demo

AutoGPT 提供两种使用方式：Classic（经典版 CLI） 适合开发者本地运行 Agent，Platform（平台版） 提供可视化 Agent Builder 和 Blocks SDK 用于扩展。下面分别演示。

Demo 1: AutoGPT Classic — CLI 运行自主 Agent

通过一键安装脚本启动 Classic 版，让 Agent 自主完成研究任务。

# 1. 一键安装（自动处理 Python 依赖和配置）
curl -fsSL https://setup.agpt.co/install.sh -o install.sh && bash install.sh

# 2. 配置 LLM API Key
# 编辑 classic/.env 文件，填入你的 API Key：
#   OPENAI_API_KEY=sk-...       （OpenAI）
#   ANTHROPIC_API_KEY=sk-ant-...（Anthropic Claude）
#   或配置本地 Ollama 模型

# 3. 创建 Agent 并设定目标
./run agent create my_research_agent
./run agent start my_research_agent

# 4. 在 Web 界面（http://localhost:8000）输入目标，Agent 将自主执行：
#   "研究 2025 年 AI Agent 市场的发展现状和趋势，
#    生成一份包含市场规模、主要玩家和技术路线的报告"

Agent 自主执行流程：目标拆解为子任务 DAG -> Web 搜索/浏览 -> 信息提取 -> 自我反思 -> 生成报告。内置 Watchdog 防止无限循环，Token 消耗实时可见。

Demo 2: AutoGPT Platform — 使用 Blocks SDK 构建自定义 Block

AutoGPT Platform 的 Blocks SDK（backend.sdk）允许开发者构建自定义 Block，拖入 Agent Builder 画布组成工作流。以下是一个真实的搜索汇总 Block 示例：

"""
自定义 Block：搜索汇总器
基于 AutoGPT Platform Blocks SDK（backend.sdk）构建
功能：接收搜索关键词，调用外部搜索 API，返回汇总结果
每个 Block 是一个独立的可组合单元，可在 Agent Builder 画布中拖拽使用
"""

import uuid
from backend.sdk import (
    APIKeyCredentials,
    Block,
    BlockCategory,
    BlockOutput,
    BlockSchemaInput,
    BlockSchemaOutput,
    CredentialsMetaInput,
    ProviderBuilder,
    BlockCostType,
    Requests,
    SchemaField,
)

# ===================== Provider 配置 =====================
# 在 Agent Builder 中注册 API Provider，供 Block 获取凭据
search_provider = (
    ProviderBuilder("search_api_provider")
    .with_api_key("SEARCH_API_KEY", "Search API Key")
    .with_base_cost(3, BlockCostType.RUN)
    .build()
)


# ===================== 自定义 Block =====================
class SearchAggregatorBlock(Block):
    """从多个搜索源汇总信息的智能搜索 Block"""

    class Input(BlockSchemaInput):
        query: str = SchemaField(description="搜索查询关键词")
        num_results: int = SchemaField(
            description="返回结果数量",
            default=5,
            ge=1,
            le=20,
        )
        credentials: CredentialsMetaInput = (
            search_provider.credentials_field(
                description="搜索 API 凭据"
            )
        )

    class Output(BlockSchemaOutput):
        results: str = SchemaField(description="汇总后的搜索结果文本")
        count: int = SchemaField(description="返回结果总数")
        # error 字段由 BlockSchemaOutput 自动提供

    def __init__(self):
        super().__init__(
            id=str(uuid.uuid4()),
            description="从多个搜索源汇总信息的智能搜索 Block",
            categories={BlockCategory.SEARCH},
            input_schema=self.Input,
            output_schema=self.Output,
        )

    async def run(
        self,
        input_data: Input,
        *,
        credentials: APIKeyCredentials,
        **kwargs,
    ) -> BlockOutput:
        """执行搜索并返回汇总结果（每个 yield 为一个输出字段）"""
        api_key = credentials.api_key.get_secret_value()

        # 调用外部搜索 API
        response = await Requests().post(
            "https://api.search.example.com/v1/search",
            headers={
                "Authorization": f"Bearer {api_key}",
                "Content-Type": "application/json",
            },
            json={
                "query": input_data.query,
                "limit": input_data.num_results,
            },
        )
        data = response.json()

        # 汇总结果
        items = data.get("items", [])
        summary = "\n".join(
            f"- {item['title']}: {item['snippet']}" for item in items
        )

        yield "results", summary
        yield "count", len(items)

Block 开发完成后，通过 Blocks Marketplace 发布，即可在 Agent Builder 可视化画布中拖拽使用，与 LLM Block、HTTP Block、条件分支 Block 等组合成完整工作流。

两种方式对比

方式	适用场景	上手方式
Classic（CLI + `./run`）	个人开发者、快速体验自主 Agent	一条安装命令 + 配置 `.env` 即可
Platform（Agent Builder + Blocks SDK）	企业用户、需要可视化编排和自定义扩展	Web UI 拖拽构建 + `backend.sdk` 扩展 Block

提示： AutoGPT 处于快速迭代阶段，以上命令和 API 基于 2025-2026 年版本。最新用法请查阅官方文档。

特性	AutoGPT	CrewAI	LangChain Agents
定位	全自主单 Agent 任务执行	多 Agent 角色化协作编排	通用 Agent 工程框架
Stars	185,000+	53,600+	139,000+
核心优势	自主性最高，无需持续干预，内置 Benchmark 评估	角色扮演设计直观，多 Agent 协作模式成熟	生态最丰富，LangGraph 图编排灵活度最高
Agent 自主性	极高：自我提示、自动分解任务、自我反思	中等：角色预定义，执行策略可选择	可配置：从简单链到复杂图编排
工具支持	20+ 内置工具，Forge 组件系统，Blocks Marketplace	MCP 支持，工具权限范围控制	生态最丰富，社区集成最多
多 Agent	非设计重点（单 Agent 模式）	核心优势：角色分工、顺序/层级协作	LangGraph 支持任意拓扑的多 Agent 图
适用场景	需要高度自主的研究、数据分析、内容生成等独立任务	需要精细角色分工的团队协作型任务	需要最大灵活性和集成的通用 Agent 应用

参考资源

GitHub 仓库: https://github.com/Significant-Gravitas/AutoGPT
官方文档: https://docs.agpt.co/
Forge SDK 文档: https://docs.agpt.co/classic/forge/
Agent Protocol 规范: https://agentprotocol.ai/
AutoGPT Platform: https://agpt.co/platform
Discord 社区: https://discord.gg/autogpt

目录