1. 文章
1.1 看完 Manus、Cursor 分享后的最大收获:避免 Context 的过度工程化才是关键
-
业内目前共识的一个方法是「上下文卸载(Context Offloading)」,核心思路是别把所有东西都硬塞进 Agent 的短期记忆里,把它卸载出去。放到上下文窗口之外,但在需要时,又能被精确地检索回来。
-
将信息转移到文件系统中,是目前生产级 Agent 中主流、最 Work 的一种做法。
-
Cursor 的做法是,将这些输出直接写入到一个文件,然后在上下文中只告诉 Agent:「结果在output.log里,你自己去看。」Agent 可以先用 tail 命令查看文件末尾,如果需要更多细节,再读取整个文件。
-
Cursor 把完整的聊天历史记录也看做是一个文件。当触发总结时,Agent 会拿到一份摘要,以及一个指向「历史记录文件」的引用。如果 Agent 意识到摘要中缺少某些它需要的细节,它就可以通过搜索这份历史记录文件来找回这些信息。
-
Manus :一套结构化的可逆、缩减系统
- 通过大量的评估,识别出那个「腐烂前」的阈值非常重要,通常是 12.8 万到 20 万个 Token,并将其作为触发上下文缩减的条件。
- 紧凑化(Compaction) Agent 调用了一个向文件写入内容的工具,这个操作在历史记录中可能包含 path 和 content 两个字段。一旦执行成功,那个可能极其冗长的 content 字段就可以被安全地从上下文中剥离,只保留 path。
- 摘要化(Summarization) 在生成摘要之前,系统会更激进地将整个摘要前的完整上下文,转储(Dump)到一个文本或日志文件中。 相当于给历史创建了一个完整的快照存档。如果模型足够聪明,它甚至能用 grep 或 glob 自己去这个日志里捞数据。
- 通过「紧凑化」(Compaction)剥离可重建信息,以及在「摘要化」(Summarization)之前,将完整的上下文转储(Dump)到日志文件中。实现上下文缩减。
-
Cursor:把工具说明书,全部文件化
- Cursor 的策略,更简单、粗暴。把所有 MCP 工具、Agent Skills 的详细定义,全部都同步到文件夹里,让 Agent 在需要时自己去查阅。
- 索引层,Agent 的系统提示词(System Prompt)里只包含一小部分静态信息,比如 MCP 工具或 Agent Skills 的名称列表。这些工具和技能的详细描述、参数定义、使用方法,则被全部同步到一个本地文件夹中。当模型需要时,Agent 会像一个聪明的程序员一样,进入发现层,用 grep 或语义搜索,主动去文件夹里查找它需要的工具的详细信息,然后拉取到上下文中来处理。
-
两种 Agent 协作模式
-
任务委托模式:「通过通信」实现隔离
- Manus 将这种模式叫做「Agent 即工具」。从主 Agent 视角,它只是调用了 advanced_search 函数,但背后实际上是另一个拥有独立工作流的子 Agent 在执行。
-
信息同步模式:「通过共享上下文」实现协作
- 通过共享上下文来实现协作。子 Agent 被创建时,能够看到主 Agent 完整的先前上下文,包括所有的历史工具调用和观察。但这个子 Agent 拥有自己独立的系统提示词和新的行动空间。
-
-
Cursor 的「Dynamic Context Discovery」,强调:少即是多。Cursor 认为,在最开始提供给模型的细节越少,效果反而越好,因为能让 Agent 更轻松地自行抓取相关的上下文。Manus 的思路是:「少构建,多理解」,避免上下文的过度工程化。上下文工程的目标是让模型的工作变得更简单,而不是更难。
1.2 AI Coding 长文分享:如何真正把工具用起来,从原理到实践
-
Cursor 调用 LLM 的 Prompt
- 它其实跟我们平时写代码调用模型是很相似的,但是在工具调用、上下文获取上都有针对Coding领域非常细节的定制化。
1.3 Openclaw 背后的技术架构,记忆出奇的简洁
-
架构流程 - 六步处理链路:
- Channel Adapter — 标准化不同渠道的消息格式
- Gateway Server — 核心协调器,路由到正确会话
- Agent Runner — 选择模型、组装提示词、管理上下文
- LLM API Call — 流式调用,支持多提供商
- Agentic Loop — 工具调用循环,默认最大 ~20 轮
- Response Path — 返回响应,持久化会话
-
内存系统出乎意料地简单:
- 会话历史:JSONL 文件
- 长期记忆:Markdown 文件(MEMORY.md)
- 检索:SQLite 向量搜索 + FTS5 关键词
- 写入方式:无专门 API,智能体直接用文件写入工具写 Markdown。
- 特点:无记忆合并、无压缩、无遗忘曲线,新会话开始时自动生成上次对话摘要。
1.4 大模型网关:大模型时代的智能交通枢纽|得物技术

1.5 从 Markdown 到智能体:解密 Clawdbot Skill 插件架构



执行流程全景
- 加载阶段:从 5 个目录收集所有SKILL.md
- 文件解析阶段:提取 frontmatter 元数据和调用策略
- 过滤阶段:根据依赖、环境变量、平台等条件筛选
- 注入阶段:将符合条件的技能格式化后注入 System Prompt
- 执行阶段:AI 根据用户请求,参考技能文档执行相应操作
设计亮点总结
- 声明式定义:用 Markdown + YAML 定义能力,降低了扩展门槛
- 智能过滤:只加载真正可用的技能,避免 AI 产生"幻觉"
- 分层覆盖:支持多级目录,用户可自定义覆盖默认行为
- 渐进式依赖:技能可以声明安装方式,引导用户补齐依赖
- 远程代理:突破单机限制,实现跨设备能力共享
1.6 1.8亿token,Clawdbot是这么吞掉的~
System Prompt 结构分解(约14,000 tokens)
├── 核心身份定义 (~500 tokens)
│ └── "You are Moltbot, a personal AI assistant..."
├── 工具定义列表 (~8,000 tokens) ← 最大开销来源
│ ├── bash工具 (400 tokens)
│ ├── browser工具 (500 tokens)
│ ├── file_system工具 (450 tokens)
│ ├── memory_search工具 (300 tokens)
│ └── ... (20+ 个工具,每个300-500 tokens)
├── Skills元数据 (~1,500 tokens)
├── 引导文件注入 (~2,000 tokens)
│ ├──
AGENTS.md
│ ├──
SOUL.md
│ ├──
TOOLS.md
│ └──
USER.md
├── 运行时元数据 (~500 tokens)
│ ├── 当前时间/时区
│ ├── 主机信息
│ └── 模型配置
└── 回复格式指令 (~1,500 tokens)
这个里面暴露的问题就是上面cursor和Manus去解决的问题
1.7 AGENTS.md 在我们的经纪人评估中表现优于其他技能型经纪人 - Vercel — AGENTS.md outperforms skills in our agent evals - Vercel
- 通过
AGENTS.md文件提供的文档索引方法,可以确保 AI 在每次交互时都能访问到相关的文档信息,从而提高了性能。
1.8 OpenAI:一套PG搞定8亿 ChatGPT 用户
- PostgreSQL 在读多写少的场景下,能够可靠伸缩到的规模,远远超出许多人的认知。
- 一台主库(Azure PostgreSQL 灵活服务器实例[3])配合近 50 个分布在全球多个区域的只读副本, 就支撑起了海量的全球访问流量。
2. 项目
2.1 ronitsingh10/FineTune: FineTune, a macOS menu bar app for per-app volume control, multi-device output, audio routing, and 10-band EQ. Free and open-source.
ronitsingh10/FineTune
FineTune, a macOS menu bar app for per-app volume control, multi-device output, audio routing, and 10-band EQ. Free and open-source alternative to SoundSource.
FineTune 是一个用于 macOS 的菜单栏应用程序,提供每个应用程序的音量控制、多设备输出、音频路由和 10 频段均衡器等功能,是一个免费且开源的 SoundSource 替代品。

2.2 workany-ai/workany: Desktop Agent for Any Task
workany-ai/workany
Desktop Agent for Any Task
workany-ai/workany 是一个开源的桌面 AI 助手应用程序,支持通过自然语言执行任务,提供实时代码生成、工具执行和工作空间管理功能。


2.3 thedotmack/claude-mem
thedotmack/claude-mem
A Claude Code plugin that automatically captures everything Claude does during your coding sessions, compresses it with AI (using Claude's agent-sdk), and injects relevant context back into future sessions.
Claude-Mem 是一个为开发者提供的插件,它能够在 Claude Code 的会话中自动记录和保存项目的上下文信息,从而实现跨会话的知识连续性。

2.4 Canner/WrenAI
Canner/WrenAI
⚡️ GenBI (Generative BI) queries any database in natural language, generates accurate SQL (Text-to-SQL), charts (Text-to-Chart), and AI-powered business intelligence in seconds.
Canner/WrenAI 项目是一个开源的 Generative BI (GenBI) 代理工具,它能够通过自然语言与任何数据库交互,自动生成准确的 SQL 查询和图表,以及利用 AI 技术提供商业智能分析。

2.5 HKUDS/nanobot: “🐈 nanobot: The Ultra-Lightweight Clawdbot”
HKUDS/nanobot
"🐈 nanobot: The Ultra-Lightweight OpenClaw"
HKUDS/nanobot 项目是一个专注于简洁和高效的个人 AI 助手,它以其极少的核心代理代码行数(约 4000 行),与 Clawdbot 相比小了 99%,为研究人员和技术爱好者提供了一个轻量级的工具。

2.6 alibaba/OpenSandbox: OpenSandbox is a general-purpose sandbox platform for AI applications, offering multi-language SDKs, unified sandbox APIs, and Docker/Kubernetes runtimes for scenarios like Coding Agents, GUI Agents, Agent Evaluation, AI Code Execution, and RL Training.
alibaba/OpenSandbox
Secure, Fast, and Extensible Sandbox runtime for AI agents.
Alibaba 的 OpenSandbox 项目是一个针对 AI 应用的通用沙盒平台,它支持多种编程语言的 SDK,包括 Python、Java/Kotlin 和 JavaScript/TypeScript。该平台提供了统一的沙盒生命周期管理 API 和沙盒执行 API,允许用户扩展自定义的沙盒运行时。OpenSandbox 内置了对 Docker 和 Kubernetes 运行时的支持,既支持本地运行也支持大规模分布式调度。平台提供了命令、文件系统和代码解释器的实现,以及丰富的示例,如编码代理、浏览器自动化和桌面环境等。
阿里重磅开源!OpenSandbox:专为 AI Agent 打造的下一代沙箱
2.8 HKUDS/DeepTutor: “DeepTutor: AI-Powered Personalized Learning Assistant”
HKUDS/DeepTutor
"DeepTutor: AI-Powered Personalized Learning Assistant"
DeepTutor 是一个个人学习助手,集成了海量文档知识问答、交互式学习可视化、知识强化与练习题目生成器、深度研究与想法生成等核心功能。开源版的NotebookLM

2.9 docling-project/docling: Get your documents ready for gen AI
docling-project/docling
Get your documents ready for gen AI
docling-project/docling 项目旨在简化文档处理流程,支持多种文档格式,包括 PDF、DOCX、PPTX、XLSX、HTML、WAV、MP3、VTT 及各种图片格式等。项目提供了一个统一的文档表示格式 DoclingDocument,以及多种导出格式,如 Markdown、HTML 和 JSON。
并且提供了与 LangChain、LlamaIndex、Crew AI & Haystack 等 agentic AI 的集成。项目还支持 OCR 识别、ASR 模型以及 Visual Language Models(VLMs)。

3. 资源
3.1 Claude Code in Action
Skilljar 是一个专门为 Anthropic 课程内容提供服务的学习管理系统。通过它,用户可以登录访问 Anthropic 的课程材料
评论