LangChain

LangChain Deep Agent 快速入门
May 13, 2026 / May 18, 2026 --- · 22 min read · LangChain LLM ·
Share on:
前面差不多历经了 LangChain 学习和组件的以下底，中, 高三个阶段
- 底层的 LangGraph 的 GraphState, 是 LangChain 的基石，做一个 AI Agent 的内部表现形式就是一个状态图
- LangChain 的 init_chat_model(), Prompt Engineering, 用于一次性的与模型的对话，想要实现短长期记忆，工具调用，实现起来很麻烦，就得前进到下一层
- LangChain 的 create_agent()， Context Engineering, 有了开箱即用的短长期记忆，自动的工具调用，Human-in-the-loop, 并且也可以实现多 Agent
- DeepAgents 的 create_deep_agent(), Harness Engineering, 要做一个完备功能的 Agent 就得靠它了，它自动提供了像计划，自动管理上下文支持 Skills, 内置工具，需要处理复杂任务时自动启动子 Agent
下面就来探索一下它的内置的功能, 先分析一个最简单的例子看看背后发生了什么
依赖安装: uv add deepagents langchain-ollama
deepagents 会连带安装 langchain, langchain-anthropic, langchain-google-genai 和 wcmatch。langchain 会安装它的传递依赖，像 langchain-core, langgraph 之类。langchain-ollama 用来使用本地 Ollama 模型的。
Read More
LangChain 高级用法之多 Agent 协作
May 5, 2026 / May 18, 2026 --- · 9 min read · LangChain LLM ·
Share on:
在往 Deep Agents 的路径还要继续啃下一些基础知识，其中之一就是多 Agent 协作(Multi-agent)。复杂的系统需要多个 Agent(智能体)同共完成, 不那么复杂的系统可以用动态的 Prompt, Tool, 或 Model 来切换。多 Agent 的好处是每个 Agent 有自己的上下文，工具，专业领域的知识，可以独立开发，分布式部署，多个 Agent 能并行执行，加速工作与烧钱的速度。
LangChain 在构建多 Agent 系统时，有以下几种常见模式：
1. Subagents(子 Agent): 主从 Agent 方式，子 Agent 作为主 Agent 的工具使用，由主 Agent 指挥子 Agent 干活
2. Handoffs(任务交接): 任务可转交给(以 Tool 方式)其他 Agent，其他 Agent 的结果可直接返回给用户, hand off 就是传球的意思
3. Skills(技能): 动态加载特定的 Prompt 和知识，用单一 Agent 控制按需加载技能，本质上它是单 Agent
4. Router(路由)：由一个路径控制任务如何分配给不同的 Agent，结果汇集成一个组合的响应
5. Custom workflow(自定义工作流)：用更底层的 LangGraph 定制工作流程，以上模型均可嵌入到工作流中
下面贴上每种类型的组件和时序图(顺便给自己的 Hugo 加上 tabs 标签页功能，以方便对比切换和节约滚动条)
Read More
LangChain 核心组件之 Streaming
May 4, 2026 / May 18, 2026 --- · 14 min read · LangChain LLM ·
Share on:
一接触 LangChain 就有种停不下来的感觉，在 Deep Agents 与底层的 LangGraph 之间，还是想把 LangChain 的核心组件搞明白一些，本文是学习 Streaming 的笔记。Streaming 给人的第一印象就是用 ChatGPT 聊天时机器回复时是一个字一个字蹦出来的，因为这就是 LLM 的思维方式，不断的预测下一个 Token.
有个疑问: 这种预测下一个 Token 方式, 中国产的 LLM 放到 Ollama 中运行是怎么实现的过滤敏感词的呢？
前端一个字一个字蹦出来的效果反应到后台 API 响应(以 Ollama 为例)格式是 Content-Type 为 application/x-ndjson，这种格式是 Newline Delimited JSON，即每行是一个 JSON 对象，以 \n 分隔, Transfer-Encoding 为 chunked，表示数据是以分块传输的，所以客户端只要一个个 Chunk 的输出就是那种效果了。
从 LLM 的那种流式(Chunk)输出也能体会出 Markdown 在逐字显示内容时的优势，自上而下，自然而然的清晰结构。
下面是 LangChain 中使用 ChatOllama 模型时，服务端响应数据的片断：
Read More
LangChain 实战 - 使用 On-demand Skills
May 3, 2026 / May 18, 2026 --- · 6 min read · LangChain LLM ·
Share on:
Prompt, Context, Function Calling (Tools), MCP, Agent Skills, Harness, Vibe Coding, 随着 AI 新名词不断的涌现, 对 Tools, MCP 应该比较熟悉了，为了避免自己更早的变成 同事.skill，将参考 LangChain 官方的实战 Build a SQL assistant with on-demand skills 来学习来理解什么是 Agent Skills 以及它的工作原理。
在刚听到 Agent Skills 这个概念的时候，对它的模糊理解是参考 Tools 是本地工具，MCP 是远程工具，它们都是在 Prompt 中把工具的名称，描述，以及参数列表发给了模型，模型会按需通知 Agent 调用相应的工具(本地 Tool 或远程 MCP Tool); Agent Skills 大约是在 Prompt 只包含每个 Skill 的名称与描述，模型会进一步按需加载相应 Skill 中的工具，然后指导 Agent 调用这些工具。Agent Skills 即按需加载的工具，无需在一个 Prompt 中包含所有工具的 Schema.
下面通过参考 'Build a SQL assistant with on-demand skills' 并实践来验证上面的初步猜想。
Read More
LangChain 与 Mem0 集成长期记忆
May 3, 2026 / May 18, 2026 --- · 7 min read · LangChain LLM ·
Share on:
LangChain 的长期记忆可以在创建 Agent 时指定 store 参数，如 create_agent(store=InMemoryStore()), 但它只是把 Agent 与 store 关联了起来，仅此而已，要让长期记忆生效的话必须选择适当的时机，用 Middleware 或 Tool 手动的对 store 进行 get(), put, search() 等操作。而短期记忆则不同，只要 create_agent(checkpointer=InMemorySaver()) 就让 Agent 具有了短期记忆能力。
在使用 store 的时候，无论是使用 InMemoryStore 还是 PostgreSQLStore 等，历史会话的保存与召回还有很多讲究的地方，例如哪些消息需要保存，消息如何保存(是否要向量化)，新旧消息如何处理等。
Mem0 是一个为 AI Agent 提供长期记忆能力的开源框架，它的核心思路是利用大语言模型(LLM)把对话内容转化为结构化的 事实 存入向量数据库，并通过 LLM 动态维护这些事实的增删改。Mem0 在存入时会不存入原文，而是用 LLM 抽取事实，更新时能与旧记忆合并，删除矛盾记忆，记忆查询也是把文本转换成向量后进行相似度匹配。向量检索擅长语义模糊匹配，关系推理时 Mem0 1.1 之后引入了图记忆(如用 Neo4j 图数据库)作为补充。提供 MCP 协议支持不同 AI 应用间的记忆共享与互通。
Read More
LangChain 核心组件之 Messages
Apr 29, 2026 / May 18, 2026 --- · 6 min read · LangChain ·
Share on:
经历了一番 LangChain 的学习之后，现在能更好的理解 LangGraph, LangChain 以及 Deep Agents 之间的关系了
- LangGraph: 是该家族的底层实现,代表是 StateGraph
- LangChain: 1.0 后不再是 Chain，而是 Graph, 代表是 init_chat_model() 和 create_agent(), 前者与模型完成单次请求/响应,
  后者能与模型进行完整会话，包括工具的自动调用
- Deep Agents: 是 LangChain 的高级应用，代表是 create_deep_agent(), 在 create_agent() 之上还能进行自动的规划
学习过一些基本的和高级概念, 如 Agents, Models, Shot-term memory, MCP, Human-in-the-loop, 以及 Long-term memory 之后,
再一次回到 Agent 与模型交互的原点上来，即 Messages. 我们将学习两个层面的消息表示：
1. Agent 与模型交互时 Python 层面的消息表示，LangChain 与模型无关的消息格式
2. Agent 与模型交互时 HTTP 协议交互层面的请求/响应消息
本文依然以本地 Ollama 模型/服务为例，HTTP 响应数据都是一个个 Chunk, 每个 Chunk 是一个 JSON 对象，包含一两个 Token, 我们会直接提取整个响应的 Token 数据，同时会关掉 Reasoning(不希望产生 Thinking 的响应)。
Read More
LangChain 高级用法之长期记忆
Apr 28, 2026 / May 18, 2026 --- · 6 min read · LangChain LLM ·
Share on:
关于短期记忆已写过两篇 LangChain - 关于会话记忆和 LangChain 核心组件之短期记忆. 有短期记忆就有长期，记忆的短与长的区分标准是看记忆是否能跨越会话，与选择的存储介质, 时效性，中途模型切换都无关。知期记忆限定在同一个会话当中，只要没跨会话，即使是一年前聊过的天，重新拣起来继续聊也是短期记忆; 而长期记忆是专指跨越会话的，在一个会话中聊过的，重开一个新的会话，Agent 还能知道你在别的会话中聊过的内容, 这就是长期记忆。即便这种记忆用内存保存数据，Agent 重启数据会丢失，但只要能跨会话就是长期记忆。
所谓的会话就是像 ChatGPT, Claude 桌面应用对应的 Chat, New chat 就创建了一个新的会话，短期记忆局限于同一个 Chat, 长期记忆则跨越 Chat。同一个会话中聊天，Agent 的回答一直有当前会话上下文中，是好理解的。长期记忆则是无论你 New chat 重开了一个新的 Chat，Agent 都知道你在其他会话中聊过什么。
现在的 ChatGPT 和 Claude 都具有了长期记忆，这带来一个恐怖的事情，随着你使用它们的时间越来越长，AI 可能比你还更了解你，它有了你的隐私，能描绘你的性格，甚至能预测你的下一步行动。看来不想 AI 介入的太多，难道要经常切换着帐号来使用某个 AI 工具？还得探索能不能要求删除长期记忆。如果它们像广告那样粘住你的设备与 IP 就更可怕了。
Read More
LangChain 高级用法之人在回路
Apr 27, 2026 / May 18, 2026 --- · 5 min read · LangChain LLM ·
Share on:
Human-in-the-loop 按字面意思译为 人在回路, 或 人在循环中, 还是第一种译法更雅一些。从行为上来说 人工介入 更能表达它的意图，而 人在回路 听来让我回想起了 80 年代的一部电视连续剧《人在旅途》。人在回路 在 Agent 中很常见, 对于用户安全是必须的，只要是像 Claude, Copilot 那些编程 Agent 想要调用 bash, 或创建文件时都会有提示让用户介入, 比如在 Claude 控制台中让它创建一个 hello.txt 文件，立即就是下面熟悉的提示
1 Do you want to create hello.txt? 2╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌╌ 3 ❯ 1. Yes 4 2. Yes, allow all edits during this session (shift+tab) 5 3. No 6 7 Esc to cancel · Tab to amend
也就是 Agent 在碰到某些敏感性的工具调用之前会停下来让人 Review 作出决策，是准许，拒绝，还是进一步编辑工具调用(更改工具名称或参数)。 LangChain 通过中间件和 interrupt 把控制权从 agent.invoke() 中让出来，人工决策后，再用 agent.invoke() 向模型发送 resume 的消息，多个 agent.invoke() 都处在同一个会话当中，所以我们需要用到短期记忆。
Read More
LangChain 高级用法之 MCP
Apr 23, 2026 / May 18, 2026 --- · 15 min read · LangChain LLM ·
Share on:
LangChain 1.0 于 2025 年 10 月 22 日发布，这是一个里程碑式的版本，听说在 0.x 要创建一个 agent 很麻烦，那时候内部是真正的 链， 1.0 后虽然还叫 LangChain, 实际上内部实现是图(LangGraph), 用 create_agent() 创建 agent. 从数据结构来看，图 比 链表 更能直观的表达 Agent 与模型及工具的交互场景。很庆幸在 LangChain 1.0 之后才开始学习这个框架，不用体验 LangChain 0.x 的痛苦。
大概对 LangChain 的 tools 有些许了解之后，现在跳到 Model Context Protocol(MCP) 协议这一章，本人对 MCP 的初步理解是相对于工具， MCP 是一个远程(跨进程)的工具。为了方便的使用互联网上的各种资源，MCP 在实现一个完备的 Agent 也是一个非常重要的工具。
Model Context Protocol (MCP) 是 Anthropic 推出并开放的协议，用于构建 Agent 与外部资源的交互,下面会与工具对照着学习它. 以前也写过一篇关于 MCP 的文章，今天从不同的角度再次强化对 MCP 的理解。
在 LangChain 中要使用 MCP 需安装 langchain-mcp-adapters 依赖，然后使用它的 MultiServerMCPClient, 它是无状态的。要创建自己的 MCP 服务，使用 FastMCP 库。
Read More
LangChain 核心组件之短期记忆
Apr 21, 2026 / May 18, 2026 --- · 26 min read · LangChain LLM ·
Share on:
学习了 Agent, Models 之后直接跳到 Short Term Memory 节，短期记忆能让我们更好的理解与模型的交互, 为什么与机器人越聊到最后它可能就偏离主题，智商降低了。前面所用的手动拼接整个会话历史和使用 InMemorySaver 就是模型的短期记忆，如果会话历史过长，超过上下文件大小，导致上下文丢失或错误，这就需要对会话进行压缩，压缩做了些什么事情呢，这就是本文要学习的内容。
之前写过一篇 LangChain - 关于会话记忆, 也是关于短期记忆的，这里重新阅读官方的文档，也是加以巩固。
模型是没有记忆的，所有你和模型说过的话你都必须记住，记忆就是让 Agent 记住你与模型的会话历史，短期记忆特指单一会话的历史。短期记忆与长期记忆这两个概念总会让人有所迷惑的，简单的可以这么理解，比如使用 ChatGPT 时
1. 在同一个 Chat 中的对话就是短期记忆，即便你一年后再回到那个没有删的 Chat 中接着聊，也是短期记忆
2. 而长期记忆是跨会话的，比如在某个 Chat 中说过喜欢猪头饭，再点 New chat 打开一个新的 Chat，问今天吃什么，模型直接建议吃猪头饭，这就是长期记忆
还是那句话，大语言模型是没有记忆的, 和大语言模型对话就像和一个失忆症的人对话, 每次问话都必需把之前的对话复述一遍, 过程相当于:
Read More
- 1
- 2