隔叶黄莺 Yanbin's Blog - 软件编程实践

Java 24 新特性学习
Apr 12, 2026 / Jun 8, 2026 --- · 7 min read · java 24 ·
Share on:
Java 24 也是一个过渡版本, 还是到下面两个链接中找相应的更新
1. JDK 24 Release Notes - Major New Functionality
2. OpenJDK JDK 24 Features
IntelliJ IDEA 对 Java 24 Language level 描述是
1. 24 - No new language features
2. 24 (Preview) - Flexible constructor bodies, simple source files, etc.
把上面第二个链接中的特性列出来
404: Generational Shenandoah (Experimental)
450: Compact Object Headers (Experimental)
472: Prepare to Restrict the Use of JNI
475: Late Barrier Expansion for G1
478: Key Derivation Function API (Preview)
479: Remove the Windows 32-bit x86 Port
483: Ahead-of-Time Class Loading & Linking
484: Class-File API *
485: Stream Gatherers *
486: Permanently Disable the Security Manager
487: Scoped Values (Fourth Preview)
488: Primitive Types in Patterns, instanceof, and switch (Second Preview)
489: Vector API (Ninth Incubator)
490: ZGC: Remove the Non-Generational Mode
491: Synchronize Virtual Threads without Pinning
492: Flexible Constructor Bodies (Third Preview)
493: Linking Run-Time Images without JMODs
494: Module Import Declarations (Second Preview)
495: Simple Source Files and Instance Main Methods (Fourth Preview)
496: Quantum-Resistant Module-Lattice-Based Key Encapsulation Mechanism
497: Quantum-Resistant Module-Lattice-Based Digital Signature Algorithm
498: Warn upon Use of Memory-Access Methods in sun.misc.Unsafe
499: Structured Concurrency (Fourth Preview)
501: Deprecate the 32-bit x86 Port for Removal
Java 24 中列出的特性恰如其版本一样，有 24 条，因其是一个过渡版本，多数为非正式特性，也就为什么 IntelliJ IDEA 从语言特性上把 Java 标记为 No new language features. 其实也不然，个人觉得有两个正式特性值得关注，即 Class-File API 和 Stream Gathers。
Read More
LangChain - 关于会话记忆
Apr 10, 2026 --- · 5 min read · LangChain ·
Share on:
所谓大语言模型的记忆功能，就是要在说当前这句话的时候让 LLM 知道整个对话的上下文。比如说与人对话
1. A: 给我讲个笑话
2. B: 有一天，有人问你：“你喜欢什么？”, 你回答：“我喜欢一切……只要不叫‘考试’。” 😄 够快，够短，有没有让你会心一笑？
3. A: 再来一个
4. B: 问：海里面最怕什么？ 答：脱水。
#3 当 A 问 "再来一个" 时候，B 因为有基于前面对话的上下文，所以能理解 "再来一个" 来一个笑话，而不是一个妞什么的，也记得曾经讲过一个笑话，而不至于重复之前的笑话。如果突然有一天 A 对 B 突兀的说 "再来一个"，B 就会有些傻眼了，AI 在没有上下文的情况也是一样。
不过人与人之间对话的上下文是互相的，两方的共同记忆，双方都是建立在你知道我问了什么，你自己回复了什么的基础之上的。而于大语言模型的对话时，大语言模型是没有记忆的，就好像和一个失忆的人对话一样，记忆责任全在一方，你和 LLM 每一次对话时都要不停的唠叨：
我曾经问了这个，你回复过那个，问过这个，你回复过那个......，我现在问一个问题，请基于我们的会话历史作出回答
和机器对话就是这么傻傻的，当对话历史过大的时候因为上下文大小限制的原因，就必须压缩总结之前的对话内容，压缩后总会失真，这就是为什么大语言模型会不断降智的一个原因。
Read More
为什么 OpenClaw 会狂烧你的 Token
Apr 9, 2026 / Jun 8, 2026 --- · 19 min read · OpenClaw ·
Share on:
前段时间 OpenClaw 确实很火，尤其是在中国，它在 2025 年 11 月上线后，最初名字是 Clawbot, 中间更名为 Molbot, 最后定名为 OpenClaw. 我在它真正火热当中并没有产生多大兴趣去跟风，只最近一个月想看看它到底是个什么东西。弄了个虚拟机装上后，就是可以连接各个大模型，打通与国外流行的即时通讯软件，能自动化的就是它的 Cron Jobs.
界面上功能不少，最后发现真正有用的就是那个 Cron Jobs, 比如自己设置了一个每日两次的定时任务，实现的是从监控一个猫收容网上的列表，当发现有新的猫就发送到指定的 Telegram Bot 上，描述很简单，但 Agent 确实很聪明，不用告诉它细节，它自己知道怎么本地文件来辅助判断是否为新猫。聪明的另一个原因是 OpenClaw 蹭了我 $20 Claude 会员的光。但到 4 月 4 日，Claude 订阅会员不让绑定到 OpenClaw 之后，试用了 Google 免费的 API Key 不怎么理想。
也不想再多折腾，如果只是要一个 Cron Job 的话可以自己用 LangChain 实现一个。听说 OpenClaw 十分耗 Token, 于是对它的提示词有点好奇。本文将查看一下一个新鲜的 OpenClaw 的提示词长什么样子。
于是又新装了一个 OpenClaw v2026.4.9 版本，使用本地的 Ollama 模型，由于未能成功设置 OpenClaw 使用代理来访问 Ollama API，于是在 Ollama service 前端放了一个反向代理，该反向代理也是临时用 Vibe Coding 搓出来的。让 OpenClaw 使用通过反向代理 http://localhost:9091 来访问实际的 Ollama http://localhost:11434, 并在反向代理中记录下对 Ollama API 完整的请求与响应数据，使用什么模型都无所谓。
Read More
LangChain Quick Start AI Agent 分析
Apr 8, 2026 --- · 7 min read · LangChain ·
Share on:
上一篇 LangChain 1.2 入门学习中使用了特定的 ChatOllama/ChatGoogleGenerativeAI, 或统一的 init_chat_model 方式创建一个与 LLM 的交互程序，并以此基础实现了一个简单的 AI Agent, 工具调用是根据响应中消息格式手工调用的，会话处理是自己拼接全部对话历史。现在知名的 LLM 都支持推理，所以顺代也用灰色字体显示了 'thinking' 的文本内容。
本文直接学习官方 Quickstart 中的一个 AI Agent, 该 Agent 实现了以下功能
1. 有了上下文，会记忆会话历史
2. 支持调用多个工具
3. 提供结构化一致性的响应数据格式
4. 能通过上下文处理用户特定的信息
5. 跨交互维护会话状态
Read More
LangChain 1.2 入门学习
Apr 7, 2026 --- · 9 min read · LangChain ·
Share on:
AI 界日新月异，新名词层出不穷，像 Prompt Engineering, Context Engineering, 到如今又来了 Harness Engineering. 现在最怕两个人出来搞事情， Dario Amodei 和 Andrej Karpathy, 前者宣称 AI 可替代一切，人变得一文不值，后者专造名词。在大语言模型时代，搞机器学习了，专注模型的不用多少人，多数人还能在 AI 上蹭热点的话就剩下 AI Agent 的这个赛道了，其余就是应用了，例如 Vibe Coding，或更贴近具体业务的应用。
像各大 AI 编程工具，如 Codex, Claude Code, OpenCode, GitHub Copilot， Gemini, Cursor, Antigravity, Trae 本质上都是在比拼各家 AI Agent 的能力。最近火的那个 OpenClaw 也是一个学习 AI Agent 的好范例。
而 AI Agent 方面的框架首当其冲就是 LangChain, 它提供了 Python 和 TypeScript 两种语言的支持，网上有人做了个 langchain4j, 这种跟随项目恐怕也坚持不了多久。其他 AI Agent 框架有 [Pydantic AI]，微软的 AutoGen, Crew AI, AWS Strands Agents. 各大语言模型 OpenAI, Anthropic, Gemini 都有自己的 SDK, 但要开发一个 Multi Agent 的系统更需要一个第三方的 AI Agent 框架来整合各家模型的能力，提供统一的接口和工具，这个框架就是 LangChain.
Read More
一个简单的 C++ 实现的 gRPC 服务
Mar 29, 2026 --- · 3 min read · gPRC ·
Share on:
上一篇使用 Spring 的 gRPC 服务学习了如何用 Java SpringBoot 4 + Spring gRPC 实现服务端与客户端，并且用 Postman 和 grpcurl 命令测试了如何访问 Java 实现的 gRPC 服务，其中还用 Wireshark 抓包工具进一步验证了 gRPC 的通信方式是 Protobuf Over HTTP/2。
完后又突然对 C++ 实现一个 gRPC 服务产生了兴趣，因为现实项目是想要把 C++ 动态库的调用代码独立为一个进程，这时候直接用 C++ 代码调用 C++ 动态库就是最简单直接的方式，不存在任何数据结构的转换。把这部分实现为一个 C++ 的 gRPC 服务，然后由 Java 的 gRPC 客户端来调用。
下面来看这样一个简单的例子，在 C++ 只实现一个只包含一个同步的 gRPC 的服务，测试将用 grpcurl 命令和 Postman，并且也用 Wireshark 抓包工具验证 gRPC 的通信方式是否依然是 HTTP/2, Protobuf 数据编码肯定没得说了。
Read More
使用 Spring 的 gRPC 服务
Mar 29, 2026 --- · 8 min read · gRPC SpringBoot ·
Share on:
人们在跨语言, 跨进程通信方面采用过不少的方案, 交换文件, CORBA, SOAP, 最后得到最广泛应用的是 RESTful API, 交换格式通常用文本格式的 JSON 和 XML. 但作为更高效的通信还是二进制格式, 在 Java 方面, 有过 Java 内置的 RMI, Spring 的 Hessian, Dubbo. 而发展到今天 gRPC 受到了更多的关注, gRPC 的通信协议是 HTTP/2, 编码格式是 Google 高效的 Protobuf.
gRPC 是由 Google 发起的一个远程调用框架, 是 gRPC Remote Procedure Calls 的缩写, 各处的解释是 g 最初是代表 Google, 现在只是像 YAML Ain't Markup Language 类似的命名, 说 g 不再代表 Google, 怎么听起来有点既要又要的感觉, 怎么都会认为 gRPC 为 Google 的 RPC.
总之, gRPC 是一个高性能的开源统一的 RPC 框架, 能叫做统一是因为它支持多种语方, 如 Go, C++, Java, Python, Node, C#, PHP 等, 多语言支持是由 Protobuf 格式决定的, 总之它是 Protobuf over HTTP/2, 实现上是用 Protobuf 定义数据结构与服务方法, 再映射成不同语言的代码实现. gRPC 已然成为了 RPC 的标准, 真正意识到它的不一般是在 Postman 中发现了它, 可见其在业界受不到了应用的重视.
Read More
Java 22 - Foreign Function Memory API 与 JNA
Mar 23, 2026 --- · 6 min read · JNI ·
Share on:
Java 22 正式引入了 Foreign Function & Memory API, 简称 FFM API, 它源自于 Project Panama, 旨在用来替代 JNI, 提供更安全，健壮的本地动态库调用方式。之前在一文 Java 22 新特性学习中跳过了对它的体验，因为直接用 FFM API 来调用本地代码的话，写起来比 JNI 还更复杂，更别提和 JNA 对比，性能上 FFM API 大致与 JNI 相当，但总比 JNA 要好些，原因是 JNA 使用了一个与系统相关的中间层动态库。像这种调用本地代码的场景，性能的差异基本体现在本地代码上，调用过程的性能差异一般可以忽略不计.
那时没深入 FFM API 的原因是它用起来过于复杂，这种复杂性应该由第三方库来屏蔽，可是自 Java 22 于 2024-03-19 发布以来目前仍未找到一款类似于 JNA 屏蔽了 JNI 那样的基于 FFM 的第三方库。所以还是事先来体验一下 FFM API 的开发过程，现在可以借助 AI 来引导学习, 并在后面与 JNA 作个性能对比，只供参考。
Read More
简单例子用 Python + PostgreSQL 演示 RAG
Mar 19, 2026 --- · 5 min read · AI RAG PostgreSQL Python ·
Share on:
RAG(Retrieval-Augmented Generation) 中文名为检索增强生成, 在 LLM 更早期火过的概念，因为那时候上下文较小，所以要检索 LLM 中没有内容(私有数据) 须先在本地用相关性算法找到一些相关的片断，拼接到输入提示词中发送给 LLM。而目前上下文都达到 1M 以上的级别，一次会话甚至可以把私有的内容全部塞提示词中而喂给 LLM, 就不必用 RAG, 而且内容更完整. 比如你可以把整部小说内容让 LLM 去阅读，然后根据输出总结，或讨论关于该小说的各种问题。像现在的 Agent Skills 的 Reference 就会把一大段内容丢给 LLM.
所谓的检索(Retrieval) 即在与 LLM 交互之前，从本地(如向量数据库)中找到一些相关的片断，拼接到提示词中，以此达到增强内容生成的效果.
这里不去讨论 RAG 是否已死的问题，只想简单的用 Python, PostgreSQL 加 pgvector 扩展来体验一下什么是 RAG, 以及它的基本流程是什么样子的. 并且对向量数据库中是如何存储和检索的.
Read More
AWS ECS 使用 EC2 Capacity Provider (Managed Instances)
Mar 10, 2026 --- · 6 min read · AWS Linux ·
Share on:
上篇 AWS ECS 使用 EC2 Capacity Provider (EC2 Auto Scaling) 学习了如何在 ECS 中使用 Capacity Provider + EC2 Auto Scaling 来部署一个简单的 Web 应用，以及了解 ECS 如何管理 EC2 的 Auto Scaling Group.
ECS Capacity Providers 是于 2019 年 12 月发布的，随同的功能支持了 Fargate, Fargate Spot, 和 EC2 AutoScaling. 而 Managed Instances 在 2025-09-30 才加入的新特性，见 Announcing Amazon ECS Managed Instances.
在近六年之间, AWS 大概也理解到了 Capacity Provider + EC2 Auto Scaling 的复杂性，虽说可由 ECS 来管理 EC2 的 ASG, 但毕竟有个 ASG 在那里。 ECS 与 EC2 ASG 之间联接由 CloudWatch Metrics, Alarms, EC2 ASG 的 Dynamic scaling policies 和 Lifecycle hooks 的一整套机制协作。经常还不得不在 EC2 ASG 与 ECS 两个界面之间来回找问题。而 Managed Instances 的出现则将 EC2 实例的管理完全透明化了，在 EC2 端压根就不存在一个相应的 ASG, 更不需要 CloudWatch Alarms 之类的关联组件。
Managed Instances 与 EC2 Auto Scaling 之间就好比 Serverless 与非 Serverless 的区别，用 Managed Instances 之后你只管控制好 ECS Desired Count(ECS AutoScaling), 其余的都由 Managed Instances 来管理，在界面上只需要关注 ECS Infrastructure 中的 Container Instances. 由 Managed Instances 管理的 EC2 实例，你即使用有管理员权限都无法关闭它，只能全权由 Managed Instances 来控制。试图关闭这样的 EC2 实例时报错
Read More
- 2
- 3
- 4
- 5
- 6