Denny

在做搜索、AI 基础设施和复杂工程系统，也持续记录思考。现在主要关注 agent、memory、检索与向量系统，以及 AI-native 的工程方法。

喜欢把复杂问题拆开、想透、写清楚。这里会放文章、notes、项目，以及一些还没有长成正式文章的想法。

也接 10 USD 起的小型工程服务：脚本自动化、表格清洗、AI 工作流整理、README/部署说明/报错定位。查看服务和 PayPal 支付入口 →

写作

讨论 AI coding agent 如何改变软件工程的工作方式，以及工程体系需要如何适应这种变化。

思考检索系统、向量数据库和 AI memory 系统各自的边界与交叉地带。

一个适合 30-60 分钟收口的小服务入口：脚本自动化、表格清洗、AI 工作流整理、README/部署说明和小报错定位。

分析当前 long-term memory 系统失败的首要原因往往不是架构设计，而是数据写入质量。

质量工程和稳定性保障不是事后补救，而是平台架构的核心组成部分。

记录正在学习、判断、试验和还没长成正式文章的东西。

2024/03/18

Agent 什么时候该写 memory？现在的 agent 基本靠启发式规则或人工设定。更理想的方式可能是根据"信息价值"动态决定——但这需要 agent 能评估自己的知识边界，而这是很难的。一个折中方案：让 agent 在每次任务完...

#agent#memory

2024/03/12

检索系统的质量评估比想象中难。传统的 precision/recall 在实际场景里很难定义 ground truth——用户想要的东西往往不是文档里有明确答案的。最近在看一些 embedding-based retrieval 的评...

#retrieval#evaluation

2024/03/10

Meta 的 MemGPT 论文，关于大模型在长对话中的 memory 管理。核心思路是把 memory 分层（working memory、recent memory、episodic memory、semantic memory），用...

#paper#memory#agent

2024/03/05

当前向量数据库的格局： - **Pinecone**：云原生，易用性好，但成本高 - **Milvus**：开源，可控性好，部署复杂 - **Qdrant**：Rust 实现，性能好，社区活跃 - **Chroma**：简单，适合研究和...

#vector-db#infrastructure