Denny

Denny

在做搜索、AI 基础设施和复杂工程系统,也持续记录思考。 现在主要关注 agent、memory、检索与向量系统,以及 AI-native 的工程方法。

喜欢把复杂问题拆开、想透、写清楚。 这里会放文章、notes、项目,以及一些还没有长成正式文章的想法。


写作


Notes

记录正在学习、判断、试验和还没长成正式文章的东西。

Agent memory 的写入时机

Agent 什么时候该写 memory?现在的 agent 基本靠启发式规则或人工设定。更理想的方式可能是根据"信息价值"动态决定——但这需要 agent 能评估自己的知识边界,而这是很难的。 一个折中方案:让 agent 在每次任务完...
#agent#memory

检索质量评估的难点

检索系统的质量评估比想象中难。传统的 precision/recall 在实际场景里很难定义 ground truth——用户想要的东西往往不是文档里有明确答案的。 最近在看一些 embedding-based retrieval 的评...
#retrieval#evaluation

Link

Meta 的 MemGPT 论文,关于大模型在长对话中的 memory 管理。核心思路是把 memory 分层(working memory、recent memory、episodic memory、semantic memory),用...
#paper#memory#agent

向量数据库的现状

当前向量数据库的格局: - **Pinecone**:云原生,易用性好,但成本高 - **Milvus**:开源,可控性好,部署复杂 - **Qdrant**:Rust 实现,性能好,社区活跃 - **Chroma**:简单,适合研究和...
#vector-db#infrastructure