给那些已经超越了
传统向量数据库的 AI 智能体
VecminDB 是首款融合了“记忆生命周期管理”与“高性能检索”的双核认知向量数据库。它不仅具备极速的向量检索与内置 ONNX 嵌入,更原生支持长短期遗忘(LTSM)、在线质心演化(Welford)与联邦知识共享。一行 Docker 启动,让您的 Agent 拥有会自我进化的自主脑。
为什么选择认知型向量数据库?
传统的向量数据库给了智能体一块静态硬盘。而 VecminDB 赋予智能体一个双核驱动、具备自我巩固、遗忘进化与隐私联邦的“活记忆大脑”。
自动遗忘 (LTSM)
Episodic Memory 按 W(t)=exp(-λ×Δt) 自动衰减。被反复访问的记忆留下,一次性噪音自动消失。Agent 永远不会从三个月前的垃圾记忆里检索答案。
PCA 记忆蒸馏
3 条以上衰减的记忆自动 PCA 压缩为一个 Abstract Centroid。不需要写摘要脚本,不需要调 LLM API——引擎层自动完成。存储量随时间收敛,而非发散。
Agent 主权隔离
Sovereignty Token + HMAC-SHA256 签名链在引擎层强制隔离。财务 Agent 的记忆物理上不能被客服 Agent 读取——不是应用层 filter,是引擎层隔离。
联邦知识共享
Sovereign Federation 将多个 Agent 的蒸馏候选在 DP-Federated PCA 下聚合为 Alliance Centroid。共享的是知识质心,不是原始隐私记忆。
零外部依赖
内置 BGE-M3 旗舰权重 ONNX 引擎。一个 Docker 镜像启动。不需要 Python 环境、不需要 PyTorch、不需要 OpenAI API Key、不需要任何外部 Embedding 服务。
NSGA-II 自调优
内置多目标演化优化器自动在召回率×延迟×内存的 Pareto 前沿搜索最优解。Shadow Index 后台重建 + ArcSwapAny 原子切换——前端查询零中断。
30 秒看到价值
不需要 SDK。不需要 API Key。不需要配置环境。你甚至不需要碰向量。
# 1. 启动 VecminDB(零外部依赖) # 官方 GitHub GHCR 源 (海外直连推荐): docker run -d --name vecmindb -p 5520:5520 -v vecmindb-data:/home/vecminDB/data -e VECMIN__SECURITY__ADMIN_KEY=my-secret-key ghcr.io/lingxinmind/vecmindb:latest # 备选:国内阿里云极速专线 (中国大陆开发者推荐,免翻墙秒级下载): # docker run -d --name vecmindb -p 5520:5520 -v vecmindb-data:/home/vecminDB/data -e VECMIN__SECURITY__ADMIN_KEY=my-secret-key crpi-ngtfnt7d3tsnwk7l.cn-shanghai.personal.cr.aliyuncs.com/vecmindb/vecmindb:latest # 2. 存一条记忆——纯文本,不要向量。内置模型自动处理 Embedding。 curl -X POST http://localhost:5520/api/v1/mcp/message \ -H "Content-Type: application/json" \ -d '{"jsonrpc":"2.0","id":1,"method":"tools/call","params":{"name":"store_memory","arguments":{"text":"Customer #4521 always disputes charges over $50; requires manager approval for refunds","agent_id":"billing"}}}' # 3. 语义搜索——"who disputes charges" 找到 "always disputes charges over $50" curl -X POST http://localhost:5520/api/v1/mcp/message \ -H "Content-Type: application/json" \ -d '{"jsonrpc":"2.0","id":2,"method":"tools/call","params":{"name":"search_memory","arguments":{"query":"who disputes charges","agent_id":"billing"}}}' # 4. 浏览器打开 Dashboard,看记忆蒸馏实时发生 open http://localhost:5520/dashboard
你从未碰过 embedding 模型——VecminDB 内置处理了。你从未写一行蒸馏代码——引擎在后台自动运行。
一旦 Docker 或二进制启动成功,直接在浏览器中打开内置控制台,直观观察记忆蒸馏与集群拓扑。
下载原生离线包 (Zero-Docker)
内置 ONNX 运行库与 BGE-M3 权重。解压即用,支持 100% 物理断网运行。
内置零依赖可视化脑图控制台
无需安装额外软件,浏览器一键访问。实时掌握智能体大脑的所有状态演化。
-
LTSM 遗忘线与记忆衰减监测
以曲线直观展现 Episodic Memory 的半衰期衰减与降噪过滤进度。
-
PCA 知识质心自进化演化图
实时观察多条关联记忆如何通过 Welford 在线均值和 DP-Federated PCA 蒸馏合并为稳定的知识质心。
-
集群强一致 Raft 拓扑图
呈现分布式节点的心跳状态、主备关系及日志复制轨迹,确保 100% 数据一致性。
群脑认知 Memory OS vs 传统向量数据库
这不仅仅是另一个向量数据库。VecminDB 在行业首创了认知记忆全生命周期的管理系统(Memory OS),解决了多智能体架构下的成本、隔离和协同痛点。
VecminDB
能做啥:从存储、自动衰减、质心蒸馏、遗忘,到跨租户差分联邦、WAL 加密审计全生命周期闭环管理。
Neo4j, TigerVector
能做啥:GraphRAG,处理复杂多跳语义推理;做不了啥:无记忆自然衰减,无质心压缩及遗忘机制。
Cognee
能做啥:向量与图谱融合、ECL 数据流水线;做不了啥:无本地打包二进制、必须依赖外部大模型及 Embedding API、缺乏跨 Tenant 联邦保护。
Mem0, Letta (MemGPT)
能做啥:为 AI 智能体封装上层记忆 API 接口;做不了啥:纯 SaaS 模式多依赖外部服务、企业敏感数据必须出境、缺乏对底层计算引擎的精细资源控制。
Pinecone, Milvus, Qdrant
能做啥:高性能向量数据存储及常规的近邻 ANN 检索;做不了啥:不具备生命周期管理能力,不主动进行记忆蒸馏、概念提纯与自动遗忘。
| 能力维度 | 行业痛点 / 业务价值 | 传统竞品状态 | VecminDB 引擎状态 |
|---|---|---|---|
| 1. LTSM 生物学遗忘曲线 | 防范垃圾记忆腐化,保证智能体不会被几个月前的干扰噪音误导 | ❌ 空白 需应用层自行写过滤规则 | ✓ 内核级 W(t)=exp(-λ×Δt) 自动半衰期退化 |
| 2. PCA 质心异步蒸馏 | 自动压缩归纳同类记忆,杜绝大量冗余向量导致的检索精度雪崩 | ❌ 外部调用 依赖外部 LLM 总结,费用暴涨 | ✓ 引擎级 后台自动执行 PCA 协方差冷凝质心 |
| 3. InsertionLatch 去重锁 | 防止相同或相似语义的并发重复写入导致 ANN 索引异常膨胀 | ❌ 空白 只能全量重复存入 | ✓ 内核级 并发语义锁拦截,实现内存去重 |
| 4. 内置端侧模型 (BGE-M3) | 零环境依赖,100% 离线脱网运行,免去配置庞大 Python 库的痛苦 | ❌ 依赖 API 需额外部署 Python/PyTorch 或连接 OpenAI | ✓ 零依赖 内置 ONNX Runtime,解压单二进制即可运行 |
| 5. Alliance Centroid 联邦 | 新部署的 Agent 能够共享群体知识经验,无需一切从零开始学习 | ❌ 空白 无法实现跨实例的安全语义同步 | ✓ DP-Federated 跨租户差分隐私 PCA 协同,共享语义质心 |
| 6. 自动衰减→存储收敛 | 控制存储预算,防止传统向量库随运行时间推移费用沦为无底洞 | ❌ 越用越贵 向量数无限累积,费用线性暴涨 | ✓ 自动收敛 记忆冷凝成质心后自动物理剪枝,存储受控 |
| 7. Sovereignty Token 隔离 | 强力阻止跨智能体(如财务与客服 Agent)之间越权读取私密记忆 | ❌ 逻辑命名空间 仅在应用层 filter,安全性弱 | ✓ 内核级绑定 签名链强制物理隔离校验 |
| 8. HMAC-SHA256 审计链 | 金融级审计智能体的决策链,防止智能体出现幻觉或被恶意注入指令 | ❌ 空白 无法还原决策发生时的原始向量快照 | ✓ 自动落盘 每次访问均生成不可篡改的加密审计日志 |
| 9. 原始文本与向量同步落盘 | 极度关键:当 Embedding 模型升级时,历史向量自动重算,防数据作废 | ❌ 空白 历史向量彻底报废,必须重新抽取原始数据 | ✓ 自动同步 原始文本与多维向量同步原子落盘,无缝平滑重构 |
| 10. NSGA-II 影子自调优 | 无需高薪 DBA,自动在召回率、延迟和内存消耗中搜寻最优索引配置 | ❌ 手工调参 需离线停机重建索引,调参痛苦 | ✓ 零中断切换 HNSW 影子重建 + ArcSwapAny 双指针原子热切换 |
| 11. Air-gapped 离线部署 | 满足国防、政企、金融行业的极端数据出境合规和局域网要求 | ❌ 需连接公网 需拉取云端模型依赖或授权服务 | ✓ 100% 局域网 单文件解压,全量算法与验证离线自闭环 |
| 12. 遥测健康大盘 | 直观监控智能体的抽象概念网络、系统吞吐量及许可天数,便于运维管理 | ❌ 基础指标 仅有 CPU、内存等基础物理硬件指标 | ✓ 可视化脑图 脑图质心聚类大盘 + 专属 Prometheus 记忆指标 |
Memory OS vs Vector Databases
VecminDB is not just another vector database. It introduces the industry's first active Memory OS, managing the entire cognitive lifecycle of autonomous agents.
VecminDB
Capabilities: Complete lifecycle management: storage, decay, centroid distillation, forgetting, differential federated consensus, and WAL auditing.
Neo4j, TigerVector
Capabilities: GraphRAG, handling complex multi-hop semantic reasoning. Limitations: No automatic memory decay, summarization, or forget gates.
Cognee
Capabilities: Graph-vector fusion, ECL data pipelines. Limitations: No local offline binary package, heavily relies on external LLM and Embedding APIs, lacks cross-tenant privacy federation.
Mem0, Letta (MemGPT)
Capabilities: Encapsulates high-level memory APIs for AI agents. Limitations: SaaS-heavy setups, sensitive enterprise data leaves boundaries, lacks fine-grained resource limits on the core database engine.
Pinecone, Milvus, Qdrant
Capabilities: High-performance vector storage and basic ANN semantic search. Limitations: No lifecycle concept; memories simply pile up without distillation, compression, or active forgetting.
| Feature | Pain Point & Business Value | Competitors | VecminDB Status |
|---|---|---|---|
| 1. LTSM Biological Decay | Prevents memory corruption; stops agents from being misled by obsolete context. | ❌ Empty Handled manually in app-level. | ✓ Kernel-level W(t)=exp(-λ×Δt) half-life decay. |
| 2. PCA Centroid Distillation | Compresses redundant memories automatically into centroids to keep recall precision high. | ❌ External LLM High API costs to summarize. | ✓ Engine-level Automatic PCA covariance distillation. |
| 3. InsertionLatch Deduplication | Intercepts duplicate semantic records to prevent HNSW index bloat. | ❌ Empty Duplicates simply appended. | ✓ Kernel-level Semantic lock intercepts identical records. |
| 4. Built-in BGE-M3 Model | Zero-config, 100% offline local running; no heavy Python setup needed. | ❌ External API Requires PyTorch/OpenAI setup. | ✓ Zero-dependency Integrated ONNX Runtime out-of-the-box. |
| 5. Alliance Centroid Federation | Enables new agents to instantly inherit group experience without starting from scratch. | ❌ Empty Cannot sync knowledge securely. | ✓ DP-Federated Cross-tenant PCA with Laplace noise and 10% bias. |
| 6. Storage Convergence | Controls cloud storage bill, preventing endless growth of index size. | ❌ Linearly Growing Costs grow with time. | ✓ Converged Obsolete centroids physically pruned automatically. |
| 7. Sovereignty Token Isolation | Guarantees that agents in different departments cannot access each other's memories. | ❌ Logic Namespaces Soft filters at the app layer. | ✓ Kernel-level Cryptographic signature chains. |
| 8. HMAC-SHA256 WAL Audit Trail | Enables security auditing of agent decisions to prevent prompt injection. | ❌ Empty Cannot reconstruct historical memories. | ✓ Auto-persist Signed immutable access logs on disk. |
| 9. Raw Text & Vector Sync | Ensures automatic vector reconstruction when upgrading embedding models. | ❌ Empty Historic vectors become useless. | ✓ Atomic Sync Native text + vector synchronization on disk. |
| 10. NSGA-II Shadow Tuning | Zero-downtime database optimization for recall, latency, and memory. | ❌ Offline Rebuild Re-indexing causes query downtime. | ✓ Zero-Downtime HNSW shadow build + ArcSwapAny hot swap. |
| 11. Air-gapped Deployment | Meets strict data sovereignty compliance requirements (defense, banking, government). | ❌ Online Required Requires cloud verification. | ✓ 100% Offline Single-binary self-verification. |
| 12. Telemetry & Visual Graph | Allows DevOps to monitor concept graphs, cluster heartbeats, and license terms. | ❌ Hardware Only Generic CPU/Memory graphs. | ✓ Brain-map UI Clustering visual graph + Prometheus metrics. |
按 Agent 计费,不按向量
向量数随时间增长。Agent 数不会。LTSM 蒸馏让存储收敛而非发散——你的账单不随 Agent 运行时间增长。
Free
5 Agents · 100K 向量/Agent · 1 Node · 蒸馏启用 · 无需信用卡 · 永久免费
Pro
50 Agents · 1M 向量/Agent · ≤3 Nodes · Email Support
Team
500 Agents · 无限制向量 · ≤10 Nodes · Sovereign Federation · Priority SLA
Enterprise
无限 Agent · 无限节点 · 气隙部署 · 源码托管 · 专属 SLA · 信创适配
准备好给你的 Agent 一个真正的记忆系统?
30 天全功能试用。Free tier 永久免费。数据永不离开你的 VPC。
联系我们的企业团队 →