VecminDB Memory OS
INITIALIZING MEMORY ENGINE...
认知型向量数据库

给那些已经超越了
传统向量数据库的 AI 智能体

VecminDB 是首款融合了“记忆生命周期管理”与“高性能检索”的双核认知向量数据库。它不仅具备极速的向量检索与内置 ONNX 嵌入,更原生支持长短期遗忘(LTSM)、在线质心演化(Welford)与联邦知识共享。一行 Docker 启动,让您的 Agent 拥有会自我进化的自主脑。

已服务 0+ 位开发者与智能体实例
Memory Distillation Pipeline
LTSM LIFECYCLE

为什么选择认知型向量数据库?

传统的向量数据库给了智能体一块静态硬盘。而 VecminDB 赋予智能体一个双核驱动、具备自我巩固、遗忘进化与隐私联邦的“活记忆大脑”。

自动遗忘 (LTSM)

Episodic Memory 按 W(t)=exp(-λ×Δt) 自动衰减。被反复访问的记忆留下,一次性噪音自动消失。Agent 永远不会从三个月前的垃圾记忆里检索答案。

PCA 记忆蒸馏

3 条以上衰减的记忆自动 PCA 压缩为一个 Abstract Centroid。不需要写摘要脚本,不需要调 LLM API——引擎层自动完成。存储量随时间收敛,而非发散。

Agent 主权隔离

Sovereignty Token + HMAC-SHA256 签名链在引擎层强制隔离。财务 Agent 的记忆物理上不能被客服 Agent 读取——不是应用层 filter,是引擎层隔离。

联邦知识共享

Sovereign Federation 将多个 Agent 的蒸馏候选在 DP-Federated PCA 下聚合为 Alliance Centroid。共享的是知识质心,不是原始隐私记忆。

零外部依赖

内置 BGE-M3 旗舰权重 ONNX 引擎。一个 Docker 镜像启动。不需要 Python 环境、不需要 PyTorch、不需要 OpenAI API Key、不需要任何外部 Embedding 服务。

NSGA-II 自调优

内置多目标演化优化器自动在召回率×延迟×内存的 Pareto 前沿搜索最优解。Shadow Index 后台重建 + ArcSwapAny 原子切换——前端查询零中断。

30 秒看到价值

不需要 SDK。不需要 API Key。不需要配置环境。你甚至不需要碰向量。

Terminal bash
# 1. 启动 VecminDB(零外部依赖)



# 官方 GitHub GHCR 源 (海外直连推荐):

docker run -d --name vecmindb -p 5520:5520 -v vecmindb-data:/home/vecminDB/data -e VECMIN__SECURITY__ADMIN_KEY=my-secret-key ghcr.io/lingxinmind/vecmindb:latest



# 备选:国内阿里云极速专线 (中国大陆开发者推荐,免翻墙秒级下载):

# docker run -d --name vecmindb -p 5520:5520 -v vecmindb-data:/home/vecminDB/data -e VECMIN__SECURITY__ADMIN_KEY=my-secret-key crpi-ngtfnt7d3tsnwk7l.cn-shanghai.personal.cr.aliyuncs.com/vecmindb/vecmindb:latest







# 2. 存一条记忆——纯文本,不要向量。内置模型自动处理 Embedding。



curl -X POST http://localhost:5520/api/v1/mcp/message \



  -H "Content-Type: application/json" \



  -d '{"jsonrpc":"2.0","id":1,"method":"tools/call","params":{"name":"store_memory","arguments":{"text":"Customer #4521 always disputes charges over $50; requires manager approval for refunds","agent_id":"billing"}}}'







# 3. 语义搜索——"who disputes charges" 找到 "always disputes charges over $50"



curl -X POST http://localhost:5520/api/v1/mcp/message \



  -H "Content-Type: application/json" \



  -d '{"jsonrpc":"2.0","id":2,"method":"tools/call","params":{"name":"search_memory","arguments":{"query":"who disputes charges","agent_id":"billing"}}}'







# 4. 浏览器打开 Dashboard,看记忆蒸馏实时发生



open http://localhost:5520/dashboard

你从未碰过 embedding 模型——VecminDB 内置处理了。你从未写一行蒸馏代码——引擎在后台自动运行。

🖥️
服务启动后即可访问可视化控制台

一旦 Docker 或二进制启动成功,直接在浏览器中打开内置控制台,直观观察记忆蒸馏与集群拓扑。

Open Console

下载原生离线包 (Zero-Docker)

🐧 Linux (含模型·离线完整包) 🍏 macOS (M1/M2/M3) 🪟 Windows (x64)

内置 ONNX 运行库与 BGE-M3 权重。解压即用,支持 100% 物理断网运行。

VECMINDB UI

内置零依赖可视化脑图控制台

无需安装额外软件,浏览器一键访问。实时掌握智能体大脑的所有状态演化。

  • LTSM 遗忘线与记忆衰减监测

    以曲线直观展现 Episodic Memory 的半衰期衰减与降噪过滤进度。

  • 🧠

    PCA 知识质心自进化演化图

    实时观察多条关联记忆如何通过 Welford 在线均值和 DP-Federated PCA 蒸馏合并为稳定的知识质心。

  • ⛓️

    集群强一致 Raft 拓扑图

    呈现分布式节点的心跳状态、主备关系及日志复制轨迹,确保 100% 数据一致性。

VECMINDB CORE DASHBOARD v1.5.0
LIVE
LTSM Forgetting & Decay Monitoring
Centroid A: t=1.2s
Execute semantic vector queries directly in the browser to instantly trace associated agent memories across sovereignty domains.
Raft Cluster Topology Console
Node 1 (Leader) Node 2 Node 3
Cluster Status HEALTHY
Active Nodes 3 / 3
Raft Index 2,845,910

群脑认知 Memory OS vs 传统向量数据库

这不仅仅是另一个向量数据库。VecminDB 在行业首创了认知记忆全生命周期的管理系统(Memory OS),解决了多智能体架构下的成本、隔离和协同痛点。

L5: 记忆引擎 (Memory OS)

VecminDB

能做啥:从存储、自动衰减、质心蒸馏、遗忘,到跨租户差分联邦、WAL 加密审计全生命周期闭环管理。

L4: 图 + 向量融合

Neo4j, TigerVector

能做啥:GraphRAG,处理复杂多跳语义推理;做不了啥:无记忆自然衰减,无质心压缩及遗忘机制。

L3: 自学习引擎

Cognee

能做啥:向量与图谱融合、ECL 数据流水线;做不了啥:无本地打包二进制、必须依赖外部大模型及 Embedding API、缺乏跨 Tenant 联邦保护。

L2: Agent 记忆框架

Mem0, Letta (MemGPT)

能做啥:为 AI 智能体封装上层记忆 API 接口;做不了啥:纯 SaaS 模式多依赖外部服务、企业敏感数据必须出境、缺乏对底层计算引擎的精细资源控制。

L1: 传统向量数据库

Pinecone, Milvus, Qdrant

能做啥:高性能向量数据存储及常规的近邻 ANN 检索;做不了啥:不具备生命周期管理能力,不主动进行记忆蒸馏、概念提纯与自动遗忘。

能力维度 行业痛点 / 业务价值 传统竞品状态 VecminDB 引擎状态
1. LTSM 生物学遗忘曲线 防范垃圾记忆腐化,保证智能体不会被几个月前的干扰噪音误导 ❌ 空白 需应用层自行写过滤规则 ✓ 内核级 W(t)=exp(-λ×Δt) 自动半衰期退化
2. PCA 质心异步蒸馏 自动压缩归纳同类记忆,杜绝大量冗余向量导致的检索精度雪崩 ❌ 外部调用 依赖外部 LLM 总结,费用暴涨 ✓ 引擎级 后台自动执行 PCA 协方差冷凝质心
3. InsertionLatch 去重锁 防止相同或相似语义的并发重复写入导致 ANN 索引异常膨胀 ❌ 空白 只能全量重复存入 ✓ 内核级 并发语义锁拦截,实现内存去重
4. 内置端侧模型 (BGE-M3) 零环境依赖,100% 离线脱网运行,免去配置庞大 Python 库的痛苦 ❌ 依赖 API 需额外部署 Python/PyTorch 或连接 OpenAI ✓ 零依赖 内置 ONNX Runtime,解压单二进制即可运行
5. Alliance Centroid 联邦 新部署的 Agent 能够共享群体知识经验,无需一切从零开始学习 ❌ 空白 无法实现跨实例的安全语义同步 ✓ DP-Federated 跨租户差分隐私 PCA 协同,共享语义质心
6. 自动衰减→存储收敛 控制存储预算,防止传统向量库随运行时间推移费用沦为无底洞 ❌ 越用越贵 向量数无限累积,费用线性暴涨 ✓ 自动收敛 记忆冷凝成质心后自动物理剪枝,存储受控
7. Sovereignty Token 隔离 强力阻止跨智能体(如财务与客服 Agent)之间越权读取私密记忆 ❌ 逻辑命名空间 仅在应用层 filter,安全性弱 ✓ 内核级绑定 签名链强制物理隔离校验
8. HMAC-SHA256 审计链 金融级审计智能体的决策链,防止智能体出现幻觉或被恶意注入指令 ❌ 空白 无法还原决策发生时的原始向量快照 ✓ 自动落盘 每次访问均生成不可篡改的加密审计日志
9. 原始文本与向量同步落盘 极度关键:当 Embedding 模型升级时,历史向量自动重算,防数据作废 ❌ 空白 历史向量彻底报废,必须重新抽取原始数据 ✓ 自动同步 原始文本与多维向量同步原子落盘,无缝平滑重构
10. NSGA-II 影子自调优 无需高薪 DBA,自动在召回率、延迟和内存消耗中搜寻最优索引配置 ❌ 手工调参 需离线停机重建索引,调参痛苦 ✓ 零中断切换 HNSW 影子重建 + ArcSwapAny 双指针原子热切换
11. Air-gapped 离线部署 满足国防、政企、金融行业的极端数据出境合规和局域网要求 ❌ 需连接公网 需拉取云端模型依赖或授权服务 ✓ 100% 局域网 单文件解压,全量算法与验证离线自闭环
12. 遥测健康大盘 直观监控智能体的抽象概念网络、系统吞吐量及许可天数,便于运维管理 ❌ 基础指标 仅有 CPU、内存等基础物理硬件指标 ✓ 可视化脑图 脑图质心聚类大盘 + 专属 Prometheus 记忆指标

Memory OS vs Vector Databases

VecminDB is not just another vector database. It introduces the industry's first active Memory OS, managing the entire cognitive lifecycle of autonomous agents.

L5: Memory Engine (Memory OS)

VecminDB

Capabilities: Complete lifecycle management: storage, decay, centroid distillation, forgetting, differential federated consensus, and WAL auditing.

L4: Graph + Vector Fusion

Neo4j, TigerVector

Capabilities: GraphRAG, handling complex multi-hop semantic reasoning. Limitations: No automatic memory decay, summarization, or forget gates.

L3: Self-Learning Engine

Cognee

Capabilities: Graph-vector fusion, ECL data pipelines. Limitations: No local offline binary package, heavily relies on external LLM and Embedding APIs, lacks cross-tenant privacy federation.

L2: Agent Memory Framework

Mem0, Letta (MemGPT)

Capabilities: Encapsulates high-level memory APIs for AI agents. Limitations: SaaS-heavy setups, sensitive enterprise data leaves boundaries, lacks fine-grained resource limits on the core database engine.

L1: Traditional Vector DB

Pinecone, Milvus, Qdrant

Capabilities: High-performance vector storage and basic ANN semantic search. Limitations: No lifecycle concept; memories simply pile up without distillation, compression, or active forgetting.

Feature Pain Point & Business Value Competitors VecminDB Status
1. LTSM Biological Decay Prevents memory corruption; stops agents from being misled by obsolete context. ❌ Empty Handled manually in app-level. ✓ Kernel-level W(t)=exp(-λ×Δt) half-life decay.
2. PCA Centroid Distillation Compresses redundant memories automatically into centroids to keep recall precision high. ❌ External LLM High API costs to summarize. ✓ Engine-level Automatic PCA covariance distillation.
3. InsertionLatch Deduplication Intercepts duplicate semantic records to prevent HNSW index bloat. ❌ Empty Duplicates simply appended. ✓ Kernel-level Semantic lock intercepts identical records.
4. Built-in BGE-M3 Model Zero-config, 100% offline local running; no heavy Python setup needed. ❌ External API Requires PyTorch/OpenAI setup. ✓ Zero-dependency Integrated ONNX Runtime out-of-the-box.
5. Alliance Centroid Federation Enables new agents to instantly inherit group experience without starting from scratch. ❌ Empty Cannot sync knowledge securely. ✓ DP-Federated Cross-tenant PCA with Laplace noise and 10% bias.
6. Storage Convergence Controls cloud storage bill, preventing endless growth of index size. ❌ Linearly Growing Costs grow with time. ✓ Converged Obsolete centroids physically pruned automatically.
7. Sovereignty Token Isolation Guarantees that agents in different departments cannot access each other's memories. ❌ Logic Namespaces Soft filters at the app layer. ✓ Kernel-level Cryptographic signature chains.
8. HMAC-SHA256 WAL Audit Trail Enables security auditing of agent decisions to prevent prompt injection. ❌ Empty Cannot reconstruct historical memories. ✓ Auto-persist Signed immutable access logs on disk.
9. Raw Text & Vector Sync Ensures automatic vector reconstruction when upgrading embedding models. ❌ Empty Historic vectors become useless. ✓ Atomic Sync Native text + vector synchronization on disk.
10. NSGA-II Shadow Tuning Zero-downtime database optimization for recall, latency, and memory. ❌ Offline Rebuild Re-indexing causes query downtime. ✓ Zero-Downtime HNSW shadow build + ArcSwapAny hot swap.
11. Air-gapped Deployment Meets strict data sovereignty compliance requirements (defense, banking, government). ❌ Online Required Requires cloud verification. ✓ 100% Offline Single-binary self-verification.
12. Telemetry & Visual Graph Allows DevOps to monitor concept graphs, cluster heartbeats, and license terms. ❌ Hardware Only Generic CPU/Memory graphs. ✓ Brain-map UI Clustering visual graph + Prometheus metrics.

按 Agent 计费,不按向量

向量数随时间增长。Agent 数不会。LTSM 蒸馏让存储收敛而非发散——你的账单不随 Agent 运行时间增长。

🎁
反馈有礼:提交 BUG 或建议即可免费延长 30 天试用!

在控制台的反馈板块中,提交任何有效建议或问题报告,通过后系统将自动为您的实例延长 30 天试用期。

Free

$0

5 Agents · 100K 向量/Agent · 1 Node · 蒸馏启用 · 无需信用卡 · 永久免费

Pro

$49/月

50 Agents · 1M 向量/Agent · ≤3 Nodes · Email Support

Team

$299/月

500 Agents · 无限制向量 · ≤10 Nodes · Sovereign Federation · Priority SLA

Enterprise

定制

无限 Agent · 无限节点 · 气隙部署 · 源码托管 · 专属 SLA · 信创适配

Enterprise 询价 →

准备好给你的 Agent 一个真正的记忆系统?

30 天全功能试用。Free tier 永久免费。数据永不离开你的 VPC。

联系我们的企业团队 →