00常见数据库总览

alex
7
2025-11-30

目前来看,市场上主流的数据库可以大致总结为以下五大类别,不同类别的数据库一般都会有各自的主流应用场景,当然,也会有着不同的地方,在此就不过多赘述,大家可以自行百度了解。

数据库类型

常见代表数据库

关系型数据库

MySQL, PostgreSQL, Oracle, Microsoft SQL Server, SQLite

非关系型数据库

MongoDB(文档), Redis(键值), Cassandra(列族), InfluxDB(时序)

向量数据库

Milvus, Pinecone, Qdrant, Weaviate, Chroma, FAISS(库)

图数据库

Neo4j, Amazon Neptune, JanusGraph, ArangoDB

全文索引数据库

Elasticsearch, OpenSearch, Apache Solr, Meilisearch, Typesense

上方有列举了各种类型数据库的代表数据库下面将一一详细讲解,各位看官可评鉴,如有疏漏错误不足之处多多担待批评指正,小编能力有限,感谢大家!!!!!!!!!!!!

1、关系型数据库

项目

内容

常见代表

MySQL、PostgreSQL、Oracle、Microsoft SQL Server、SQLite

适用场景

- 银行/金融交易系统
- 订单与支付系统
- 用户账户管理
- 需要强一致性和复杂查询的 OLTP 系统
- 报表与 BI 分析(配合数据仓库)

核心特点

- 基于表结构(行/列)
- 使用 SQL 作为标准查询语言
- 支持 ACID 事务
- 有严格 Schema 和外键约束
- 支持 JOIN、子查询、视图等关系操作

优点

- 数据一致性高,可靠性强
- 成熟稳定,工具链完善(备份、监控、ORM)
- 支持复杂逻辑查询和聚合
- 社区和文档丰富

缺点

- 水平扩展困难(需分库分表)
- 写入性能在高并发下受限
- 不适合非结构化或频繁变更的数据模型
- 大规模 JOIN 性能下降

2、非关系型数据库

注:NoSQL 包含多个子类型,此处综合共性,并标注典型子类差异。

项目

内容

常见代表

- 文档型:MongoDB、Couchbase
- 键值型:Redis、DynamoDB、etcd
- 列族型:Cassandra、HBase
- 时序型:InfluxDB、TimescaleDB

适用场景

- 高并发缓存(Redis)
- 用户画像/日志存储(MongoDB)
- IoT 传感器数据(InfluxDB)
- 全球分布式写入(Cassandra)
- 微服务配置中心(etcd)

核心特点

- 无固定 Schema,灵活数据模型
- 通常基于 BASE 原则(最终一致性)
- 原生支持水平扩展
- 针对特定访问模式优化(如 O(1) 查询、时间窗口聚合)

优点

- 高性能、高可扩展性
- 开发敏捷,适应快速迭代
- 云原生友好,部署简单
- 支持海量非结构化/半结构化数据

缺点

- 事务支持有限(部分支持局部事务)
- 不支持复杂 JOIN 和跨文档查询
- 一致性弱,需应用层补偿
- 查询能力因类型而异(键值型功能最弱)

3、向量数据库

项目

内容

常见代表

Milvus、Pinecone、Qdrant、Weaviate、Chroma、FAISS(库,非完整 DB)

适用场景

- RAG(检索增强生成)系统
- 语义搜索(文本/图像/音频)
- 推荐系统(用户/物品向量匹配)
- AI Agent 的长期记忆存储
- 盗版/相似内容检测

核心特点

- 存储高维浮点向量(如 768~1536 维 embedding)
- 支持近似最近邻搜索(ANN)算法(HNSW、IVF、LSH)
- 支持元数据过滤 + 向量混合查询
- 高吞吐、低延迟召回(毫秒级)

优点

- 专为 AI/ML 工作负载设计
- 支持亿级向量毫秒检索
- 与主流 LLM 框架(LangChain、LlamaIndex)无缝集成
- 开源与托管方案兼备

缺点

- 不支持传统 SQL 或事务操作
- 存储成本较高(向量本身占空间)
- 检索结果为“近似”,非精确匹配
- 调参复杂(索引类型、nlist、ef 等影响精度/速度)

4、图数据库

常见代表

Neo4j、Amazon Neptune、JanusGraph、ArangoDB(多模型)

适用场景

- 社交网络关系分析
- 金融反欺诈(关联账户识别)
- 知识图谱构建与推理
- 权限依赖分析(如 RBAC 路径)
- 路径规划与供应链追踪

核心特点

- 数据模型 = 节点(Node) + 关系(Edge)
- 关系是“一等公民”,存储即连接
- 使用图遍历语言(Cypher、Gremlin)
- 支持图算法(PageRank、社区发现、最短路径)

优点

- 多跳关系查询性能极优(传统 DB 难以实现)
- 直观表达复杂关联
- 支持实时图分析
- Neo4j 等支持 ACID 事务

缺点

- 学习曲线陡峭(需图思维)
- 不适合简单 CRUD 或聚合报表
- 生态较小,运维工具少
- 大规模图(十亿+边)扩展挑战大

5、全文索引数据库

项目

内容

常见代表

Elasticsearch、OpenSearch、Apache Solr、Meilisearch、Typesense

适用场景

- 电商商品搜索
- 企业知识库/文档检索
- 日志分析(ELK Stack)
- 新闻/内容平台站内搜索
- 简历筛选、模糊拼音搜索

核心特点

- 基于倒排索引(Inverted Index)
- 支持分词、同义词、停用词、词干提取
- 相关性排序(BM25、Learning to Rank)
- 支持高亮、分面(Facet)、聚合分析
- 近年支持向量搜索(如 ES 8.x kNN)

优点

- 文本搜索功能强大且灵活
- 支持模糊、通配符、布尔组合查询
- 分布式架构,高可用
- 可处理 TB 级文本数据

缺点

- 无事务支持,写入非强一致
- 资源消耗大(内存/CPU 密集)
- 不适用于核心交易系统
- 配置调优复杂(分片、副本、mapping)

目前大致将基本的数据库都梳理了下面将会对各类别间的数据库做纵向对比

区别一:查询语言与接口

数据库类型

查询语言 / 接口方式

关系型数据库

SQL(标准化程度高)

非关系型数据库

各异:
• MongoDB:MongoDB Query Language
• Redis:命令式 CLI/API
• Cassandra:CQL(类SQL)

向量数据库

SDK(Python/Go/Java)或 REST/gRPC API;部分支持 SQL-like(如 Weaviate)

图数据库

专用图查询语言:
• Neo4j:Cypher
• Neptune:Gremlin / SPARQL

全文索引数据库

DSL(Domain-Specific Language):
• Elasticsearch:Query DSL / Lucene Syntax

区别二:扩展性与部署

数据库类型

水平扩展能力

分布式原生支持

典型部署场景

关系型数据库

❌ 困难(需分库分表)

否(部分如 Citus 扩展 PG)

单机/主从,企业私有部署

非关系型数据库

✅ 优秀

✅ 是

云原生、微服务、高并发后台

向量数据库

✅ 良好

✅ 是(Milvus/Pinecone)

AI 平台、RAG 系统、SaaS 服务

图数据库

⚠️ 中等

部分支持(Neo4j Fabric, Neptune)

知识图谱、风控平台

全文索引数据库

✅ 优秀

✅ 是(ES/Solr 集群)

日志系统、搜索中台、电商站内搜索

区别二:性能特征

数据库类型

读写延迟

吞吐能力

适合的访问模式

关系型数据库

ms 级

中等

复杂查询、事务性操作、OLTP

非关系型数据库

μs ~ ms

高频读写、简单查询、缓存、日志

向量数据库

ms(ANN 搜索)

高(批量插入)

近似最近邻搜索(Top-K 相似召回)

图数据库

μs(1-2跳)
ms(多跳)

中等

多跳关系遍历、路径查找、子图匹配

全文索引数据库

ms

关键词搜索、模糊匹配、聚合分析、日志检索

区别四:适用典型场景

数据库类型

典型应用场景

关系型数据库

银行系统、ERP、订单管理、用户账户、财务系统

非关系型数据库

用户会话存储(Redis)、内容管理(MongoDB)、IoT 时序数据(InfluxDB)

向量数据库

RAG 系统、语义搜索、推荐系统、AI 记忆库、图像/文本相似检索

图数据库

社交网络、反欺诈、知识图谱、供应链依赖分析、权限关系建模

全文索引数据库

电商商品搜索、日志监控(ELK)、新闻检索、简历筛选、企业文档搜索

区别五:是否适合 AI / LLM 应用

数据库类型

是否适合 AI/LLM 场景

说明

关系型数据库

适合存储元数据,但无法直接支持 embedding 检索

非关系型数据库

⚠️(有限)

可存原始文本或向量(如 MongoDB 向量搜索),但非专业 ANN 引擎

向量数据库

✅✅✅

专为 LLM 的 RAG、长期记忆、语义检索设计

图数据库

✅(特定场景)

适合构建知识图谱增强推理(如 GraphRAG)

全文索引数据库

✅(关键词兜底)

ES 8+ 支持 kNN 向量搜索,可做混合检索(关键词 + 语义)

动物装饰