Apache Doris

https://doris.apache.org/zh-CN/docs/3.x/gettingStarted/what-is-apache-doris

Apache Doris 简介

Apache Doris 是一款基于 MPP 架构的高性能、实时分析型数据库。它以高效、简单和统一的特性著称,能够在亚秒级的时间内返回海量数据的查询结果。Doris 既能支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。

基于这些优势,Apache Doris 非常适合用于报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等场景。用户可以基于 Doris 构建大屏看板、用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。

什么是 Apache Doris

核心能力

实时数据摄取与存储

基于推送的微批处理与基于拉取的流式数据摄入,均能在一秒内完成。存储引擎支持实时更新插入、追加及预聚合操作。

极速查询

针对高并发与高吞吐量查询优化,采用列式存储引擎、MPP 架构、基于成本的查询优化器及向量化执行引擎。

联邦查询

对 Hive、Iceberg、Hudi 等数据湖及 MySQL、PostgreSQL 等数据库的联邦查询。

半结构化数据

复合数据类型如数组(Array)、映射(Map)和 JSON。支持 JSON 数据自动类型推断的变体(Variant)数据类型。用于文本搜索的 NGram 布隆过滤器和倒排索引。

弹性架构

分布式设计实现线性扩展能力。通过工作负载隔离与分层存储实现高效资源管理。支持无共享集群架构,同时兼容存储与计算分离方案。

开放生态系统

兼容 MySQL 协议及 ANSI SQL 标准,可轻松与商业智能工具集成。提供开放数据 API,便于 Spark、Flink 等外部计算引擎及机器学习 / 人工智能框架访问。

作者:Jeebiz  创建时间:2025-11-19 20:05
最后编辑:Jeebiz  更新时间:2025-11-19 20:14