简介
Apache Drill是一个低延迟的分布式海量数据(涵盖结构化、半结构化以及嵌套数据)交互式查询引擎,使用ANSI SQL兼容语法,支持本地文件、HDFS、HBase、MongoDB等后端存储,支持Parquet、JSON、CSV、TSV、PSV等数据格式。受Google的Dremel启发,Drill满足上千节点的PB级别数据的交互式商业智能分析场景。
结构
Apache Drill是一个无主节点的分布式查询工具,每一个部署节点(Drillbit)都包含有以下核心模块:

RPC Endpoint: 基于RPC协议的客户端通信接口
SQL Parser: SQL解析工具,输出Logical plan, 它使用了开源工具:Calcite
Storage Engine interface: 面对多种数据源的统一读写抽象接口,它提供几种功能: 1.提供Metadata。 2.数据读写接口。3.数据定位和优化规则帮助提高查询效率
Drill提供以下几种类型的使用接口:
- Drill Shell
- Drill WEB控制台
- ODBC/JDBC
- C++ API
相关文章
相关导航
暂无评论...