hive是基于Hadoop的一个数据仓库工具
Hive 由 Facebook 实现并开源
1、是基于 Hadoop 的一个数据仓库工具
2、可以将结构化的数据映射为一张数据库表
3、并提供 HQL(Hive SQL)查询功能
4、底层数据是存储在 HDFS 上
5、Hive的本质是将 SQL 语句转换为 MapReduce 任务运行
6、使不熟悉 MapReduce 的用户很方便地利用 HQL 处理和计算 HDFS 上的结构化的数据,适用于离线的批量数据计算。
这个大数据组件是否好用呢?
点击星号为它评分!
平均评分 3.3 / 5. 投票数: 3
到目前为止还没有投票!成为第一位评论此组件。
Apache Kylin™是一个开源的、分布式的分析型数据仓库
TIDB是pingcap公司开源的一款分布式数据库,结合了RDBMS和NOSQL两者的特性,支持对业务无感知的水平扩容,具备数据强一致性和高可用性
SnappyData是一个基于Spark+GemFire实现的分布式内存数据库
Apache Kudu是为Hadoop平台开发的一个列式存储管理器。
SparkSQL的前身是Shark,它将 SQL 查询与 Spark 程序无缝集成,可以将结构化数据作为 Spark 的 RDD 进行查询
Clickhouse由俄罗斯yandex公司开发。专为在线数据分析而设计