[社区]Hudi

Hudi 是一个通用的大数据存储系统,主要特性:摄取和查询引擎之间的快照隔离,包括 Apache Hive、Presto 和 Apache Spark;支持回滚和存储点,可以恢复数据集;自动管理文件大小和布局,以优化查询性能和目录清单;准实时摄取,为查询提供最新数据; 实时数据和列数据的异步压缩。

京东零售数据湖应用与实践

Hudi数据湖数据平台架构数据仓库/中台
头像海星之梦   创建 于 2024年08月05日 阅读次数 273
精彩评论
评论
全部评论