最新
热门
Apache Celeborn 在多点 DMALL 的云原生实践
本文介绍了多点DMALL在大数据架构变迁中引入Apache Celeborn的过程和升级演化。通过引入Celeborn解决Shuffle数据处理问题,采用存算分离方案构建云原生大数据集群。文章还提到了版本跟踪升级、从on Premises到on Kubernetes的转型、从Hostpath到PVC的过渡以及BestEffort带来的不稳定问题等解决方案。
滴滴
发布于01月08日
114浏览
Apache Celeborn 在B站的生产实践
随着B站业务的飞速发展,数据规模呈指数级增长,计算集群也逐步从单机房扩展到多机房部署模式。多个业务线依托大数据平台驱动核心业务,大数据系统的高效性与稳定性成为公司业务发展的重要基石。
海星之梦
发布于01月03日
171浏览
Celeborn Spark 集成最新进展
目前,Celeborn 已成为最受欢迎的 Remote Shuffle Service。许多国内外大厂已经在使用 Celeborn,除了阿里云、小红书、B站、Shopee、蔚来等已经登记的用户,也有部分用户出于各种因素暂未正式登记。
车车
发布于01月02日
269浏览
1点赞
支持 Flink/Gluten/优雅升级...Celeborn0.3.0 介绍
Apache Celeborn(Incubating)[1] [2] 是阿里云开源的大数据计算引擎通用 Remote Shuffle Service,旨在提升 Shuffle 的性能/稳定性/弹性,目前已广泛运行在包含阿里在内的多家企业,每天服务着生产环境数十P的 Shuffle 数据,可稳定支撑单 Shuffle 超 600T 的大作业。
随风
发布于2024年12月05日
164浏览
eBay 基于 Celeborn RESTful API 进行自动化工具集成实践
Apache Celeborn 是一个统一的大数据中间服务,致力于提高不同MapReduce引擎的效率和弹性。为了Spark on Kubernetes的弹性以及解决External Shuffle Service的灵活性和稳定性不足,eBay引入 Celeborn 作为Remote Shuffle Service。本文介绍了eBay基于最新 RESTful API 进行自动化管理Celeborn
数智先锋
发布于2024年11月29日
46浏览
Apache Celeborn 让 Spark 和 Flink 更快更稳更弹性
大数据引擎的中间数据有两个来源: Shuffle 和 Spill,其中最重要的是 Shuffle,据统计有超过 15%的资源消耗在 Shuffle。
春风得意
发布于2024年11月27日
85浏览
知乎基于 Apache Celeborn 优化 Spark Shuffle 的实践
知乎Hadoop集群上每天运行着大量的Spark作业,包括调度平台提交的例行作业、Kyuubi提交的Spark SQL作业,每天Spark作业的Shuffle量达到3PB以上,单个Spark作业Shuffle量最大接近100TB,单个Stage 50TB。同时Hadoop集群上每天有1PB左右的MR作业Shuffle,以及DataNode的磁盘IO。
春风得意
发布于2024年11月27日
357浏览
Apache Celeborn 让 Spark 和 Flink 更快更稳更弹性
本文整理自阿里云/数据湖 Spark 引擎负责人周克勇(一锤)在 Streaming Lakehouse Meetup 的分享。内容主要分为五个部分: 1. Apache Celeborn 的背景 2. Apache Celeborn——快 3. Apache Celeborn——稳 4. Apache Celeborn——弹 5. Evaluation
巨人肩膀小编
发布于2024年07月05日
264浏览
Apache Kyuubi & Celeborn (Incubating) 助力 Spark 拥抱云原生
在过去数年中,网易在大数据云原生领域进行了长足的探索。本文围绕如何基于 Apache Kyuubi & Celeborn 等开源技术,构建企业级 Spark on Kubernetes 云原生离线计算平台展开,包含技术选型、架构设计、经验教训、缺陷改进、降本增效等内容,深入剖析网易在该领域的探索成果。
巨人肩膀小编
发布于2024年07月05日
426浏览
共创排行榜