博客园

Hadoop平台进阶之路 | eBay Spark测试框架——Woody

新版本的Spark拥有更好的性能和稳定性,对于用户来说,如果长期停留在低版本的Spark,不仅会浪费集群资源,还会进一步加大平台管理团队的工作量。如果进行Spark大版本升级,考虑到版本间可能由于计算行为不一致而导致的数据质量问题,用户就要投入大量的精力去对比重要的job在不同版本下的数据质量,加大了版本升级的困难度。
Hadoop
头像滴滴 发布于2024年12月07日
59浏览

数据安全:105个必备词汇定义解读!

数据安全:105个必备词汇定义解读!
头像随风 发布于2024年12月05日
39浏览

【禁止血压飙升】阿里大佬写的Controller太优雅了!

见过几千行代码的 controller吗?我见过。 见过全是 try catch 的 controller 吗,我见过。 见过全是字段校验的 controller 吗,我见过。 见过全是业务代码的 controller 吗?不好意思,我们公司很多业务写在 controller 的。 看见这些我真的血压高。
Java
头像春风得意 发布于2024年12月04日
33浏览

推荐 10 个漏洞管理工具,漏洞猎手必备!

随着网络攻击的日益复杂,漏洞管理已经成为保障信息安全和保护企业资产的核心环节。漏洞管理工具能够有效地帮助企业及时发现、评估、修复系统中的安全漏洞,从而降低数据泄露、网络攻击等风险。漏洞管理不仅仅是一个技术层面的任务,它涉及到企业的各项安全操作,包括资产发现、漏洞扫描、补丁管理、以及合规性检查等。
网络安全
头像春风得意 发布于2024年12月04日
69浏览

从3分钟到10秒:Doris统计信息背后不得不说的故事

让我们一起揭开统计信息的神秘面纱,看看这个默默无闻的"幕后英雄"如何让你的查询性能起飞!
Doris
头像春风得意 发布于2024年12月04日
77浏览

Flink CDC 3.2.1 发布公告

Apache Flink 社区非常高兴地宣布,Flink CDC 3.2 系列的第一个稳定性修复版本 3.2.1 已经正式发布。
FlinkStarRocks
头像忆往昔 发布于2024年12月04日
229浏览

Paimon x StarRocks 在同程旅行的湖仓构建方案

早期,同程旅行的数仓体系基于 Hive 来实现离线数据分析,在满足用户实时需求方面存在不足。为了解决这一问题,我们引入了 Apache Kudu 组件,将 ODS 层的数据同时写入 Hive 和 Kudu。由于 Kudu 不支持流式读取,我们通过 Spark 读取Kudu进行下游处理,以 10 分钟或 1 小时为周期调度任务,将处理后的数据写回 Kudu 表。
StarRocks
头像忆往昔 发布于2024年12月04日
285浏览

写给小白的大模型入门科普

网上关于大模型的文章也很多,但是都不太容易看懂。小枣君今天试着写一篇,争取做到通俗易懂。
AI应用开发
头像春风得意 发布于2024年12月02日
105浏览

只有中国人才懂的 6 个前端工具!

今天来分享 6 个只有中国人才懂的前端工具库,这些工具在特定场景下非常有用!
Web前端
头像agile query 发布于2024年12月02日
94浏览

Hadoop3.4或者 hive4在jdk17运行报错 module java.base does not “opens java.net“ to unnamed module @305fd85d

Hadoop3.4或者 hive4在jdk17运行报错 module java.base does not “opens java.net“ to unnamed module @305fd85d
HadoopHive
头像诗与远方 发布于2024年12月02日
256浏览 1点赞 1收藏

3 分钟快速了解 JuiceFS

💡 JuiceFS 是一款高性能、云原生分布式文件系统,拥有企业版与社区版两个版本。 企业版:面向海量文件、高性能应用场景,如 AI 模型训练、大数据平台分布式计算、高性能计算。 企业可采用云服务版或者本地部署。社区版:面向通用场景,易于维护和使用,方便定制化,适合热衷参与开源社区建设的团队。在 Apache 2.0 协议下发布,目前有约 10.8K GitHub 星标 。
头像洪波涌起 发布于2024年12月01日
72浏览

黑五来临!跨境电商该如何做数据分析?需要关注哪些指标?

跨境电商数据分析常常面临着数据的海量增长、多平台运营的复杂性、以及跨国交易的多变性等问题。这也导致从事跨境电商的朋友在分析数据时饱受困扰。但其实只要明确了思路,选对了工具,也可以实现高效的跨境电商数据分析。下面老李就结合我个人的从业经验,为大家系统说明一下跨境电商分析的思路和步骤。
数据分析
头像洪波涌起 发布于2024年11月30日
73浏览

阿里重磅开源 Fluss: Flink Unified Streaming Storage

Fluss 项目是由阿里云智能 Flink 团队研发的一款面向流分析的下一代流存储,旨在解决流存储在分析方面长期存在的挑战。Fluss 的项目定位是为 Apache Flink 提供实时流存储底座,进一步提升 Flink 实时流计算的能力。因此,Fluss 的名字源自“FLink Unified Streaming Storage” 的首字母缩写。
Flink
头像数智先锋 发布于2024年11月29日
338浏览

eBay 基于 Celeborn RESTful API 进行自动化工具集成实践

Apache Celeborn 是一个统一的大数据中间服务,致力于提高不同MapReduce引擎的效率和弹性。为了Spark on Kubernetes的弹性以及解决External Shuffle Service的灵活性和稳定性不足,eBay引入 Celeborn 作为Remote Shuffle Service。本文介绍了eBay基于最新 RESTful API 进行自动化管理Celeborn
Celeborn
头像数智先锋 发布于2024年11月29日
61浏览

内含福利 | StarRocks 2024年度技术峰会,与30+全球企业共探湖仓技术创新

StarRocks 社区的年度盛会——StarRocks Summit Asia 2024 将于 12 月 7 日在北京隆重登场! StarRocks 社区作为连接用户、平台方、业务方、技术爱好者与学术人员的开放平台,始终致力于打造标准化的行业解决方案,让每一位参与者都能在实践中汲取经验,在交流中碰撞创新。
StarRocks
头像巨人肩膀小编 发布于2024年11月28日
127浏览 3点赞

为何大厂开发者纷纷抛弃小仓,转向大仓monorepo?

在软件开发领域,代码仓库的管理方式对项目的效率和协作有着重要影响。 随着项目结构的日益复杂和开发挑战的不断增长,传统的单一代码库(Monolith)在应对多项目、多库和多服务的情况下显得力不从心,正是在这个背景下,Monorepo(微服务大仓)和Multirepo(微服务多仓)的概念应运而生。
数据仓库/中台
头像海星之梦 发布于2024年11月28日
136浏览 1点赞

从零开始了解推荐系统全貌

如果说互联网的目标就是连接一切,那么推荐系统的作用就是建立更加有效率的连接,推荐系统可以更有效率的连接用户与内容和服务,节约了大量的时间和成本。 如果把推荐系统简单拆开来看,推荐系统主要是由数据、算法、架构三个方面组成。
用户画像
头像海星之梦 发布于2024年11月28日
184浏览

Apache Doris 现行版本 Docker-Compose 运行教程

随着 Apache Doris 项目的火热,很多想尝鲜或者试用的小伙伴都希望通过 Docker 来快速拉起一个功能测试或者开发的集群,但由于一些变更原因,Doris On Docker 这一块的内容还未来得及调整完,所以为了让更多的小伙伴不卡在快速使用的路上,特此出一版教程给大家快速拉起试用。
Doris
头像海星之梦 发布于2024年11月28日
732浏览

Apache Flink 2.0-preview released

Apache Flink 社区正在积极准备 Flink 2.0,这是自 Flink 1.0 发布 8 年以来的首次大版本发布。作为一个重要的里程碑,Flink 2.0 将引入许多激动人心的功能和改进,以及一些不兼容的破坏性变更。为了促进用户和上下游项目(例如,连接器)尽早适配这些变更,提前尝试这些令人兴奋的新功能同时收集反馈,我们现在提供了 Flink 2.0 的预览版本。
Flink
头像海星之梦 发布于2024年11月28日
63浏览

Apache Celeborn 让 Spark 和 Flink 更快更稳更弹性

大数据引擎的中间数据有两个来源: Shuffle 和 Spill,其中最重要的是 Shuffle,据统计有超过 15%的资源消耗在 Shuffle。
Celeborn
头像春风得意 发布于2024年11月27日
91浏览
1 373839404182

微信(交流/反馈)

巨人肩膀初心:站在巨人肩膀上,避免无谓的重复劳动。 生产和汇聚行业技术、 知识经验、 工具组件 、案例产品,提供相关环境,为开发者提高生产效率提供切实有效的支持和帮助。并在这一进程中实现多方共赢。

由 深圳数智领航科技有限公司 提供动力 - 数智化领航者。

©2023-2025 - 巨人肩膀 - 粤ICP备2025395551号-1