博客园
最新
热门
发布
第三方服务对目标进行被动信息收集
第三方服务或实体通过合法和非侵入性的手段,对特定目标(个人、组织、系统等)进行信息搜集和分析的过程。这种信息收集不涉及直接与目标交互或对其系统进行探测,而是通过公开可用的资源和数据来获取信息。
久安
发布于2024年12月11日
121浏览
1点赞
B站大数据平台故障自愈实践
故障自愈系统通过智能化和自动化技术,显著提升了故障处理的及时性、智能化和可分析性,从而将被动响应转变为主动预防。
数据平台架构
随风
发布于2024年12月10日
230浏览
Kubernetes 架构学习笔记(下)
在过去的两年中,我协助eBay云计算架构师做eBay云计算部门系统架构设计审核会议的组织协调工作,于是萌生了用我们日常工作中实际的架构设计讨论来深入理解社区 Kubernetes Design Principle 的想法。文中例子来源于真实的设计迭代, 我仅是做了汇总。借此机会感谢所有为云计算系统设计做出贡献的同事, 向你们学习才让我这些年对Kubernetes的设计理念有了进一步的理解。
Kubernetes
滴滴
发布于2024年12月07日
95浏览
Kubernetes 架构学习笔记(上)
我把eBay 云计算部门的效率看成三个层面,第一层是代码开发的效率(包含持续集成持续发布), 第二层是架构效率,第三层是产品效率。这一篇博客主要讨论第二层架构效率。这件事情的缘起是一些架构讨论悬而不决,三年多前有一天我找到云计算部门的总架构师讨论一个设计困惑,他突然问我说许健你看过 Kubernetes 的设计原则吗?
Kubernetes
滴滴
发布于2024年12月07日
107浏览
Hadoop平台进阶之路 | eBay Spark测试框架——Woody
新版本的Spark拥有更好的性能和稳定性,对于用户来说,如果长期停留在低版本的Spark,不仅会浪费集群资源,还会进一步加大平台管理团队的工作量。如果进行Spark大版本升级,考虑到版本间可能由于计算行为不一致而导致的数据质量问题,用户就要投入大量的精力去对比重要的job在不同版本下的数据质量,加大了版本升级的困难度。
Hadoop
滴滴
发布于2024年12月07日
58浏览
一个快速且轻量的 Kafka 可视化工具,从此 Kafak 的运维管理简单化,Star 10K!
Kafka 以其高吞吐量和低延迟的数据传输能力而闻名,作为一个分布式流处理平台,广泛应用于大数据、实时流处理等领域。许多大型企业和开源项目都建立在Kafka之上,在互联网公司、金融行业、物联网(IoT)等多个领域都有广泛应用
有趣的开源集市
随风
发布于2024年12月06日
270浏览
支持 Flink/Gluten/优雅升级...Celeborn0.3.0 介绍
Apache Celeborn(Incubating)[1] [2] 是阿里云开源的大数据计算引擎通用 Remote Shuffle Service,旨在提升 Shuffle 的性能/稳定性/弹性,目前已广泛运行在包含阿里在内的多家企业,每天服务着生产环境数十P的 Shuffle 数据,可稳定支撑单 Shuffle 超 600T 的大作业。
Celeborn
随风
发布于2024年12月05日
178浏览
Iceberg x Amoro 在多点 DMALL 数据入湖的探索实践
随着大数据技术的迅猛发展,数据湖作为新兴的数据管理范式应运而生。在此基础上,通过简化架构、优化数据流程、引入创新技术等方式,降低企业数字化转型中的 TCO(总体拥有成本)成为可能。多点 DMALL 作为零售科技领域的先行者,我们持续探索和实践前沿技术,旨在提升数据处理效率,实现数据管理的标准化和自动化。通过这些努力,我们逐步构建了一个更高效、更具成本效益的大数据生态系统,赋能企业决策和生产运营。
Amoro
Iceberg
随风
发布于2024年12月05日
209浏览
数据安全:105个必备词汇定义解读!
数据安全:105个必备词汇定义解读!
随风
发布于2024年12月05日
37浏览
服务器重启后如何自动重启 Docker 容器?
在现代 IT 运维中,容器化技术的普及使得 Docker 成为服务器管理的重要工具之一。然而,在实际生产环境中,服务器因各种原因(如定期维护、意外断电或升级操作系统)重启后,如何让 Docker 容器自动恢复运行成为一个关键问题。本文将详细介绍如何确保 Docker 容器在服务器重启后自动重启,包括相关原理、配置方法以及一些常见的注意事项。
Docker
车车
发布于2024年12月05日
128浏览
【禁止血压飙升】阿里大佬写的Controller太优雅了!
见过几千行代码的 controller吗?我见过。 见过全是 try catch 的 controller 吗,我见过。 见过全是字段校验的 controller 吗,我见过。 见过全是业务代码的 controller 吗?不好意思,我们公司很多业务写在 controller 的。 看见这些我真的血压高。
Java
春风得意
发布于2024年12月04日
31浏览
推荐 10 个漏洞管理工具,漏洞猎手必备!
随着网络攻击的日益复杂,漏洞管理已经成为保障信息安全和保护企业资产的核心环节。漏洞管理工具能够有效地帮助企业及时发现、评估、修复系统中的安全漏洞,从而降低数据泄露、网络攻击等风险。漏洞管理不仅仅是一个技术层面的任务,它涉及到企业的各项安全操作,包括资产发现、漏洞扫描、补丁管理、以及合规性检查等。
网络安全
春风得意
发布于2024年12月04日
63浏览
从3分钟到10秒:Doris统计信息背后不得不说的故事
让我们一起揭开统计信息的神秘面纱,看看这个默默无闻的"幕后英雄"如何让你的查询性能起飞!
Doris
春风得意
发布于2024年12月04日
68浏览
Flink CDC 3.2.1 发布公告
Apache Flink 社区非常高兴地宣布,Flink CDC 3.2 系列的第一个稳定性修复版本 3.2.1 已经正式发布。
Flink
StarRocks
忆往昔
发布于2024年12月04日
213浏览
Paimon x StarRocks 在同程旅行的湖仓构建方案
早期,同程旅行的数仓体系基于 Hive 来实现离线数据分析,在满足用户实时需求方面存在不足。为了解决这一问题,我们引入了 Apache Kudu 组件,将 ODS 层的数据同时写入 Hive 和 Kudu。由于 Kudu 不支持流式读取,我们通过 Spark 读取Kudu进行下游处理,以 10 分钟或 1 小时为周期调度任务,将处理后的数据写回 Kudu 表。
StarRocks
忆往昔
发布于2024年12月04日
263浏览
写给小白的大模型入门科普
网上关于大模型的文章也很多,但是都不太容易看懂。小枣君今天试着写一篇,争取做到通俗易懂。
AI应用开发
春风得意
发布于2024年12月02日
103浏览
只有中国人才懂的 6 个前端工具!
今天来分享 6 个只有中国人才懂的前端工具库,这些工具在特定场景下非常有用!
Web前端
agile query
发布于2024年12月02日
89浏览
Hadoop3.4或者 hive4在jdk17运行报错 module java.base does not “opens java.net“ to unnamed module @305fd85d
Hadoop3.4或者 hive4在jdk17运行报错 module java.base does not “opens java.net“ to unnamed module @305fd85d
Hadoop
Hive
诗与远方
发布于2024年12月02日
240浏览
1点赞
1收藏
3 分钟快速了解 JuiceFS
💡 JuiceFS 是一款高性能、云原生分布式文件系统,拥有企业版与社区版两个版本。 企业版:面向海量文件、高性能应用场景,如 AI 模型训练、大数据平台分布式计算、高性能计算。 企业可采用云服务版或者本地部署。社区版:面向通用场景,易于维护和使用,方便定制化,适合热衷参与开源社区建设的团队。在 Apache 2.0 协议下发布,目前有约 10.8K GitHub 星标 。
洪波涌起
发布于2024年12月01日
68浏览
Fluss-面向分析的实时流存储初探
编者荐语: 我超哥嘎嘎能写,写到凌晨3点44,超哥牛的,支持云邪偶像的Fluss
洪波涌起
发布于2024年11月30日
338浏览
1
33
34
35
36
37
82