博客园

yum源详解

yum(全称Yellow Dog Updater)是一个在Fedora和RedHat以及CentOS中的Shell前端软件包管理器。基于RPM 包管理,能够从指定的服务器自动下载RPM包并且安装,可以自动处理包之间的依赖关系,并且一次安装所有依赖的软件包。
头像忆往昔 发布于2024年09月03日
113浏览 2点赞 1收藏

如何避免数仓模型“烟囱式”建设

这是一篇企业数据中台建设实践,请务必收好!
数据仓库/中台数据治理数据平台架构
头像随风 发布于2024年09月03日
139浏览

一个超火的数据结构与算法入门教程,动画图解运算过程,So Easy!Star 92K+!

一个超火的数据结构与算法入门教程,动画图解运算过程,So Easy!Star 92K+!
有趣的开源集市
头像开源集市 发布于2024年08月29日
160浏览 1点赞

一个自托管的虚拟浏览器,提供安全隐私的访问,支持移动端,Star 6.2K!

一个自托管的虚拟浏览器,提供安全隐私的访问,支持移动端,Star 6.2K!
有趣的开源集市
头像开源集市 发布于2024年08月29日
287浏览 2点赞

【Apache Doris】数据均衡问题排查指南

当集群处于以下几种情况时,可参考本文进行问题排查。 BE节点之间的数据不均 单个BE节点上的多个磁盘之间的数据不均 BE节点的上线和下线进度卡死(BE的tablet数量没有变化)
DorisPowerData
头像Faith_xzc 发布于2024年08月29日
600浏览 1点赞

采集工具选型调研

大家一起来探讨SeaTunnel方案,简化当前Dinky与chunjun的双轨模式(Dinky仅用于实时同步,chunjun负责离线处理)。提议小组一起共议,并由大数据组构建demo验证其能否融合流批处理于Zeus平台,实现统一开发与运维,降低跨平台障碍与学习成本。技术应聚焦高效而非堆砌,共同努力推动架构优化。
SeaTunnel
头像数智先锋 发布于2024年08月29日
294浏览 2点赞

3.2.0版本参数传递并使用switch任务进行判断

3.2.0版本参数传递并使用switch任务进行判断
Dolphinscheduler实践
头像Liang 发布于2024年08月29日
127浏览 1点赞

一文彻底搞懂ZooKeeper选举机制

ZooKeeper 是一个分布式的开源协调服务,它提供了一个高性能的分布式协调服务,用于构建分布式应用程序和服务。ZooKeeper 集群是由多个 ZooKeeper 服务器组成的,这些服务器协同工作以提供高可用性和可靠性。
Zookeeper
头像随风 发布于2024年08月28日
174浏览

Flink CDC 在新能源制造业的实践

我们是一家专注于新能源动力电池制造的企业,致力于推动能源技术的发展与应用。作为一家具有多年行业经验的企业,我们在新能源领域积累了深厚的技术实力和市场认知,业务涵盖了新能源产业链的关键环节。从上游的装备制造到下游的应用解决方案,为客户提供了全方位的服务。
FlinkStreampark
头像忆往昔 发布于2024年08月27日
289浏览

Dinky 提交 K8S Application 任务

Dinky 是一个基于 Apache Flink 的实时计算平台,它提供了一站式的 Flink 任务开发、运维、监控等功能。Kubernetes 是一个强大的容器编排平台,能够自动化应用的部署、扩展和管理。将 Flink 与 Kubernetes 集成,可以充分利用 Kubernetes 的优势,实现 Flink 任务的弹性伸缩、自动化部署和高可用性。
Dinky
头像忆往昔 发布于2024年08月27日
132浏览

Dinky教程- 数据源那些你不知道的功能

Dinky数据源教程介绍了如何配置和使用数据源,包括Flink连接配置和Flink连接模板,以实现数据源的统一管理和简化开发流程。
Dinky
头像墨无痕 发布于2024年08月27日
626浏览 3点赞

Apache Doris 基于 Workload Group 的负载隔离能力解读|Deep Dive 系列

现如今企业的数据查询需求在不断增多,在共享同一集群时,往往需要同时面对多个业务线或多种分析负载的并发查询。在有限的资源条件下,查询任务间的资源抢占将导致性能下降甚至集群不稳定,因此负载管理的重要性不言而喻。
DorisPowerData
头像Faith_xzc 发布于2024年08月27日
151浏览 3点赞

Apache Doris 故障自助排查指南(P0 篇)

Doris 运维的成本相较于其他相同定位的组件而言,其实已经下降了很多,但是在整体使用过程中,由于整体特性的研发行进速度过于快,所以整体稳定性上还是有一些瑕疵在内的。
DorisPowerData
头像苏奕嘉 发布于2024年08月27日
437浏览 2点赞

Flink 面试大全 基础篇

Flink是一个以 流 为核心的高可用、高性能的分布式计算引擎。具备 流批一体,高吞吐、低延迟,容错能力,大规模复杂计算等特点,在数据流上提供 数据分发、通信等功能。
Flink
头像忆往昔 发布于2024年08月27日
162浏览

数据同步工具调研选型:SeaTunnel 与 DataX 、Sqoop、Flume、Flink CDC 对比

Apache SeaTunnel 是一个非常易用的超高性能分布式数据集成产品,支持海量数据的离线及实时同步。每天可稳定高效同步万亿级数据,已应用于数百家企业生产,也是首个由国人主导贡献到 Apache 基金会的数据集成顶级项目
SeaTunnel
头像Dataops 发布于2024年08月27日
572浏览

Apache SeaTunnel技术架构演进及其在AI领域的应用

随着数据集成需求的增长,Apache SeaTunnel作为新一代的数据同步引擎,不仅在技术架构上不断演进,也在AI领域展现出其独特的应用价值。在CommunityOverCode Asia 2024大会上,Apache SeaTunnel PMC Chair 高俊 深入探讨SeaTunnel的技术演进路径,分析其在AI领域的应用案例,并展望未来的发展规划。
SeaTunnel
头像Dataops 发布于2024年08月27日
151浏览

Apache Doris 全新分区策略 Auto Partition 应用场景与功能详解 | Deep Dive系列

在当今数据驱动的时代,如何高效、有序地管理数据库中的海量数据成为挑战。为了处理庞大的数据集,分布式数据库引入了类似分区和分桶策略,通过将数据按特定规则划分成较小的单位并分布到不同节点上,利用并行计算能力以提升处理和分析性能,并加强了数据管理的灵活性。
DorisPowerData
头像Faith_xzc 发布于2024年08月27日
140浏览

一个离线IP地址定位库,微秒级别的查询效率,Star 16.5K+!

一个离线IP地址定位库,微秒级别的查询效率,Star 16.5K+!
有趣的开源集市
头像开源集市 发布于2024年08月23日
341浏览 2点赞

一场宁夏西瓜农事件,如同企业内部站队,最受伤的还是他们。。。

关于站队:YES OR NO?
有趣的开源集市
头像开源集市 发布于2024年08月23日
256浏览 3点赞

Flink SQL性能优化

在大数据处理领域,Apache Flink以其流处理和批处理一体化的能力,成为许多企业的首选。然而,随着数据量的增长,性能优化变得至关重要。本文将深入浅出地探讨Flink SQL的常见性能问题、调优方法、易错点及调优技巧,并提供代码示例。、
PowerData
头像忆往昔 发布于2024年08月21日
152浏览 1点赞
1 383940414282

微信(交流/反馈)

巨人肩膀初心:站在巨人肩膀上,避免无谓的重复劳动。 生产和汇聚行业技术、 知识经验、 工具组件 、案例产品,提供相关环境,为开发者提高生产效率提供切实有效的支持和帮助。并在这一进程中实现多方共赢。

由 深圳数智领航科技有限公司 提供动力 - 数智化领航者。

©2023-2025 - 巨人肩膀 - 粤ICP备2025395551号-1