无匹配社区
博客园
最新
热门
请选择社区
发布
Flink CDC 在新能源制造业的实践
我们是一家专注于新能源动力电池制造的企业,致力于推动能源技术的发展与应用。作为一家具有多年行业经验的企业,我们在新能源领域积累了深厚的技术实力和市场认知,业务涵盖了新能源产业链的关键环节。从上游的装备制造到下游的应用解决方案,为客户提供了全方位的服务。
Flink
Streampark
忆往昔
发布于 2024年08月27日
234浏览
Dinky 提交 K8S Application 任务
Dinky 是一个基于 Apache Flink 的实时计算平台,它提供了一站式的 Flink 任务开发、运维、监控等功能。Kubernetes 是一个强大的容器编排平台,能够自动化应用的部署、扩展和管理。将 Flink 与 Kubernetes 集成,可以充分利用 Kubernetes 的优势,实现 Flink 任务的弹性伸缩、自动化部署和高可用性。
Dinky
忆往昔
发布于 2024年08月27日
119浏览
Dinky教程- 数据源那些你不知道的功能
Dinky数据源教程介绍了如何配置和使用数据源,包括Flink连接配置和Flink连接模板,以实现数据源的统一管理和简化开发流程。
Dinky
墨无痕
发布于 2024年08月27日
571浏览
3点赞
Apache Doris 基于 Workload Group 的负载隔离能力解读|Deep Dive 系列
现如今企业的数据查询需求在不断增多,在共享同一集群时,往往需要同时面对多个业务线或多种分析负载的并发查询。在有限的资源条件下,查询任务间的资源抢占将导致性能下降甚至集群不稳定,因此负载管理的重要性不言而喻。
Doris
PowerData
Faith_xzc
发布于 2024年08月27日
129浏览
3点赞
Apache Doris 故障自助排查指南(P0 篇)
Doris 运维的成本相较于其他相同定位的组件而言,其实已经下降了很多,但是在整体使用过程中,由于整体特性的研发行进速度过于快,所以整体稳定性上还是有一些瑕疵在内的。
Doris
PowerData
苏奕嘉
发布于 2024年08月27日
345浏览
2点赞
Flink 面试大全 基础篇
Flink是一个以 流 为核心的高可用、高性能的分布式计算引擎。具备 流批一体,高吞吐、低延迟,容错能力,大规模复杂计算等特点,在数据流上提供 数据分发、通信等功能。
Flink
忆往昔
发布于 2024年08月27日
144浏览
数据同步工具调研选型:SeaTunnel 与 DataX 、Sqoop、Flume、Flink CDC 对比
Apache SeaTunnel 是一个非常易用的超高性能分布式数据集成产品,支持海量数据的离线及实时同步。每天可稳定高效同步万亿级数据,已应用于数百家企业生产,也是首个由国人主导贡献到 Apache 基金会的数据集成顶级项目
SeaTunnel
Dataops
发布于 2024年08月27日
515浏览
Apache SeaTunnel技术架构演进及其在AI领域的应用
随着数据集成需求的增长,Apache SeaTunnel作为新一代的数据同步引擎,不仅在技术架构上不断演进,也在AI领域展现出其独特的应用价值。在CommunityOverCode Asia 2024大会上,Apache SeaTunnel PMC Chair 高俊 深入探讨SeaTunnel的技术演进路径,分析其在AI领域的应用案例,并展望未来的发展规划。
SeaTunnel
Dataops
发布于 2024年08月27日
132浏览
Apache Doris 全新分区策略 Auto Partition 应用场景与功能详解 | Deep Dive系列
在当今数据驱动的时代,如何高效、有序地管理数据库中的海量数据成为挑战。为了处理庞大的数据集,分布式数据库引入了类似分区和分桶策略,通过将数据按特定规则划分成较小的单位并分布到不同节点上,利用并行计算能力以提升处理和分析性能,并加强了数据管理的灵活性。
Doris
PowerData
Faith_xzc
发布于 2024年08月27日
106浏览
一个离线IP地址定位库,微秒级别的查询效率,Star 16.5K+!
一个离线IP地址定位库,微秒级别的查询效率,Star 16.5K+!
有趣的开源集市
开源集市
发布于 2024年08月23日
284浏览
2点赞
一场宁夏西瓜农事件,如同企业内部站队,最受伤的还是他们。。。
关于站队:YES OR NO?
有趣的开源集市
开源集市
发布于 2024年08月23日
202浏览
3点赞
Flink SQL性能优化
在大数据处理领域,Apache Flink以其流处理和批处理一体化的能力,成为许多企业的首选。然而,随着数据量的增长,性能优化变得至关重要。本文将深入浅出地探讨Flink SQL的常见性能问题、调优方法、易错点及调优技巧,并提供代码示例。、
PowerData
忆往昔
发布于 2024年08月21日
133浏览
1点赞
一款称为“网络瑞士军刀”的数据处理神器,用简单的办法解决复杂的问题,Star 28K+!
一款称为“网络瑞士军刀”的数据处理神器,用简单的办法解决复杂的问题,Star 28K+!
有趣的开源集市
开源集市
发布于 2024年08月21日
124浏览
Doris SQL语句优化
Doris优化是一个综合性的过程,涉及到多个方面的调整和改进,以提升数据库的整体性能和稳定性。这里是收集整理的一些关键的优化策略,供您参考,欢迎投稿。
PowerData
忆往昔
发布于 2024年08月21日
202浏览
Bigtop 从0开始
BigTop的应用场景: 1. BigTop通过提供预配置的Docker镜像,极大简化了在不同操作系统上编译大数据组件的rpm或deb包的过程,使之变得快捷且高效。 2. BigTop集成了编译过程中所需的复杂依赖关系,有效解决了常见的编译错误,并且通过代码中的补丁确保了流畅的编译体验。这意味着,用户不再需要为官方包无法编译或搭建复杂的编译环境而感到困扰。 3. 提供了对Apache Ambari
Bigtop
蔡佳良
发布于 2024年08月21日
731浏览
PMC对话华润置地在SeaTunnel的应用实践,一起解读2.3.6版本最新特性
📣对于大数据工程师来说,使用开源软件可能要面对各种各样的问题,而随着开源工具的快速发展,如何又快又好又稳的在生产部署上“开源工具”,是大家面临的挑战之一!👩👩👧👧熟悉社区的老粉都知道,社区举办PMC对话标杆用户的主题活动目的,就是为了让更多人了解并且又快又好又稳的使用上Apache SeaTunnel!
SeaTunnel
Dataops
发布于 2024年08月21日
88浏览
2点赞
有哪些开源的大数据管理平台?
大数据基础服务平台是一种用于管理、存储、处理和分析大量数据的平台。它提供了一系列的大数据处理和分析工具,包括 Hadoop、Hive、HBase、Spark、Flink、Zookeeper、Kafka 等,使得企业和组织能够更好地理解和利用他们的数据。
HiDataPlus
Ambari
Bigtop
随风
发布于 2024年08月20日
1784浏览
Jiron-cloud 开源项目集成 Dinky 实践分享
在某大型银行的实时数据处理项目中,我们选择了Dinky 作为数据流处理的核心引擎。该项目的主要目标是实现对银行交易数据的实时监控和分析,从而提高反欺诈能力和业务响应速度。
Dinky
文末丶
发布于 2024年08月20日
315浏览
一个PDF转Markdown工具,高精准识别,自动去干扰元素,和LLM更配哦!Star 15K+!
一个PDF转Markdown工具,高精准识别,自动去干扰元素,和LLM更配哦!Star 15K+!
有趣的开源集市
开源集市
发布于 2024年08月20日
756浏览
2点赞
6:kubernetes 基本操作
kubernetes 基本操作
Docker
Kubernetes
Linux
久安
发布于 2024年08月20日
136浏览
1
29
30
31
32
33
73