无匹配社区
博客园
最新
热门
请选择社区
发布
Apache Doris 基于 Workload Group 的负载隔离能力解读|Deep Dive 系列
现如今企业的数据查询需求在不断增多,在共享同一集群时,往往需要同时面对多个业务线或多种分析负载的并发查询。在有限的资源条件下,查询任务间的资源抢占将导致性能下降甚至集群不稳定,因此负载管理的重要性不言而喻。
Doris
PowerData
Faith_xzc
发布于 2024年08月27日
130浏览
3点赞
Apache Doris 故障自助排查指南(P0 篇)
Doris 运维的成本相较于其他相同定位的组件而言,其实已经下降了很多,但是在整体使用过程中,由于整体特性的研发行进速度过于快,所以整体稳定性上还是有一些瑕疵在内的。
Doris
PowerData
苏奕嘉
发布于 2024年08月27日
346浏览
2点赞
Flink 面试大全 基础篇
Flink是一个以 流 为核心的高可用、高性能的分布式计算引擎。具备 流批一体,高吞吐、低延迟,容错能力,大规模复杂计算等特点,在数据流上提供 数据分发、通信等功能。
Flink
忆往昔
发布于 2024年08月27日
145浏览
数据同步工具调研选型:SeaTunnel 与 DataX 、Sqoop、Flume、Flink CDC 对比
Apache SeaTunnel 是一个非常易用的超高性能分布式数据集成产品,支持海量数据的离线及实时同步。每天可稳定高效同步万亿级数据,已应用于数百家企业生产,也是首个由国人主导贡献到 Apache 基金会的数据集成顶级项目
SeaTunnel
Dataops
发布于 2024年08月27日
515浏览
Apache SeaTunnel技术架构演进及其在AI领域的应用
随着数据集成需求的增长,Apache SeaTunnel作为新一代的数据同步引擎,不仅在技术架构上不断演进,也在AI领域展现出其独特的应用价值。在CommunityOverCode Asia 2024大会上,Apache SeaTunnel PMC Chair 高俊 深入探讨SeaTunnel的技术演进路径,分析其在AI领域的应用案例,并展望未来的发展规划。
SeaTunnel
Dataops
发布于 2024年08月27日
134浏览
Apache Doris 全新分区策略 Auto Partition 应用场景与功能详解 | Deep Dive系列
在当今数据驱动的时代,如何高效、有序地管理数据库中的海量数据成为挑战。为了处理庞大的数据集,分布式数据库引入了类似分区和分桶策略,通过将数据按特定规则划分成较小的单位并分布到不同节点上,利用并行计算能力以提升处理和分析性能,并加强了数据管理的灵活性。
Doris
PowerData
Faith_xzc
发布于 2024年08月27日
107浏览
一个离线IP地址定位库,微秒级别的查询效率,Star 16.5K+!
一个离线IP地址定位库,微秒级别的查询效率,Star 16.5K+!
有趣的开源集市
开源集市
发布于 2024年08月23日
285浏览
2点赞
一场宁夏西瓜农事件,如同企业内部站队,最受伤的还是他们。。。
关于站队:YES OR NO?
有趣的开源集市
开源集市
发布于 2024年08月23日
204浏览
3点赞
Flink SQL性能优化
在大数据处理领域,Apache Flink以其流处理和批处理一体化的能力,成为许多企业的首选。然而,随着数据量的增长,性能优化变得至关重要。本文将深入浅出地探讨Flink SQL的常见性能问题、调优方法、易错点及调优技巧,并提供代码示例。、
PowerData
忆往昔
发布于 2024年08月21日
133浏览
1点赞
一款称为“网络瑞士军刀”的数据处理神器,用简单的办法解决复杂的问题,Star 28K+!
一款称为“网络瑞士军刀”的数据处理神器,用简单的办法解决复杂的问题,Star 28K+!
有趣的开源集市
开源集市
发布于 2024年08月21日
124浏览
Doris SQL语句优化
Doris优化是一个综合性的过程,涉及到多个方面的调整和改进,以提升数据库的整体性能和稳定性。这里是收集整理的一些关键的优化策略,供您参考,欢迎投稿。
PowerData
忆往昔
发布于 2024年08月21日
203浏览
Bigtop 从0开始
BigTop的应用场景: 1. BigTop通过提供预配置的Docker镜像,极大简化了在不同操作系统上编译大数据组件的rpm或deb包的过程,使之变得快捷且高效。 2. BigTop集成了编译过程中所需的复杂依赖关系,有效解决了常见的编译错误,并且通过代码中的补丁确保了流畅的编译体验。这意味着,用户不再需要为官方包无法编译或搭建复杂的编译环境而感到困扰。 3. 提供了对Apache Ambari
Bigtop
蔡佳良
发布于 2024年08月21日
733浏览
PMC对话华润置地在SeaTunnel的应用实践,一起解读2.3.6版本最新特性
📣对于大数据工程师来说,使用开源软件可能要面对各种各样的问题,而随着开源工具的快速发展,如何又快又好又稳的在生产部署上“开源工具”,是大家面临的挑战之一!👩👩👧👧熟悉社区的老粉都知道,社区举办PMC对话标杆用户的主题活动目的,就是为了让更多人了解并且又快又好又稳的使用上Apache SeaTunnel!
SeaTunnel
Dataops
发布于 2024年08月21日
88浏览
2点赞
有哪些开源的大数据管理平台?
大数据基础服务平台是一种用于管理、存储、处理和分析大量数据的平台。它提供了一系列的大数据处理和分析工具,包括 Hadoop、Hive、HBase、Spark、Flink、Zookeeper、Kafka 等,使得企业和组织能够更好地理解和利用他们的数据。
HiDataPlus
Ambari
Bigtop
随风
发布于 2024年08月20日
1793浏览
Jiron-cloud 开源项目集成 Dinky 实践分享
在某大型银行的实时数据处理项目中,我们选择了Dinky 作为数据流处理的核心引擎。该项目的主要目标是实现对银行交易数据的实时监控和分析,从而提高反欺诈能力和业务响应速度。
Dinky
文末丶
发布于 2024年08月20日
317浏览
一个PDF转Markdown工具,高精准识别,自动去干扰元素,和LLM更配哦!Star 15K+!
一个PDF转Markdown工具,高精准识别,自动去干扰元素,和LLM更配哦!Star 15K+!
有趣的开源集市
开源集市
发布于 2024年08月20日
759浏览
2点赞
6:kubernetes 基本操作
kubernetes 基本操作
Docker
Kubernetes
Linux
久安
发布于 2024年08月20日
139浏览
DevOps入门
DevOps 是开发 (Dev) 和运营 (Ops) 的复合词,它将人、流程和技术结合起来,不断地为客户提供价值。
Docker
久安
发布于 2024年08月19日
243浏览
1点赞
网站SEO怎么做?
seo优化策略
Web前端
SEO
梦想家
发布于 2024年08月19日
79浏览
2点赞
SeaTunnel及SeaTunnel Web部署指南(小白版)
现在你能搜索到的SeaTunnel的安装。部署基本都有坑,官网的文档也是见到到相当于没有,基本很难找到一个适合新手小白第一次上手就能成功安装部署的版本,于是就有了这个部署指南的分享,小主已经把可能遇到的坑都填过了,希望大家都能安安稳稳上路,不掉坑,话不多说,走起~
SeaTunnel
如风掠过指尖
发布于 2024年08月19日
2706浏览
1
30
31
32
33
34
73