博客园
最新
热门
发布
如何解决Flink广播流滞后于数据流抵达问题
flink专业问题咨询和解决
Flink
数据分析
林深见鹿
发布于2024年12月30日
108浏览
dolphinscheduler分布式集群部署指南(小白版)
dolphinscheduler-3.2.2-release版本源码系列之RPC框架专栏,帮助大家深入了解和更好的使用Dolphinscheduler整合现有业务开发。
Dolphinscheduler
如风掠过指尖
发布于2024年12月27日
405浏览
dolphinscheduler集群服务一键安装启动实现流程剖析
dolphinscheduler-3.2.2-release版本源码系列,帮助大家深入了解和更好的使用Dolphinscheduler整合现有业务开发。
Dolphinscheduler
如风掠过指尖
发布于2024年12月27日
115浏览
dolphinscheduler服务RPC框架源码解析(一)RPC框架整体设计
dolphinscheduler-3.2.2-release版本源码系列之RPC框架专栏,帮助大家深入了解和更好的使用Dolphinscheduler整合现有业务开发。
Dolphinscheduler
如风掠过指尖
发布于2024年12月27日
137浏览
美国陆军统一数据参考架构
美国陆军当前的数据架构过于复杂,严重阻碍了该军种的决策优势。为应对这一挑战,美国陆军于2024年3月22日正式发布了《美国陆军统一数据参考架构》1.0版本,旨在简化数据架构,精简数据产品,促进其与任务伙伴共享数据产品。该文件所定义的统一数据参考架构,为数据网格原则的系统级实施提供了指导,将使美国陆军的数据治理更高效、更有效,同时促进美国陆军采办“以数据为中心”的能力,提高美国陆军作为联盟、联合作战
数据治理
车车
发布于2024年12月24日
141浏览
AI Agent智能体产品的5个级别
OpenAI发布了其根据自身技术研发与产品开发的通往AGI的五级量表。OpenAI 将 AI 开发分为五个阶段,每个阶段代表更高级的能力水平
AI应用开发
车车
发布于2024年12月24日
387浏览
flink cdc pipeline+Dinky完成多库多表的同步
本公众号面向广大数据科学家、工程师、产品经理以及对大数据感兴趣的各界人士,旨在搭建一个交流学习的平台,共同探索数据驱动的美好未来。 通过关注“大数据启示录”,您将获得: 最新资讯:紧跟大数据领域最新动态和技术进展。 深度文章:深入剖析复杂问题,提供有价值的参考意见。 社区互动:参与线上线下活动,结识志同道合的朋友。 欢迎订阅“大数据启示录”,让我们一起开启数据之旅!
大数据启示录
Flink
Dinky
StarRocks
林深见鹿
发布于2024年12月24日
429浏览
2点赞
Flink八种分区算子
Flink是一个流处理框架,一个Flink-Job由多个Task/算子构成,逻辑层面构成一个链条,同时Flink支持并行操作,每一个并行度可以理解为一个数据管道称之为SubTask。
Flink
忆往昔
发布于2024年12月20日
110浏览
深入解析 StarRocks 物化视图:全方位的查询改写机制
本文将重点介绍如何利用物化视图进行查询改写。文章将全面介绍物化视图的基本原理、关键特性、应用案例、使用场景、代码细节以及主流大数据产品的物化视图改写能力对比。
StarRocks
蛇年大吉
发布于2024年12月19日
95浏览
Kafka Streams 在监控场景的应用与实践
介绍 Kafka Streams 的原理架构,常见配置以及在监控场景的应用。作者:来自 vivo 互联网服务器团队- Pang Haiyun
Kafka
蛇年大吉
发布于2024年12月18日
63浏览
Apache Hudi 1.0.0 版本正式发布
Apache Hudi 1.0.0 是 Apache Hudi 的一个重要里程碑版本。此版本包含重要的格式更改和令人兴奋的新功能。
Hudi
车车
发布于2024年12月17日
132浏览
Seatunnel本地模式快速测验
本节主要总结了单机模式下使用 seatunel完成官方示例程序,初步体会使用,其实使用起来还是很简单的,模式同我之前介绍的 DataX如出一辙,可喜的是它有自己的 web页面可以配置, 因此后面我将分享下如何在页面中进行配置同步任务,最后时间允许的情况下,分析起优秀的源码设计思路,千里之行始于足下,要持续学习,持续成长,然后持续分享,再会~。
SeaTunnel
春风得意
发布于2024年12月17日
70浏览
SeaTunnel初体验,5000字深入浅出带你用上Oracle-CDC
Apache SeaTunnel 是啥? 下一代高性能、分布式、海量数据集成框架。 支持上百个数据源、传输速度快、准确率高,丰富易扩展的连接器和插件化的连接器设计,能够更轻松的运行复杂的集成。 是一个分布式、高性能的数据集成平台,用于数据迁移和实时流处理任务。
SeaTunnel
海星之梦
发布于2024年12月17日
281浏览
一文详细解读Apache Flink 2.0最新特性
摘要:文章主要介绍了 Flink 2.0 - preview1 版本。其发布于 2024 年 10 月 23 日,是自 1.0 以来首个重大更新。此版本虽为预览版,不建议用于生产环境,但可让用户提前体验新功能并为社区提供反馈。
Flink
海星之梦
发布于2024年12月17日
660浏览
什么?!redis也可以是成本优化利器
交通路况团队主要负责AMAP(高德地图)轨迹收容和实时计算,不仅承担了实时路况的计算和发布,而且利用海量用户轨迹,陆续推出红绿倒计时和V2X(道路预警)等重磅功能,作为海量数据实时计算的基础链路,自然少不了对消息中间件的使用,一直以来我们都是集团MQ团队的重要客户,随着业务的快速发展,数据规模和计算频次进一步提升,MQ成本急剧增加,替换更加合适的消息中间件成为了必然。
Redis
滴滴
发布于2024年12月16日
116浏览
AI Coding 赛道全景解析:玩家有哪些?新机会在哪里?
AI Coding 可能是今年 AI 领域最热,最快找到 PMF 和商业化落地的赛道了。Github Copilot、Cursor、Bolt、Windsurf以及最近刚刚收费的Devin,诸多产品都实现了ARR 收入的高速增长。「海外独角兽」的这篇赛道全景图的分析,从投资角度详细梳理了目前AI Coding 赛道的代表性产品、竞争壁垒、以及之后发展的方向等,值得细读。授权转载,文章结构略有调整。
滴滴
发布于2024年12月16日
271浏览
Rust重写万物之——彻底重写SQLite
两年前,我们对 SQLite 进行了分叉。我们非常喜欢 SQLite 的嵌入式特性,但同时我们也渴望探索一种更加开放的开发模式。 在这样的背景下,libSQL 应运而生,作为一个开放的贡献项目,我们诚挚邀请社区成员加入我们,共同构建这个项目。
滴滴
发布于2024年12月16日
159浏览
拥抱 PyTorch,来自 Gauss 的自我革命
微信 Gauss 团队致力于提供业界领先的推荐工程技术服务,我们将持续跟进、推动关键领域的技术进步,与业界同仁一道,为提升用户价值而不懈努力。
滴滴
发布于2024年12月16日
176浏览
流存储Fluss:迈向湖流一体架构
在大数据处理领域,Lambda 架构是使用非常广泛的一种架构。Lambda 架构将数据处理分成单独的两条链路,一条是离线计算链路,通常由 Hive 作为离线计算链路的存储,另外一条是实时链路,通常由流存储,如 Kafka 作为实时链路的存储。
Flink
车车
发布于2024年12月16日
265浏览
Apache SeaTunnel 集群部署详细教程
SeaTunnel Engine 的Master服务和Worker服务分离,每个服务单独一个进程。Master节点只负责作业调度,RESTful API,任务提交等,Imap数据只存储在Master节点中。Worker节点只负责任务的执行,不参与选举成为Master,也不存储Imap数据。
SeaTunnel
车车
发布于2024年12月13日
119浏览
1
32
33
34
35
36
82