博客园
最新
热门
发布
【HarmonyOS NEXT】lv-markdown-in 三方库用法说明
鸿蒙
能不忆江南
发布于2024年12月30日
178
【HarmonyOS NEXT】hdc环境变量配置
鸿蒙
能不忆江南
发布于2024年12月30日
287
解决Redis缓存数据类型丢失问题
文章讲述在通用数据开放平台中,新接口开启缓存后报错,经排查是 Redis 缓存数据类型丢失所致。分析发现问题源于 Redis 序列化和反序列化,最终通过自定义序列化器解决,即在写入和读取时处理 Date 类型,同时指出当前判断逻辑有待优化。
图南
发布于2024年12月30日
241
StarRocks元数据无法合并BUG原理与解决
StarRocks 集群运行几个月后崩溃,元数据很久未合并,恢复时发现 FE 元数据无法 Checkpoint。排查发现是配置 metadata_journal_skip_bad_journal_ids 导致,相关 bugfix 未合并进出问题版本,升级版本后解决,成功生成新 image 文件,BDB 文件数量大幅减少。
图南
发布于2024年12月30日
328
数据同步方式的变迁
本文深入探讨了博主亲身参与并实践的四代数据同步技术方案。文章不仅追溯了每一代方案的诞生背景,还详尽阐述了它们的设计细节和实施过程。从2020年起步的第一代方案,该方案依托于强大的Spark框架,到最新的第四代方案,该方案采用了先进的CDC(Change Data Capture)技术,每一代方案都在实际应用场景中得到了充分的测试和验证。
图南
发布于2024年12月30日
357
paimon-flink-action同步数据到Paimon
湖仓一体之paimon-flink-action同步数据到Paimon
林深见鹿
发布于2024年12月30日
925
Flink CDC+Dinky整库同步到paimon
湖仓一体之Flink CDC+Dinky整库同步到paimon
林深见鹿
发布于2024年12月30日
496
如何解决Flink广播流滞后于数据流抵达问题
flink专业问题咨询和解决
林深见鹿
发布于2024年12月30日
225
dolphinscheduler分布式集群部署指南(小白版)
dolphinscheduler-3.2.2-release版本源码系列之RPC框架专栏,帮助大家深入了解和更好的使用Dolphinscheduler整合现有业务开发。
如风掠过指尖
发布于2024年12月27日
907
dolphinscheduler集群服务一键安装启动实现流程剖析
dolphinscheduler-3.2.2-release版本源码系列,帮助大家深入了解和更好的使用Dolphinscheduler整合现有业务开发。
如风掠过指尖
发布于2024年12月27日
315
dolphinscheduler服务RPC框架源码解析(一)RPC框架整体设计
dolphinscheduler-3.2.2-release版本源码系列之RPC框架专栏,帮助大家深入了解和更好的使用Dolphinscheduler整合现有业务开发。
如风掠过指尖
发布于2024年12月27日
360
美国陆军统一数据参考架构
美国陆军当前的数据架构过于复杂,严重阻碍了该军种的决策优势。为应对这一挑战,美国陆军于2024年3月22日正式发布了《美国陆军统一数据参考架构》1.0版本,旨在简化数据架构,精简数据产品,促进其与任务伙伴共享数据产品。该文件所定义的统一数据参考架构,为数据网格原则的系统级实施提供了指导,将使美国陆军的数据治理更高效、更有效,同时促进美国陆军采办“以数据为中心”的能力,提高美国陆军作为联盟、联合作战
车车
发布于2024年12月24日
304
AI Agent智能体产品的5个级别
OpenAI发布了其根据自身技术研发与产品开发的通往AGI的五级量表。OpenAI 将 AI 开发分为五个阶段,每个阶段代表更高级的能力水平
AI应用开发社区
车车
发布于2024年12月24日
796
flink cdc pipeline+Dinky完成多库多表的同步
本公众号面向广大数据科学家、工程师、产品经理以及对大数据感兴趣的各界人士,旨在搭建一个交流学习的平台,共同探索数据驱动的美好未来。 通过关注“大数据启示录”,您将获得: 最新资讯:紧跟大数据领域最新动态和技术进展。 深度文章:深入剖析复杂问题,提供有价值的参考意见。 社区互动:参与线上线下活动,结识志同道合的朋友。 欢迎订阅“大数据启示录”,让我们一起开启数据之旅!
林深见鹿
发布于2024年12月24日
833
Flink八种分区算子
Flink是一个流处理框架,一个Flink-Job由多个Task/算子构成,逻辑层面构成一个链条,同时Flink支持并行操作,每一个并行度可以理解为一个数据管道称之为SubTask。
忆往昔
发布于2024年12月20日
273
深入解析 StarRocks 物化视图:全方位的查询改写机制
本文将重点介绍如何利用物化视图进行查询改写。文章将全面介绍物化视图的基本原理、关键特性、应用案例、使用场景、代码细节以及主流大数据产品的物化视图改写能力对比。
蛇年大吉
发布于2024年12月19日
260
Kafka Streams 在监控场景的应用与实践
介绍 Kafka Streams 的原理架构,常见配置以及在监控场景的应用。作者:来自 vivo 互联网服务器团队- Pang Haiyun
蛇年大吉
发布于2024年12月18日
154
Apache Hudi 1.0.0 版本正式发布
Apache Hudi 1.0.0 是 Apache Hudi 的一个重要里程碑版本。此版本包含重要的格式更改和令人兴奋的新功能。
车车
发布于2024年12月17日
267
Seatunnel本地模式快速测验
本节主要总结了单机模式下使用 seatunel完成官方示例程序,初步体会使用,其实使用起来还是很简单的,模式同我之前介绍的 DataX如出一辙,可喜的是它有自己的 web页面可以配置, 因此后面我将分享下如何在页面中进行配置同步任务,最后时间允许的情况下,分析起优秀的源码设计思路,千里之行始于足下,要持续学习,持续成长,然后持续分享,再会~。
春风得意
发布于2024年12月17日
188
SeaTunnel初体验,5000字深入浅出带你用上Oracle-CDC
Apache SeaTunnel 是啥? 下一代高性能、分布式、海量数据集成框架。 支持上百个数据源、传输速度快、准确率高,丰富易扩展的连接器和插件化的连接器设计,能够更轻松的运行复杂的集成。 是一个分布式、高性能的数据集成平台,用于数据迁移和实时流处理任务。
海星之梦
发布于2024年12月17日
594
1
33
34
35
36
37
83