博客园
最新
热门
发布
日榜
周榜
月榜
Apache Dolphinscheduler Standalone 部署教程
Standalone 仅适用于 DolphinScheduler 的快速体验. 如果你是新手,想要体验 DolphinScheduler 的功能,推荐使用Standalone方式体检。 如果你想体验更完整的功能,或者更大的任务量,推荐使用伪集群部署。如果你是在生产中使用,推荐使用集群部署或者kubernetes。
实践
Dataops
发布于2024年10月16日
275浏览
1点赞
1收藏
11:安装K8S可视化页面——Dashboard
K8S-Dashboard 是基于网页的 Kubernetes 用户界面, 你可以使用 Dashboard 将容器应用部署到 Kubernetes 集群中,也可以对容器应用排错,还能管理集群资源
久安
发布于2024年10月10日
403浏览
2点赞
1收藏
Dinky集成Paimon数据源!可视化读取paimon元数据,支持HDFS,S3, Hive
这是一篇关于使用 Dinky 操作 Paimon 的教程。包括通过 Docker 快速部署 Dinky、准备 Paimon 依赖、初始化 Paimon 表、注册 Paimon 数据源、查看HDFS Paimon 元数据以及在 S3/OSS/COS/OBS 上使用 Paimon 的方法。
墨无痕
发布于2024年09月26日
1053浏览
1点赞
1收藏
1 简介
中文,免费,零起点,完整示例,基于最新的Python 3版本。 Python是一种计算机程序设计语言。你可能已经听说过很多种流行的编程语言,比如非常难学的C语言,非常流行的Java语言,适合初学者的Basic语言,适合网页编程的JavaScript语言等等。
忆往昔
发布于2024年09月09日
321浏览
大数据运维实战:Spark作业的监控与深度诊断
Apache Spark是一个强大的大数据处理框架,广泛应用于数据分析、机器学习和实时数据处理等领域。然而,随着数据规模的扩大和作业复杂性的增加,如何有效地监控和诊断Spark作业的资源使用状态变得尤为重要。本文将探讨Spark作业的常用监控工具、任务的资源状态诊断。
忆往昔
发布于2024年09月05日
622浏览
一个自托管的翻译平台,无需依赖外部服务,离线版的Google翻译,Star 7.8K!
一个自托管的翻译平台,无需依赖外部服务,离线版的Google翻译,Star 7.8K!
开源集市
发布于2024年09月05日
2039浏览
1点赞
1收藏
一个开源的网页变化监控工具,实时自动化检测网页变化内容,简单实用,Star 16.5K+!
一个开源的网页变化监控工具,实时自动化检测网页变化内容,简单实用,Star 16.5K+!
开源集市
发布于2024年09月05日
1463浏览
1点赞
1收藏
【Apache Doris】数据均衡问题排查指南
当集群处于以下几种情况时,可参考本文进行问题排查。 BE节点之间的数据不均 单个BE节点上的多个磁盘之间的数据不均 BE节点的上线和下线进度卡死(BE的tablet数量没有变化)
Faith_xzc
发布于2024年08月29日
936浏览
1点赞
网站SEO怎么做?
seo优化策略
SEO
梦想家
发布于2024年08月19日
155浏览
2点赞
Dinky手把手教程-Docker快速部署
Docker快速启动dinky
墨无痕
发布于2024年08月15日
1162浏览
1点赞
Dinky手把手教程 - 集成K8s,提交Flink On K8s Application任务
本文介绍了Dinky与K8s集成指南,包括环境准备、服务账号创建、镜像制作、Dockerfile编写、镜像构建推送、Kubernetes集群配置,以及FlinkSQL任务的提交。
墨无痕
发布于2024年08月14日
1157浏览
1点赞
海豚调度清理:使用 API 轻松清理历史工作流实例以及日志文件
本系列文章是 DolphinScheduler 由浅入深的教程,涵盖搭建、二开迭代、核心原理解读、运维和管理等一系列内容。适用于想对 DolphinScheduler了解或想要加深理解的读者。**
Dataops
发布于2024年08月14日
750浏览
1点赞
58用户画像数据仓库建设实践
大家好,我是来自 58 同城的包磊,于 18 年加入了 58,目前所在部门是 TEG-大数据科学中心-数据 BP 部。主要负责建立整个集团的用户数据体系,涵盖了流量、连接、用户画像等主题数仓的建设。
随风
发布于2024年08月12日
745浏览
Apache DolphinScheduler 1.3.4升级至3.1.2版本过程中的踩坑记录
因为在工作中需要推动Apache DolphinScheduler的升级,经过预研,从1.3.4到3.1.2有的体验了很大的提升,在性能和功能性有了很多的改善,推荐升级。 查看官方的升级文档,可知有提供升级脚本,如果只是跨小版本的更新那么只用执行脚本就好了,但跨多个大版本升级时依然容易出现各种问题,特此总结。
Dataops
发布于2024年08月07日
102浏览
开源免费的数据集成工具 Data Integration
数据集成 (Data Integration) 是指将不同来源的数据整合到一个统一的数据库或数据仓库中,以便进行数据分析和处理。数据集成可以帮助我们从不同的数据源中提取有用的信息,并将其整合到一个统一的视图中,从而更好地理解和分析数据。
海星之梦
发布于2024年07月29日
1293浏览
一文搭建零售数据分析“人货场”模型之“人”
一文搭建零售数据分析“人货场”模型之“人”
数据分析狮
发布于2024年07月17日
427浏览
1点赞
Coze助你打造专属AI,完全免费!
扣子(Coze)AI Bot 开发平台,作为一个新兴的 AI 技术工具,旨在为开发者提供一个强大的、易于使用的平台,以便快速构建和部署智能聊天机器人。这个平台的市场定位是服务于那些希望在客户服务、市场营销、数据分析等领域利用人工智能技术的企业或个人开发者。
AI应用开发社区
海星之梦
发布于2024年06月20日
527浏览
2点赞
Flink 开发利器 Apache StreamPark™
Hadoop 体系虽然在目前应用非常广泛,但架构繁琐、运维复杂度过高、版本升级困难,且由于部门原因,数据中台需求排期较长,我们急需探索敏捷性开发的数据平台模式。
忆往昔
发布于2024年05月20日
971浏览
1点赞
StarRocks 助力金融营销数字化进化之路
平安银行五位一体,做零售金融的领先银行,五位一体是由开放银行、AI 银行、远程银行、线下银行、综合化银行协同构建的数据化、智能化的零售客户经营模式,这套模式以数据为基础,AI 为内核,通过画像识别,基于场景数据分析,通过高效组织内部资源,为客户提供精准服务,实现零售转型业务增长的第二曲线。 通过颠覆传统“以产品为中心”模式,真正实现以客户为中心、以 AI 、大数据为驱动,以 KYC/KYP/KYA
洪波涌起
发布于2024年03月25日
490浏览
漫画讲解Kafka高效的存储设计
今天,跟大家分享一下kafka 的存储机制及如何根据 offset 查找消息的。
车车
发布于2024年03月25日
194浏览
1
2
3
4
5
6
83