博客园
最新
热门
发布
ElasticSearch实战文档
这篇非常全面的使用教程,介绍了ElasticSearch 的必备知识: **从快速入门、索引管理、索引监控、索引别名再到映射详解** 。
Elasticsearch
忆往昔
16 浏览
TB 级数据入库无压力:Apache DolphinScheduler 助力 ClickHouse 优化
🚀 如今,随着大数据、物联网、人工智能等技术的快速发展,数据量呈现指数级增长。企业迫切需要一个既能快速处理大规模数据,又能保障性能稳定的数据库系统。ClickHouse 在数据分析与查询性能方面表现优异,但随着数据规模不断增长,其在数据写入与合并阶段的瓶颈也日渐凸显。
Dolphinscheduler
Clickhouse
忆往昔
25 浏览
Apache Dolphinscheduler Standalone 部署教程
Standalone 仅适用于 DolphinScheduler 的快速体验. 如果你是新手,想要体验 DolphinScheduler 的功能,推荐使用Standalone方式体检。 如果你想体验更完整的功能,或者更大的任务量,推荐使用伪集群部署。如果你是在生产中使用,推荐使用集群部署或者kubernetes。
Dolphinscheduler
实践
Dataops
29 浏览
1 点赞
1 收藏
11:安装K8S可视化页面——Dashboard
K8S-Dashboard 是基于网页的 Kubernetes 用户界面, 你可以使用 Dashboard 将容器应用部署到 Kubernetes 集群中,也可以对容器应用排错,还能管理集群资源
Docker
Kubernetes
Linux
久安
44 浏览
2 点赞
1 收藏
vue项目中使用videojs,组件的封装
笔记
Web前端
实现
梦想家
42 浏览
1 点赞
Dinky集成Paimon数据源!可视化读取paimon元数据,支持HDFS,S3, Hive
这是一篇关于使用 Dinky 操作 Paimon 的教程。包括通过 Docker 快速部署 Dinky、准备 Paimon 依赖、初始化 Paimon 表、注册 Paimon 数据源、查看HDFS Paimon 元数据以及在 S3/OSS/COS/OBS 上使用 Paimon 的方法。
Dinky
墨无痕
67 浏览
1 点赞
1 收藏
Dinky集成Doris CdcTool 进行数据同步
本教程介绍使用 Dinky 运行 CDC pipeline 任务实现整库同步 Doris 并自动建表。包括前置条件、Docker 部署 Dinky、部署 Doris 与 MySQL 测试环境及具体操作步骤等内容。
Dinky
墨无痕
88 浏览
1 点赞
大型企业与中小型企业的数据治理做法差异
在当今数字化时代,数据已成为企业最宝贵的资产之一,数据治理的重要性日益凸显。然而,由于企业规模、业务模式及资源状况的差异,大型企业与中小型企业在数据治理方面的做法存在显著不同。
数据治理
忆往昔
23 浏览
Lambda架构和Kappa架构
随着每天都会出现不同的应用场景,数据管理者会相应地评估他们的架构设计。 无论您代表哪个团队,都有一个共同的问题:数据处理。数据处理模式和工具正在不断变化和发展。在本文中,我将介绍Lambda和Kappa数据处理架构作为数据处理架构决策的基础。
数据平台架构
忆往昔
23 浏览
构建湖仓一体架构关键:统一元数据管理
湖仓一体架构作为一种新兴的数据管理解决方案,通过整合数据湖的灵活性和数据仓库的高性能,为企业提供了一个统一的数据平台。统一元数据管理作为湖仓一体架构的基石,它确保了数据的一致性、可发现性和治理性。
数据平台架构
数据湖
数据仓库/中台
忆往昔
38 浏览
1 收藏
怎么办?用DolphinScheduler调度执行复杂的HiveSQL时无法正确识别符号
在使用Apache DolphinScheduler调度执行复杂的HiveSQL时,HQL包含多种DolphinScheduler无法正确识别的符号,怎么办?本文提供了可行的思路和方法,供用户参考。
Dolphinscheduler
Hive
实践
随风
23 浏览
什么是 Apache StreamPark™
实时即未来,在实时处理流域 Apache Spark™ 和 Apache Flink® 是一个伟大的进步,尤其是 Flink 被普遍认为是下一代大数据流计算引擎。
Streampark
Flink
Spark
忆往昔
63 浏览
Hello 算法 第0章 前言
算法犹如美妙的交响乐,每一行代码都像韵律般流淌。愿这本书在你的脑海中轻轻响起,留下独特而深刻的旋律。
数据结构和算法
忆往昔
49 浏览
饿了么基于Flink+Paimon+StarRocks的实时湖仓探索
本文整理自饿了么大数据架构师、Apache Flink Contributor 王沛斌老师在8月3日 Streaming Lakehouse Meetup Online(Paimon x StarRocks,共话实时湖仓架构)上的分享。主要分为以下三个内容:1. 饿了么实时数仓演进之路2. 实时湖仓方案选型与探3. 实时湖仓规划及展望。
Flink
Paimon
StarRocks
数智先锋
141 浏览
记一次Hiveserver2连接异常的解决-腾讯云-emr
离线任务跑的好好的,忽然有一天失败了,查看海豚上的任务执行日志发现是hiveserver2连接超时了。 查看监控发现了几个问题一个是GC变得频繁,另一个是连接数达到上限了。
Hive
随风
53 浏览
1 收藏
shell 文件打开情况工具 lsof
lsof(list open files)是一个列出当前系统打开文件的工具。在linux环境下,任何事物都以文件的形式存在,通过文件不仅仅可以访问常规数据,还可以访问网络连接和硬件。
Linux
随风
37 浏览
shell 网络工具 netstat
Linux netstat 命令用于显示网络状态。利用 netstat 指令可让你得知整个 Linux 系统的网络情况.
Linux
随风
36 浏览
1 收藏
StarRocks 培训课程重磅上线!专家出品,助你升级打怪不走弯路!
今年已过了大半,大家的学习进度条进展如何?如果你对 StarRocks 的基础知识还有疑惑,或在寻找系统性的学习方法,不必灰心,因为 Rocky 要来助你一臂之力啦!
StarRocks
巨人肩膀小编
58 浏览
1 简介
中文,免费,零起点,完整示例,基于最新的Python 3版本。 Python是一种计算机程序设计语言。你可能已经听说过很多种流行的编程语言,比如非常难学的C语言,非常流行的Java语言,适合初学者的Basic语言,适合网页编程的JavaScript语言等等。
Python开发
忆往昔
40 浏览
大数据技术选型问卷内容征集~~~
计划下周做一个针对大数据技术选型的问卷,写了10个问题,欢迎各位大数据同仁针对这份文件内容提出你的宝贵建议,先谢过了。
数据平台架构
数据仓库/中台
数据治理
PowerData
巨人肩膀小编
83 浏览
2 点赞
1 收藏
1
2
3
4
5
6
44