无匹配社区
博客园
最新
热门
请选择社区
发布
Linkis 简述
Linkis 在上层应用程序和底层引擎之间构建了一层计算中间件。通过使用Linkis 提供的REST/WebSocket/JDBC 等标准接口,上层应用可以方便地连接访问MySQL/Spark/Hive/Presto/Flink 等底层引擎,同时实现变量、脚本、函数和资源文件等用户资源的跨上层应用互通,以及通过REST标准接口提供了数据源管理和数据源对应的元数据查询服务。 作为计算中间件,Link
Linkis
数智先锋
发布于 2024年03月27日
63浏览
Apache Doris取代ClickHouse、MySQL、Presto和HBase
Apache Doris 可以取代 ClickHouse、MySQL、Presto 和 HBase,因为它在数据处理管道上拥有全面的功能集合。在数据摄取方面,基于对 Flink CDC 和 Merge-on-Write 的支持,实现了低延迟实时写入。通过其标签机制和事务加载来保证 Exactly-Once 写入。在数据查询方面,它同时支持星型模式和平面表聚合,因此在麻烦的多表连接和大型单表查询中都
Doris
Clickhouse
MySQL
Hbase
数智先锋
发布于 2024年03月27日
307浏览
一文掌握ClickHouse
ClickHouse 是Yandex开源的一个用于实时数据分析的基于列存储的数据库,其处理数据的速度比传统方法快100-1000 倍。 ClickHouse的性能超过了目前市场上可比的面向列的 DBMS,每秒钟每台服务器每秒处理数亿至十亿多行和数十千兆字节的数据。
Clickhouse
数智先锋
发布于 2024年03月26日
239浏览
数据管理、数据治理、数据资产管理,到底有何不同?
数据治理、数据管理、数据资产管理,有什么不同?这是一个我被问的最多的问题。
数据治理
数智先锋
发布于 2024年03月26日
232浏览
数据中台建设方案-方法论
1
中台是真正为前台而生的平台(可以是技术平台,业务能力甚至是组织机构),它存在的唯一目的就是更好的服务前台规模化创新,进而更好的响应服务引领用户,使企业真正做到自身能力与用户需求的持续对接。
数据仓库/中台
数智先锋
发布于 2024年03月26日
49浏览
1点赞
快手BI大数据分析场景性能优化实践
快手大数据分析平台,作为一个数据输出平台,对于用户而言,面临的挑战主要包括: 性能分析难:不清楚耗时在哪个环节,平台对用户来说是黑盒的;不了解数据消费用户的查询特征;性能波动难以归因。 优化门槛高:需要很强的知识背景,很强的专业领域性,而分析用户通常是小白用户无法自己进行分析和优化。 平台方面,也面临一些挑战: 分析复杂度高:30%以上的复杂分析,包含同环比、占比、LOD分析等; 引擎查询复杂度高
数智先锋
发布于 2024年03月26日
250浏览
高效管理湖仓的开源解决方案-Amoro
首先 Amoro 是湖仓管理系统,这里我们借鉴了数据库管理系统的叫法,可能很多同学乍一听会觉得管理系统会类似于实时计算、离线开发一类的工具平台,这里我稍稍做个澄清:工具的目标是帮助用户更高效、便利地执行某种流程,而Amoro 的目标是将一些流程向用户屏蔽,交给用户一个黑盒,他的定位更多是一个基础软件,所以 Amoro 的 MS 类似于 DBMS 中的 MS,我们经常讲一句话:build a box
Amoro
随风
发布于 2024年03月26日
178浏览
1点赞
浙江电信基于 Amoro + Apache Iceberg 构建实时湖仓实践
Amoro 是一个构建在 Apache Iceberg 等开放数据湖表格之上的湖仓管理系统,提供了一套可插拔的数据自优化机制和管理服务,旨在为用户带来开箱即用的湖仓使用体验。
Iceberg
随风
发布于 2024年03月26日
294浏览
深入解读 Flink SQL 实现流处理的核心技术
1w+ 字深入解读 Flink SQL 实现流处理的核心技术!
Flink
车车
发布于 2024年03月26日
64浏览
【行业资讯】康林松:为电动化提供选择权,向贸易壁垒说不,对中国加大投资
总而言之,这一讲话的很多理念,从优先经济发展的决心,到进一步开放市场和欢迎跨国企业继续在华投资,特别是关于高质量增长和可持续发展,与梅赛德斯-奔驰的理念不谋而合。我们将会进一步在中国加大投入,在华发展,与华共进。
车联网
车车
发布于 2024年03月26日
70浏览
1点赞
StarRocks 助力金融营销数字化进化之路
平安银行五位一体,做零售金融的领先银行,五位一体是由开放银行、AI 银行、远程银行、线下银行、综合化银行协同构建的数据化、智能化的零售客户经营模式,这套模式以数据为基础,AI 为内核,通过画像识别,基于场景数据分析,通过高效组织内部资源,为客户提供精准服务,实现零售转型业务增长的第二曲线。 通过颠覆传统“以产品为中心”模式,真正实现以客户为中心、以 AI 、大数据为驱动,以 KYC/KYP/KYA
StarRocks
金融
洪波涌起
发布于 2024年03月25日
314浏览
工业企业大数据分析平台解决方案(含数据治理)
当前,工业企业产生的数据与日俱增,如何利用大数据为企业产生驱动力、竞争力成为工业企业面临的重要问题。工业企业大数据平台建设的总体思路是将现有PLC、MES、ERP、CRM、SRM、SCM、电子商务及财务共享服务等信息系统的业务数据,采用大数据技术,抽取到全业务数据中心,建立逻辑关联,整合成大数据仓库。
忆往昔
发布于 2024年03月25日
88浏览
1点赞
详解数据湖,概念、特征、架构、方案、场景以及建湖全过程(下)
4.各厂商的数据湖解决方案 5.典型的数据湖应用场景 6.数据湖建设的基本过程 7.总结
洪波涌起
发布于 2024年03月25日
72浏览
详解数据湖,概念、特征、架构、方案、场景以及建湖全过程(上)
1.什么是数据湖 2.数据湖的基本特征 3.数据湖基本架构
洪波涌起
发布于 2024年03月25日
79浏览
漫画讲解Kafka高效的存储设计
今天,跟大家分享一下kafka 的存储机制及如何根据 offset 查找消息的。
Kafka
车车
发布于 2024年03月25日
82浏览
帆软BI的三个优点之:数据从分布式数据库实时传到帆软
从A地到B地,我们首先想到的是乘坐什么交通工具,是坐车,坐船,还是坐飞机。遇到问题其实也是一样的,从问题的这头,到那头,也有很多的工具可以使用。选择对的工具,才能更加便捷轻松的解决问题?今天给大家聊聊帆软BI这款工具。
FineReport
梦想家
发布于 2024年03月22日
79浏览
2点赞
数据治理之元数据管理的利器——Atlas入门实战宝典(7、8)
随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为Hadoop生态最紧密的元数据管理与发现工具,Atlas在其中扮演着重要的位置。但是其官方文档不是很丰富,也不够详细。所以整理了这份文档供大家学习使用。
Atlas
随风
发布于 2024年03月22日
58浏览
数据治理之元数据管理的利器——Atlas入门实战宝典(5、6)
随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为Hadoop生态最紧密的元数据管理与发现工具,Atlas在其中扮演着重要的位置。但是其官方文档不是很丰富,也不够详细。所以整理了这份文档供大家学习使用。
Atlas
随风
发布于 2024年03月22日
134浏览
数据治理之元数据管理的利器——Atlas入门实战宝典(1、2、3)
随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为Hadoop生态最紧密的元数据管理与发现工具,Atlas在其中扮演着重要的位置。但是其官方文档不是很丰富,也不够详细。所以整理了这份文档供大家学习使用。
Atlas
随风
发布于 2024年03月22日
134浏览
AI 算法在大数据治理中的应用
全文目录: 1. 大数据与 AI; 2. 大数据任务健康度评估; 3. Spark 任务智能调参; 4. SQL 任务执行引擎智能选择; 5. AI 算法在大数据治理中的应用展望
随风
发布于 2024年03月22日
94浏览
1点赞
1
40
41
42
43
44
74