博客园
最新
热门
发布
日榜
周榜
月榜
尚硅谷嵌入式技术全套课程视频资料
尚硅谷专注IT教育培训,开设Java培训,大数据培训,HTML5+Web前端开发培训,嵌入式培训,鸿蒙开发培训等多门程序员编程培训课程,尚硅谷在北京、上海、武汉、深圳、西安、成都都设有基地,致力于培养中高...
洪波涌起
发布于2024年06月20日
848浏览
7 个数据平台,1 套元数据体系,小米基于 Gravitino 的下一代资产管理实践
业界一直希望统一元数据,从而实现多产品间的一致体验:无论是数据开发、数据消费还是数据治理,所有用户都能基于一套元数据体系,采用相同的资源描述方式,这无疑能极大地提升用户体验。
巨人肩膀小编
发布于2024年06月12日
1322浏览
2点赞
Agile Query 对比大模型生成 SQL
随着大型模型的迅速发展,各个领域纷纷尝试利用这些模型来解决重复的人工操作,或通过引入随机性和概率性来产生多样性的输出。在SQL生成领域,各种方案层出不穷,这里不一一列举,但综合来看,大模型生成的结果更多地是供人类阅读或理解,而不是供机器(程序)理解。
agile query
发布于2024年05月27日
521浏览
Agile Query 的背景和核心技术
数据在业务决策过程中的使用频率越来越高,分析视角从传统的宏观统计,不断地向更细粒度转变,参与计算的数据体量也会不断的增加, 导致看似很小的数据量,经过关系运算后,也会变得庞大,同时分析维度组合不断地切换,也会导致预计算变得越来越困难。
agile query
发布于2024年05月21日
379浏览
1点赞
Flink 开发利器 Apache StreamPark™
Hadoop 体系虽然在目前应用非常广泛,但架构繁琐、运维复杂度过高、版本升级困难,且由于部门原因,数据中台需求排期较长,我们急需探索敏捷性开发的数据平台模式。
忆往昔
发布于2024年05月20日
971浏览
1点赞
【重要概念】Flink广播状态
地铁短文
重要概念
随风
发布于2024年04月18日
181浏览
1点赞
java 地理围栏 R树索引加速判断(RTree-Multi)
在处理大量空间数据时,如何高效地判断一个点是否在一个地理围栏内是一个常见的需求。传统的方法是使用点和多边形之间的关系算法,但是当数据量大时,这种方法的性能会变得很低。为了解决这个问题,可以使用 R 树索引来加速判断。
数智先锋
发布于2024年04月15日
557浏览
大数据中台组件管理平台Ambari是个啥?
数据中台经常会用到组件管理平台,一个常见的组件管理平台Ambari是一个apache 顶级开源项目,旨在为Hadoop及其相关生态系统(如Hive、Hbase、Sqoop、Zookeeper等)提供更易于使用的工具。
随风
发布于2024年04月11日
317浏览
3点赞
数据分析领域很火的指标中台是什么
指标平台,这个概念现在很火,小伙伴让来讲下,本文就来说说这个概念,以及这个概念在目前一些 BI 体系下,可以怎么结合。
数智先锋
发布于2024年04月11日
325浏览
Flink 入门1
flink入门系列
诗与远方
发布于2024年04月08日
220浏览
2点赞
基于apache-doris-2.0.5版本进行集群部署
基于apache-doris-2.0.5版本进行集群部署
久安
发布于2024年04月03日
311浏览
3点赞
网易游戏实时 HTAP 计费风控平台建设
本文整理自网易互娱资深工程师, Flink Contributor, CDC Contributor 林佳,在 FFA 实时风控专场的分享。本篇内容主要分为五个部分:点击查看直播回放 & 演讲PPT众所周知,网易互娱的核心业务之一是线上互动娱乐应用服务,比如大家耳熟能详的梦幻西游、阴阳师等都是网易互娱的产品。不管是游戏产品还是其他应用,都需要做出好的内容来吸引用户进行应用内购买,进而产生盈利。
随风
发布于2024年03月31日
219浏览
京东物流实时风控实践
摘要:本文整理自京东风控数据产品组架构师周文跃,在 FFA 2022 实时风控专场的分享。本篇内容主要分为六个部分:点击查看直播回放 & 演讲PPT 京东集团在 2007 年开始自建物流,是国内领先的以技术驱动的供应链解决方案及物流供应商,一体化的供应链物流是我们的核心赛道。京东物流风控场景主要概括为两种,一种是货品安全,如货物丢失、破损等。另一种是交易风险,主要包括财务支出的一些风控场景。这两种
随风
发布于2024年03月31日
372浏览
linux内核常用调优参数
linux内核常用调优参数。
数智先锋
发布于2024年03月31日
258浏览
1点赞
一文掌握ClickHouse
ClickHouse 是Yandex开源的一个用于实时数据分析的基于列存储的数据库,其处理数据的速度比传统方法快100-1000 倍。 ClickHouse的性能超过了目前市场上可比的面向列的 DBMS,每秒钟每台服务器每秒处理数亿至十亿多行和数十千兆字节的数据。
数智先锋
发布于2024年03月26日
448浏览
数据管理、数据治理、数据资产管理,到底有何不同?
数据治理、数据管理、数据资产管理,有什么不同?这是一个我被问的最多的问题。
数智先锋
发布于2024年03月26日
443浏览
【行业资讯】康林松:为电动化提供选择权,向贸易壁垒说不,对中国加大投资
总而言之,这一讲话的很多理念,从优先经济发展的决心,到进一步开放市场和欢迎跨国企业继续在华投资,特别是关于高质量增长和可持续发展,与梅赛德斯-奔驰的理念不谋而合。我们将会进一步在中国加大投入,在华发展,与华共进。
车车
发布于2024年03月26日
176浏览
1点赞
详解数据湖,概念、特征、架构、方案、场景以及建湖全过程(上)
1.什么是数据湖 2.数据湖的基本特征 3.数据湖基本架构
洪波涌起
发布于2024年03月25日
173浏览
AI 算法在大数据治理中的应用
全文目录: 1. 大数据与 AI; 2. 大数据任务健康度评估; 3. Spark 任务智能调参; 4. SQL 任务执行引擎智能选择; 5. AI 算法在大数据治理中的应用展望
随风
发布于2024年03月22日
236浏览
1点赞
腾讯游戏大数据分析引擎实践
数据分析平台一直是大数据应用最基础、最核心的应用之一。相比于原有的传统BI软件和数据库提供分析能力有很多局限,例如:数据处理效率低,大数据处理能力不足以及无法和线上数据商业化应用推荐和服务打通等。iData作为游戏大数据分析系统,在服务腾讯海量的游戏产品过程中,经过多年的迭代和实践,形成iDataCharts大数据可视化和iDataEngin大数据分析引擎为核心能力的大数据分析系统。
忆往昔
发布于2024年03月19日
707浏览
1点赞
1
14
15
16
17
18
83