博客园
最新
热门
发布
日榜
周榜
月榜
Coze助你打造专属AI,完全免费!
扣子(Coze)AI Bot 开发平台,作为一个新兴的 AI 技术工具,旨在为开发者提供一个强大的、易于使用的平台,以便快速构建和部署智能聊天机器人。这个平台的市场定位是服务于那些希望在客户服务、市场营销、数据分析等领域利用人工智能技术的企业或个人开发者。
AI应用开发社区
海星之梦
发布于2024年06月20日
527浏览
2点赞
Apache Druid简单介绍
一个实时分析型数据库,旨在对大型数据集进行快速的查询分析("OLAP"查询)。Druid最常被当做数据库来用以支持实时摄取、高性能查询和高稳定运行的应用场景,同时,Druid也通常被用来助力分析型应用的图形化界面,或者当做需要快速聚合的高并发后端API,Druid最适合应用于面向事件类型的数据。
巨人肩膀小编
发布于2024年06月20日
204浏览
Agile Query 对比大模型生成 SQL
随着大型模型的迅速发展,各个领域纷纷尝试利用这些模型来解决重复的人工操作,或通过引入随机性和概率性来产生多样性的输出。在SQL生成领域,各种方案层出不穷,这里不一一列举,但综合来看,大模型生成的结果更多地是供人类阅读或理解,而不是供机器(程序)理解。
agile query
发布于2024年05月27日
521浏览
Flink 开发利器 Apache StreamPark™
Hadoop 体系虽然在目前应用非常广泛,但架构繁琐、运维复杂度过高、版本升级困难,且由于部门原因,数据中台需求排期较长,我们急需探索敏捷性开发的数据平台模式。
忆往昔
发布于2024年05月20日
971浏览
1点赞
【重要概念】Flink广播状态
地铁短文
重要概念
随风
发布于2024年04月18日
181浏览
1点赞
java 地理围栏 R树索引加速判断(RTree-Multi)
在处理大量空间数据时,如何高效地判断一个点是否在一个地理围栏内是一个常见的需求。传统的方法是使用点和多边形之间的关系算法,但是当数据量大时,这种方法的性能会变得很低。为了解决这个问题,可以使用 R 树索引来加速判断。
数智先锋
发布于2024年04月15日
557浏览
大数据中台组件管理平台Ambari是个啥?
数据中台经常会用到组件管理平台,一个常见的组件管理平台Ambari是一个apache 顶级开源项目,旨在为Hadoop及其相关生态系统(如Hive、Hbase、Sqoop、Zookeeper等)提供更易于使用的工具。
随风
发布于2024年04月11日
317浏览
3点赞
网易游戏实时 HTAP 计费风控平台建设
本文整理自网易互娱资深工程师, Flink Contributor, CDC Contributor 林佳,在 FFA 实时风控专场的分享。本篇内容主要分为五个部分:点击查看直播回放 & 演讲PPT众所周知,网易互娱的核心业务之一是线上互动娱乐应用服务,比如大家耳熟能详的梦幻西游、阴阳师等都是网易互娱的产品。不管是游戏产品还是其他应用,都需要做出好的内容来吸引用户进行应用内购买,进而产生盈利。
随风
发布于2024年03月31日
219浏览
linux内核常用调优参数
linux内核常用调优参数。
数智先锋
发布于2024年03月31日
258浏览
1点赞
一文掌握ClickHouse
ClickHouse 是Yandex开源的一个用于实时数据分析的基于列存储的数据库,其处理数据的速度比传统方法快100-1000 倍。 ClickHouse的性能超过了目前市场上可比的面向列的 DBMS,每秒钟每台服务器每秒处理数亿至十亿多行和数十千兆字节的数据。
数智先锋
发布于2024年03月26日
448浏览
数据管理、数据治理、数据资产管理,到底有何不同?
数据治理、数据管理、数据资产管理,有什么不同?这是一个我被问的最多的问题。
数智先锋
发布于2024年03月26日
443浏览
快手BI大数据分析场景性能优化实践
快手大数据分析平台,作为一个数据输出平台,对于用户而言,面临的挑战主要包括: 性能分析难:不清楚耗时在哪个环节,平台对用户来说是黑盒的;不了解数据消费用户的查询特征;性能波动难以归因。 优化门槛高:需要很强的知识背景,很强的专业领域性,而分析用户通常是小白用户无法自己进行分析和优化。 平台方面,也面临一些挑战: 分析复杂度高:30%以上的复杂分析,包含同环比、占比、LOD分析等; 引擎查询复杂度高
数智先锋
发布于2024年03月26日
555浏览
StarRocks 助力金融营销数字化进化之路
平安银行五位一体,做零售金融的领先银行,五位一体是由开放银行、AI 银行、远程银行、线下银行、综合化银行协同构建的数据化、智能化的零售客户经营模式,这套模式以数据为基础,AI 为内核,通过画像识别,基于场景数据分析,通过高效组织内部资源,为客户提供精准服务,实现零售转型业务增长的第二曲线。 通过颠覆传统“以产品为中心”模式,真正实现以客户为中心、以 AI 、大数据为驱动,以 KYC/KYP/KYA
洪波涌起
发布于2024年03月25日
490浏览
漫画讲解Kafka高效的存储设计
今天,跟大家分享一下kafka 的存储机制及如何根据 offset 查找消息的。
车车
发布于2024年03月25日
194浏览
腾讯游戏大数据分析引擎实践
数据分析平台一直是大数据应用最基础、最核心的应用之一。相比于原有的传统BI软件和数据库提供分析能力有很多局限,例如:数据处理效率低,大数据处理能力不足以及无法和线上数据商业化应用推荐和服务打通等。iData作为游戏大数据分析系统,在服务腾讯海量的游戏产品过程中,经过多年的迭代和实践,形成iDataCharts大数据可视化和iDataEngin大数据分析引擎为核心能力的大数据分析系统。
忆往昔
发布于2024年03月19日
707浏览
1点赞
Kafka Explorer连接SASL PlainText SCRAM-SHA-256认证Kafka
图文手册,教你如何一步步连接共享集群中的Kafka组件。
随风
发布于2024年03月12日
497浏览
1点赞
使用共享Kafka集群前需要修改hosts文件
修改hosts文件是为了确保客户端能够正确解析并连接到Kafka集群中的broker。
随风
发布于2024年03月08日
179浏览
2点赞
DolphinScheduler功能概览V3.2.1
DolphinScheduler Version 3.2.1 功能介绍
忆往昔
发布于2024年02月16日
159浏览
2点赞
欢迎投稿
欢迎投稿
随风
发布于2023年12月21日
371浏览
5点赞
2026年Anthtopic人类技能AI代替率报告
Anthropic 2026年AI替代率报告揭示:管理、程序员等高薪职业风险高,而农业、护理等实操工作更安全。探讨未来核心竞争力。
深港OPC联盟
AI替代率
职业安全
未来工作
海星之梦
发布于13 days ago
116浏览
1
7
8
9
10
11
83