无匹配社区
博客园
最新
热门
请选择社区
发布
客户画像 & 分群
在数据驱动的背景下,通过深入了解客户来实现更个性化、有针对性的市场营销和服务的方法。通过分群的方式,轻松掌握不同客户的消费特性和行为特征。
Agile Query
agile query
发布于 2024年06月03日
62浏览
Agile Query 对比大模型生成 SQL
随着大型模型的迅速发展,各个领域纷纷尝试利用这些模型来解决重复的人工操作,或通过引入随机性和概率性来产生多样性的输出。在SQL生成领域,各种方案层出不穷,这里不一一列举,但综合来看,大模型生成的结果更多地是供人类阅读或理解,而不是供机器(程序)理解。
Agile Query
agile query
发布于 2024年05月27日
347浏览
Apache Doris 2.1.3 版本正式发布!
亲爱的社区小伙伴们,Apache Doris 2.1.3 版本已于 2024 年 5 月 20 日正式发布。该版本在功能特性上对数据湖、物化视图、负载管理等方面进行了多项更新,进一步简化湖仓一体架构、加速了查询性能;同时提交了若干改进项以及问题修复,进一步提升了系统的性能及稳定性,欢迎大家下载体验。
Doris
车车
发布于 2024年05月22日
398浏览
2点赞
【每日使用技巧】DBeaver-SQL编辑器(上下)
DBeaver SQL编辑器功能按钮介绍:执行SQL语句、在新标签中执行SQL、执行SQL脚步、解释执行计划、SQL终端、显示执行日志、显示SQL变量、显示大纲、显示行号
Dbeaver
随风
发布于 2024年05月21日
401浏览
2点赞
Agile Query 的背景和核心技术
数据在业务决策过程中的使用频率越来越高,分析视角从传统的宏观统计,不断地向更细粒度转变,参与计算的数据体量也会不断的增加, 导致看似很小的数据量,经过关系运算后,也会变得庞大,同时分析维度组合不断地切换,也会导致预计算变得越来越困难。
Agile Query
agile query
发布于 2024年05月21日
205浏览
1点赞
Flink 开发利器 Apache StreamPark™
Hadoop 体系虽然在目前应用非常广泛,但架构繁琐、运维复杂度过高、版本升级困难,且由于部门原因,数据中台需求排期较长,我们急需探索敏捷性开发的数据平台模式。
Streampark
Flink
忆往昔
发布于 2024年05月20日
575浏览
1点赞
告警规则未触发问题排查(基于Flink+Drools)
1. 规则更新加载问题 2. 规则逻辑判断触发问题 3. 数据堆积
Flink
规则系统
车车
发布于 2024年05月07日
297浏览
4点赞
基于 Apache Calcite 的多引擎指标管理最佳实践
文章介绍了基于 Apache Calcite 的多引擎指标管理的技术原理与最佳实践,包括指标管理的常见方式、指标管理的最佳实践、指标管理的实现原理以及指标管理在字节跳动未来的一些规划,重点阐述了指标管理在业内常见的解决方案与字节内部使用的一套 SQL 两种语法多引擎指标管理方案的异同;字节内部如何使用一套 SQL 两种语法实现降本增效以及指标管理技术的具体实现方案。
Calcite
洪波涌起
发布于 2024年04月30日
755浏览
Apache Calcite 框架原理入门和生产应用
Calcite 是什么?如果用一句话形容 Calcite,Calcite 是一个用于优化异构数据源的查询处理的基础框架。 最近十几年来,出现了很多专门的数据处理引擎。例如列式存储 (HBase)、流处理引擎 (Flink)、文档搜索引擎 (Elasticsearch) 等等。这些引擎在各自针对的领域都有独特的优势,在现有复杂的业务场景下,我们很难只采用当中的某一个而舍弃其他的数据引擎。.....
Calcite
洪波涌起
发布于 2024年04月30日
853浏览
Flink入门系列3 窗口 一
Flink入门系列3 窗口 一
Flink
诗与远方
发布于 2024年04月25日
363浏览
1点赞
【在线工具推荐】Flink SQL Connector生成-Kafka-MySQL-Doris-JDBC-CDC
Flink SQL Connector生成工具支持根据不同数据源和连接方式可视化生成Flink SQL,目前支持的数据源类型有:Doris、MySQL、Kafka,支持的连接方式有JDBC、CDC。
Flink
Doris
Kafka
MySQL
StarRocks
MongoDB
车车
发布于 2024年04月19日
577浏览
2点赞
Flink入门系列2 keyby reduce process使用
flink入门系列
Flink
诗与远方
发布于 2024年04月19日
378浏览
2点赞
【在线工具推荐】Doris建表语句-其他数据源DDL转Doris-JSONl转Doris
版本区分(持续完善~) 2.动态分区 3.经验值推荐(持续完善~) 4.版本管理 5.转换记录在线分享 6.根据JSON数据样例生成字段信息 7.Mysql、Clickhouse、Presto、Hive DDL -》 Doris DDL 转换(new~new~new~)
Doris
MySQL
随风
发布于 2024年04月19日
513浏览
4点赞
AI编码工具,都是编程利器!
杀疯了,七款 IntelliJ IDEA 智能AI编码工具插件,都是编程利器!
AI编程
AI大世界
随风
发布于 2024年04月19日
560浏览
2点赞
【必知必会】程序员再不用AI编码工具就危险了
通义灵码,是阿里云出品的一款基于通义大模型的智能编码辅助工具,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等能力,并针对阿里云的云服务使用场景调优,助力开发者高效、流畅的编码。
AI编程
AI大世界
随风
发布于 2024年04月19日
267浏览
【重要概念】Flink广播状态
地铁短文
Flink
重要概念
随风
发布于 2024年04月18日
115浏览
1点赞
java 地理围栏 R树索引加速判断(RTree-Multi)
在处理大量空间数据时,如何高效地判断一个点是否在一个地理围栏内是一个常见的需求。传统的方法是使用点和多边形之间的关系算法,但是当数据量大时,这种方法的性能会变得很低。为了解决这个问题,可以使用 R 树索引来加速判断。
物理围栏
Kafka
Flink
数智先锋
发布于 2024年04月15日
311浏览
Flink入门系列2 map flatmap算子使用
Flink入门系列2 map flatmap算子使用
Flink
诗与远方
发布于 2024年04月12日
65浏览
3点赞
大数据中台组件管理平台Ambari是个啥?
数据中台经常会用到组件管理平台,一个常见的组件管理平台Ambari是一个apache 顶级开源项目,旨在为Hadoop及其相关生态系统(如Hive、Hbase、Sqoop、Zookeeper等)提供更易于使用的工具。
Ambari
数据仓库/中台
随风
发布于 2024年04月11日
156浏览
3点赞
一文讲清楚什么是数据湖
Data lake这个术语由Pentaho公司的创始人兼首席技术官詹姆斯·狄克逊(James Dixon)提出,他对数据湖的解释是: 把你以前在磁带上拥有的东西倒入到数据湖,然后开始探索该数据。重要的只把需要的数据倒入到Hadoop;如果你想结合来自数据湖的信息和客户关系管理系统(CRM)里面的信息,我们就进行连接,只有需要时才执行这番数据结合。
数据湖
数据仓库/中台
数据治理
林洪勇
发布于 2024年04月11日
377浏览
3点赞
1
37
38
39
40
41
73