博客园
最新
热门
发布
日榜
周榜
月榜
全流程讲解完整数据分析
本文由支付产品经理分享从0到1搭建支付业务数据分析体系的实战经验,强调数据驱动决策的重要性。文章分为四部分:1. 数据分析的必要性(量化投资、验证产品、洞察用户、发现机会);2. 数据分析框架(数据生成、获取、建模、分析及应用);3. 数据指标体系设计(AARRR、UJM+OSM模型);4. 数据呈现方法。通过支付业务案例,阐述如何通过数据优化转化率、资源配置及用户画像,最终实现业务增长。
数据驱动
数据指标体系
数据分析
数据分析狮
发布于2025年04月25日
122浏览
数据治理方法论和实践小百科全书
数据治理是从分散数据到统一管理的过程,涵盖数据获取、处理、使用的全生命周期,旨在提升数据质量、实现共享与价值挖掘。其核心目标包括制定政策、保障安全、促进共享(集团/政府)或通过精细化管理提升效率(业务部门)。治理框架含顶层设计、环境、治理域及PDCA过程,实施需具备“聚、治、通、用”四大能力,结合流程化、自动化、智能化方法。
数据质量
数据安全
数据治理
数据分析狮
发布于2025年04月23日
135浏览
Apache Paimon大厂面试题必备-进阶篇
Paimon通过快照文件保证数据的时效性与一致性,时效性受Flink检查点间隔影响,建议设置为1-10分钟。一致性通过两阶段提交协议实现,支持Snapshot Isolation级别。Paimon提供快照过期和分区过期机制清理旧数据,支持同步和异步两种过期模式,各有优劣势。
流批一体
湖仓一体建设
Paimon
我不是超人
发布于2025年04月22日
393浏览
从 Spark 到 StarRocks:实现58同城湖仓一体架构的高效转型
58集团数据探查平台通过引入StarRocks引擎实现Ad-Hoc查询10倍性能提升,日均处理6.5万条SQL,平均响应时间降至3.3秒。通过语法兼容改造、元数据缓存优化、函数兼容性处理及容器化部署方案,解决了Spark与StarRocks的兼容性问题,并实现98%以上的查询成功率。后续将探索智能物化视图进一步提升查询效率。
数据分析狮
发布于2025年04月21日
315浏览
网易游戏 x Apache Doris:湖仓一体架构演进之路
网易游戏技术中心为解决数据处理时效性差、查询性能低、运维及研发成本高等问题,引入Apache Doris进行架构升级,构建实时数仓和湖仓一体架构。通过整合多个引擎,显著提升查询性能和时效性,日均查询量突破1500万,存储数据达PB级。未来计划推广数据湖方案、实现智能物化,并升级至3.0版本。
数据分析狮
发布于2025年04月17日
345浏览
干货|字节跳动在湖仓一体领域的最佳实践
本文回顾了Qcon上海站关于湖仓一体架构的主题分享,探讨了从Hadoop到湖仓一体的演进趋势,剖析了LAS产品的核心优势及关键技术组件。通过抖音电商、用户画像、金融行业和消费行业四个实践案例,展示了湖仓一体架构在解决数据孤岛、提升时效性和降低开发成本中的应用价值。最后提出实时湖仓、智能湖仓和引擎增强三大未来规划方向。
数据分析狮
发布于2025年04月17日
448浏览
畅想描绘:多模态数据治理体系框架
多模态数据治理面临理论体系缺失、技术支撑不足、AI工具不完善及场景难挖掘等挑战,导致实施复杂性与成本增加。现有数据治理框架虽适用,但需融合AI技术与工程化实践。建议结合DAMA和DCMM构建多模态治理体系,通过‘自上而下’或‘自下而上’策略闭环推进,强调技术与业务协同。
DAMA框架
DCMM
多模态数据治理
数据质量
AI技术
数据分析狮
发布于2025年04月15日
243浏览
Manus 技术架构设计剖析和复刻落地实现
Manus是Monica公司推出的全球首款通用AI Agent,具备自主规划、执行和反思能力,能独立完成从撰写报告到技术操作等复杂任务。其设计灵感源自拉丁文“手”,强调行动实现知识。产品提供标准与高投入两种模式,支持29种工具,包括命令执行、文件读写、浏览器操作等。技术基于ReAct Agent架构,在沙箱环境中运行,结合增量式规划和反思机制确保任务高效完成。
AI应用开发社区
任务自动化
Manus
AI Agent
qiushaohua
发布于2025年04月02日
843浏览
AI数据分析:一键生成数据分析报告
利用大模型和提示词工具,数据分析师可以一键生成高质量的可视化分析报告,显著提升效率。通过上传数据结构(如日期、会员ID、门店编号等),结合AI生成的分析维度,快速生成包含图表、文字分析和总结的HTML报告。这种方法不仅节省时间,还提供了直观、专业的数据洞察,帮助非技术背景用户轻松理解复杂数据,支持决策过程。未来,数据分析师需结合AI技术和业务思维,成为双核驱动型人才。
AI应用开发社区
数据分析狮
发布于2025年03月27日
677浏览
多模态数据治理-DeepSeek加速AI落地
多模态数据治理是对文本、图片、视频、音频等多种数据类型进行管理、存储、处理和分析的过程,旨在实现不同模态数据的融合与应用。随着移动互联和物联网的发展,传统数据治理模式难以应对非结构化数据的挑战,人工智能技术的进步为多模态数据治理提供了新工具和方法。
多模态数据治理
DeepSeek
数据管理
数据分析狮
发布于2025年03月25日
437浏览
快速上手:开发第一个MCP Server
MCP协议为AI应用与数据源提供了统一的开放标准,通过单一协议取代碎片化集成,增强AI应用能力。本文介绍了如何实现一个简单的MCP Server,提供通过订单号查询物流信息的Tool功能,并展示了如何在Cline中配置和测试该Server。通过MCP Inspector和Cline的集成,验证了MCP Server的功能和连接性。
AI编程社区
AI应用开发社区
MCP协议
MCP Server
AI应用
qiushaohua
发布于2025年03月17日
1066浏览
文心大模型4.5及X1重磅上线,真实测评
文心大模型4.5为原生多模态基础大模型,具备优秀的多模态理解和语言能力,关键技术包括FlashMask动态注意力掩码和多模态异构专家扩展技术等。文心大模型X1是能力更全面的深度思考模型,支持多模态和自主运用工具,其能力提升得益于递进式强化学习训练方法和基于思维链的端到端训练等。两款大模型在图片解释、生成、推理等任务中表现出色,并已接入百度搜索、文小言APP等产品。
文心大模型
文心一言
人工智能
数据分析狮
发布于2025年03月17日
585浏览
巨人(大模型)对话功能上线啦!多平台大模型+提示词广场,助你轻松提效
巨人对话小工具集成了多个主流大模型平台,如DeepSeek、豆包、文心一言等,提供一站式智能对话体验。其提示词广场功能提供丰富的预制模板,支持用户分享和共创,提升创作效率。一键分享功能简化了对话内容的传递,降低沟通成本。系统提示词设置允许用户创建轻量级智能体,自动生成内容或执行任务,提升工作效率和创造力。
AI应用开发社区
系统提示词
轻量级智能体
多平台集成
提示词广场
智能对话
我不是超人
发布于2025年03月16日
195浏览
深入浅出理解MCP:从技术原理到实战落地
MCP(Model Context Protocol)是由Anthropic公司推出的开放标准协议,旨在让大型语言模型(LLM)与外部工具和数据源无缝通信,使其从“智能回答者”变成“智能执行者”。MCP通过标准化的通信协议和双向交互,支持AI安全、可控地访问文件、应用和网络服务,执行具体任务。其核心架构包括MCP主机、服务器和客户端,提供统一接口和即插即用特性,显著提升AI的实用性和灵活性。
AI应用开发社区
AI编程社区
MCP
LLM
AI
qiushaohua
发布于2025年03月11日
554浏览
AI数据分析:一键生成可视化分析思路
DeepSeek帮助数据分析师解决大数据分析难题,通过可视化的方式将杂乱的数据转化为清晰的业务洞察。以零售企业销售数据为例,DeepSeek快速生成分析框架,让分析师轻松完成从数据到洞察的转化。利用AI技术提效,同时注重业务与批判性思维,创造不可替代的价值。
AI应用开发社区
数据分析狮
发布于2025年03月07日
398浏览
一文带你读懂AI编程三大效率神器:Cursor vs Windsurf vs GitHub Copilot,谁才是王者?
本文比较了Cursor、Windsurf和GitHub Copilot三个AI编码助手的性能,包括代码生成、聊天、终端工作等。虽然三者都有各自的优势,但Cursor凭借更准确的建议和额外的功能如自动提交消息等,略微胜出。然而,Windsurf具有潜力,通过改进可以迅速赶上。最终,最适合的工具取决于个人需求。本文鼓励尝试不同工具,并提供了详细的功能比较和定价信息。
AI编程社区
Cursoe
Windsurf
AI编码助手
GitHub Copilot
编程工具
海星之梦
发布于2025年02月26日
1142浏览
K8S异常诊断之俺的内存呢
本文解决Kubernetes集群中的OOM和Pod驱逐问题,通过信息采集和日志分析,定位到systemd覆盖kubelet设置的memory limit的问题,提供临时解决方案和升级集群以修复问题的建议。
Kubernetes
资源问题
Systemd
日志分析
数智先锋
发布于2025年02月18日
237浏览
字节最新发布的AI编程工具Trae 的 Windows 版终于发布了,Claude免费无限量!4个案例带你快速上手
Trae Windows版发布,支持Windows和MacOS。通过AI编程工具,零代码即可制作小游戏和效率工具。Trae提供全中文界面,内置顶级AI模型,自动识别解决代码错误。通过对话生成代码,降低技术门槛。案例展示小游戏、待办事项清单和剪贴板记录工具的制作。强调AI的价值在于解放人类重复劳动,鼓励编程成为新的修辞手法。
AI编程社区
Trae
AI编程工具
零代码开发
小游戏制作
效率工具
滴滴
发布于2025年02月18日
437浏览
DeepSeek和百度——中国大模型发展的一体两面
本文探讨了DeepSeek和百度在AI领域的发展策略和产品布局,并指出真正的创新往往发生在跳出固有认知的探索中。
AI发展
百度
技术突破
DeepSeek
滴滴
发布于2025年02月12日
211浏览
IntelliJ IDEA 接入 DeepSeek,辅助编程太强了!
本文介绍了如何将DeepSeek集成到IDEA中,包括环境准备、插件安装与配置、使用DeepSeek进行编程和用量统计等步骤,帮助读者充分利用DeepSeek提升编程效率。
AI编程社区
CodeGPT
DeepSeek集成
编程助手
IDEA插件
代码补全
海星之梦
发布于2025年02月12日
566浏览
1
5
6
7
8
9
83