博客园

Transformer动画讲解 - Transformer工作原理

本文详细解释了GPT模型的核心——Transformer的工作原理,包括向量化、注意力机制、多层感知机和模型输出四个阶段。文章还介绍了Transformer在多模态数据处理中的角色。
AI应用开发
头像忆往昔 发布于2025年01月04日
142浏览 1点赞

一文彻底搞懂大模型 - LLM的构建流程

大模型(LLM,Large Language Model)的构建流程,特别是OpenAI所使用的大语言模型GPT构建流程,主要包含四个阶段:预训练、有监督微调、奖励建模和强化学习。这四个阶段各自需要不同规模的数据集、不同类型的算法,并会产出不同类型的模型,同时所需的资源也有显著差异。
AI应用开发
头像忆往昔 发布于2025年01月04日
99浏览

一文彻底搞懂大模型 - RAG(检索、增强、生成)

本文介绍了RAG(检索增强生成)的原理和工作流程,包括其结合信息检索技术与语言生成模型的能力。通过检索模块和生成模块的协同工作,RAG能够实现基于外部知识增强的自然语言生成能力。文章还提到了RAG在知识问答系统中的应用及其优势。
AI应用开发
头像忆往昔 发布于2025年01月04日
528浏览

RPA和Agent智能体区别应用场景

在当今快节奏的数字化时代,企业面临着日益复杂的业务流程和不断增长的效率挑战。而 RPA,即机器人流程自动化,正以其强大的实力成为企业变革的关键驱动力。
AI应用开发
头像忆往昔 发布于2025年01月04日
170浏览

2025 AI深度前瞻:推理成本暴降90%,智能体迎GPT时刻,空间智能涌现

走出最后一个AI寒冬,21世纪第三个十年见证了现代AI的诞生。 斯坦福大学教授、“AI教母”李飞飞将当前AI领域的变化描述为科技领域的“寒武纪大爆发”。回顾过去一年,Scaling Law驱动的新范式开始告别参数规模崇拜;多模态AI生成能力涌现多个爆款应用,打开了全新的竞速空间,也为即将到来的2025年带来了诸多可能性。
AI应用开发
头像春风得意 发布于2025年01月03日
112浏览

Apache Celeborn 在B站的生产实践

随着B站业务的飞速发展,数据规模呈指数级增长,计算集群也逐步从单机房扩展到多机房部署模式。多个业务线依托大数据平台驱动核心业务,大数据系统的高效性与稳定性成为公司业务发展的重要基石。
Celeborn
头像海星之梦 发布于2025年01月03日
370浏览

数字孪生与 Three.js:开启未来可视化新征程

数字孪生,是对物理实体或过程的数字化映射与模拟系统,最早被称为 “镜像空间模型”。它能够实时监控和模拟物理实体的性能,优化系统的可靠性、可用性和总体效能。例如,在工业制造领域,数字孪生可以在产品研发阶段虚拟构建产品数字化模型进行仿真测试和验证,在生产制造时模拟设备运转及参数调整带来的变化,有效提升产品的可靠性和可用性,降低研发和制造风险。
Web前端
头像洪波涌起 发布于2025年01月02日
355浏览

一个普通人的数字资产之路

数字资产,是企业拥有或控制、以数据形态存在,在日常活动中生产、经营或持有待售的可变资产。在数字经济时代,数字资产的形成方式多种多样。
头像洪波涌起 发布于2025年01月02日
749浏览

计算效率提升 10 倍,存储成本降低 60%,灵犀科技基于 Apache Doris 建设统一数据服务平台

灵犀科技早期基于 Hadoop 构建大数据平台,在战略调整和需求的持续扩增下,数据处理效率、查询性能、资源成本问题随之出现。为此,引入 Apache Doris 替换了复杂技术栈,升级为集存储、加工、服务为一体的统一架构,实现存储成本下降 60%,计算效率提升超 10 倍 的显著成效。
Doris
头像数智先锋 发布于2025年01月02日
85浏览

Apache SeaTunnel 社区 2024 年度报告

2024 年是 Apache SeaTunnel 社区高速成长的一年。从技术创新到用户生态,从版本发布到社区活动,我们见证了无数开发者与企业在数据集成领域的探索与突破。
SeaTunnel
头像数智先锋 发布于2025年01月02日
87浏览

40% 降本:多点 DMALL x StarRocks 的湖仓升级实战

多点 DMALL 成立于2015年,持续深耕零售业,为企业提供一站式全渠道数字零售解决方案 DMALL OS。作为 DMALL OS 数字化能力的技术底座,大数据平台历经多次迭代平稳支撑了公司 To B 业务的快速开展。随着国家产业升级和云原生技术的成熟,平台架构也从存算一体逐步转向存算分离。本文将以 StarRocks 的升级演进为例,分享这一过程中的探索与实践。
StarRocks
头像数智先锋 发布于2025年01月02日
377浏览

Doris之旅基础篇|开篇介绍(一)

Doris 2025年最新的官方课程及培训认证体系即将推出,狠狠期待! 正式发布之前,先来个一臻2024的老课预热预热... 今天一起了解下Doris之旅基础篇章、Doris的发展、应用场景和技术架构特点。
Doris介绍
头像张彬华 发布于2025年01月02日
115浏览 1点赞

万字长文:Comprehensive Data Catalog Comparison

Catalog,中文翻译“数据目录”,从字面意思上可以看出,它就像一个可搜索的数据集目录,类似于图书馆目录对书籍的整理方式。广义上讲,数据目录是组织内数据资产的清单。它能帮助用户发现、理解和管理可供使用的数据。数据目录通常包含元数据(关于数据的信息),如数据源、描述、所有者、质量指标、血缘关系和访问控制。
头像滴滴 发布于2025年01月02日
502浏览

【司马老师数据库系列讲座一】干货,7000字深度刨析 HTAP 技术架构、关键技术和国内主流产品

2014年,Gatner 提出了 HTAP ¹(Hybrid Transaction and Analytical Process)混合事务和分析处理,既能支持在线事务处理 OLTP,又能支持在线分析处理 OLAP。
头像车车 发布于2025年01月02日
70浏览

Celeborn Spark 集成最新进展

目前,Celeborn 已成为最受欢迎的 Remote Shuffle Service。许多国内外大厂已经在使用 Celeborn,除了阿里云、小红书、B站、Shopee、蔚来等已经登记的用户,也有部分用户出于各种因素暂未正式登记。
Celeborn
头像车车 发布于2025年01月02日
459浏览 1点赞

年终长文15000字:学习的终结(The End of Learning)——从ChatGPT到未来

在历史长河的一隅,从远古时代祖先传承火种的教导,到现代互联网无垠知识的星辰大海,学习一直是人类不可或缺的生存技巧。
AI应用开发
头像忆往昔 发布于2025年01月01日
96浏览 1点赞

惊险一刻!2024跨年夜里:数据中心突然宕机,Doris CCR却让客户毫无察觉

惊险一刻!2024跨年夜里:数据中心突然宕机,Doris CCR却让客户毫无察觉
Doris介绍深度解析集群运维
头像张彬华 发布于2024年12月31日
230浏览 1点赞

【HarmonyOS NEXT】鸿蒙 ArkTS 进行RSA数据加密

鸿蒙
头像能不忆江南 发布于2024年12月30日
165浏览

【HarmonyOS NEXT】 ArkUI常用布局及组件库介绍

鸿蒙
头像能不忆江南 发布于2024年12月30日
189浏览

【HarmonyOS NEXT】Tabs组件实现类微信(可滑动的)tabBar页签切换页面功能

鸿蒙
头像能不忆江南 发布于2024年12月30日
154浏览
1 313233343582

微信(交流/反馈)

巨人肩膀初心:站在巨人肩膀上,避免无谓的重复劳动。 生产和汇聚行业技术、 知识经验、 工具组件 、案例产品,提供相关环境,为开发者提高生产效率提供切实有效的支持和帮助。并在这一进程中实现多方共赢。

©2023-2026 - 巨人肩膀 - 粤ICP备2025395551号-1