博客园

什么是数据资产入表?

数据资产入表是将企业数据资源以资产形式纳入财务报表的管理和计量过程。有助于提升企业的数据资产运营和变现能力,促进数据流通和使用,展现数字经济实力。通过数据资产清点、分类、评估、治理、管理和利用等步骤实现。数据资产入表有助于企业更好地了解自身数据规模、质量和价值,制定更合理的数据策略,挖掘数据价值。
数据治理
头像滴滴 发布于01月08日
43浏览

数据资产入表全流程操作指南

数据资产入表是企业将数据资源纳入财务报表管理和计量的过程,有助于提升数据资产运营和变现能力。实施数据治理是激活数据要素价值的基础工程。本文介绍了数据资产入表的相关概念、实施准备、数据治理的流程和要点,包括顶层设计、技术体系、数据服务和洞察等方面,旨在为企业提供方法论和思路参考。
数据治理
头像滴滴 发布于01月08日
40浏览

Apache Celeborn 在多点 DMALL 的云原生实践

本文介绍了多点DMALL在大数据架构变迁中引入Apache Celeborn的过程和升级演化。通过引入Celeborn解决Shuffle数据处理问题,采用存算分离方案构建云原生大数据集群。文章还提到了版本跟踪升级、从on Premises到on Kubernetes的转型、从Hostpath到PVC的过渡以及BestEffort带来的不稳定问题等解决方案。
Celeborn
头像滴滴 发布于01月08日
120浏览

BigDecimal多线程做除法异常

本文介绍了BigDecimal除法运算中精度的正确设置方式,并演示了不同处理方式在多线程环境下的影响,强调了异常处理的必要性。
Java
头像图南 发布于01月08日
43浏览 1点赞

CentOs7.x安装部署SeaTunnelWeb遇到的坑

本文介绍了在CentOs7.x虚拟机上安装Java15和MySQL8.0.28环境后,如何安装部署SeaTunnel。包括下载安装包、设置环境变量、安装连接器插件、启动命令等步骤,并提供了执行官方client提交任务demo的过程和结果。
SeaTunnel
头像蛇年大吉 发布于01月08日
63浏览

Apache Seatunnel本地源码构建编译运行调试

本文介绍了在Windows 10环境下,Apache Seatunnel的源码包下载、环境准备、项目配置、源码编译运行以及MySQL数据库之间的单表数据同步的详细步骤。包括遇到问题的解决方案。
SeaTunnel
头像蛇年大吉 发布于01月08日
145浏览

如何在JavaScript中实现字符串模板替换

介绍JavaScript中实现字符串模板替换的多种方法,包括基础技术和高级应用。通过示例演示不同方法的实现和使用场景,提供功能使用思路和开发技巧分析。
Web前端实现
头像梦想家 发布于01月08日
59浏览 2点赞

使用Python处理Shapefile文件

本文介绍了使用Python和geopandas库解析Shape文件的流程,包括读取prj文件获取坐标、读取shp文件信息并转换为GeoDataFrame、坐标系转换、生成可视化图片和导出excel等操作。同时提供了命令行解析方式,并说明了相关的python函数和工具的使用方法。
Python开发
头像图南 发布于01月07日
101浏览

k8s常见故障快速处理

本文介绍了在Kubernetes集群生产环境中处理常见故障的步骤和方法。包括故障识别、诊断、修复和预防措施等。
KubernetesDocker
头像久安 发布于01月06日
130浏览 2点赞

算法工程师的技术路线图

本文为算法工程师的技术路线图指南,涵盖工程基础、算法基础、算法工程交叉和工程深入方向等内容。推荐学习路线包括编程语言、计算机语言理论、操作系统、软件工程和高级话题等。自我考核项包括代码质量、设计模式、质量保障和项目管理等方面。
头像蛇年大吉 发布于01月04日
99浏览

ChatBI 的几种技术路径探讨

ChatBI技术通过自然语言交互实现数据分析,具有个性化需求满足、复杂查询处理、快速响应等价值。评估ChatBI产品需考虑效果、企业级能力、成本、速度、安全等方面。常见客户问题包括与非BI厂商对比、大模型私有化部署、技术路线选择等。技术路线中,Text2DSL路线存在能力局限,需根据具体需求选择合适的技术方案。
头像蛇年大吉 发布于01月04日
382浏览

Transformer动画讲解 - Transformer工作原理

本文详细解释了GPT模型的核心——Transformer的工作原理,包括向量化、注意力机制、多层感知机和模型输出四个阶段。文章还介绍了Transformer在多模态数据处理中的角色。
AI应用开发
头像忆往昔 发布于01月04日
65浏览 1点赞

一文彻底搞懂大模型 - LLM的构建流程

大模型(LLM,Large Language Model)的构建流程,特别是OpenAI所使用的大语言模型GPT构建流程,主要包含四个阶段:预训练、有监督微调、奖励建模和强化学习。这四个阶段各自需要不同规模的数据集、不同类型的算法,并会产出不同类型的模型,同时所需的资源也有显著差异。
AI应用开发
头像忆往昔 发布于01月04日
59浏览

一文彻底搞懂大模型 - RAG(检索、增强、生成)

本文介绍了RAG(检索增强生成)的原理和工作流程,包括其结合信息检索技术与语言生成模型的能力。通过检索模块和生成模块的协同工作,RAG能够实现基于外部知识增强的自然语言生成能力。文章还提到了RAG在知识问答系统中的应用及其优势。
AI应用开发
头像忆往昔 发布于01月04日
402浏览

RPA和Agent智能体区别应用场景

在当今快节奏的数字化时代,企业面临着日益复杂的业务流程和不断增长的效率挑战。而 RPA,即机器人流程自动化,正以其强大的实力成为企业变革的关键驱动力。
AI应用开发
头像忆往昔 发布于01月04日
65浏览

2025 AI深度前瞻:推理成本暴降90%,智能体迎GPT时刻,空间智能涌现

走出最后一个AI寒冬,21世纪第三个十年见证了现代AI的诞生。 斯坦福大学教授、“AI教母”李飞飞将当前AI领域的变化描述为科技领域的“寒武纪大爆发”。回顾过去一年,Scaling Law驱动的新范式开始告别参数规模崇拜;多模态AI生成能力涌现多个爆款应用,打开了全新的竞速空间,也为即将到来的2025年带来了诸多可能性。
AI应用开发
头像春风得意 发布于01月03日
76浏览

Apache Celeborn 在B站的生产实践

随着B站业务的飞速发展,数据规模呈指数级增长,计算集群也逐步从单机房扩展到多机房部署模式。多个业务线依托大数据平台驱动核心业务,大数据系统的高效性与稳定性成为公司业务发展的重要基石。
Celeborn
头像海星之梦 发布于01月03日
191浏览

数字孪生与 Three.js:开启未来可视化新征程

数字孪生,是对物理实体或过程的数字化映射与模拟系统,最早被称为 “镜像空间模型”。它能够实时监控和模拟物理实体的性能,优化系统的可靠性、可用性和总体效能。例如,在工业制造领域,数字孪生可以在产品研发阶段虚拟构建产品数字化模型进行仿真测试和验证,在生产制造时模拟设备运转及参数调整带来的变化,有效提升产品的可靠性和可用性,降低研发和制造风险。
Web前端
头像洪波涌起 发布于01月02日
207浏览

一个普通人的数字资产之路

数字资产,是企业拥有或控制、以数据形态存在,在日常活动中生产、经营或持有待售的可变资产。在数字经济时代,数字资产的形成方式多种多样。
头像洪波涌起 发布于01月02日
525浏览

计算效率提升 10 倍,存储成本降低 60%,灵犀科技基于 Apache Doris 建设统一数据服务平台

灵犀科技早期基于 Hadoop 构建大数据平台,在战略调整和需求的持续扩增下,数据处理效率、查询性能、资源成本问题随之出现。为此,引入 Apache Doris 替换了复杂技术栈,升级为集存储、加工、服务为一体的统一架构,实现存储成本下降 60%,计算效率提升超 10 倍 的显著成效。
Doris
头像数智先锋 发布于01月02日
48浏览
1 303132333482

微信(交流/反馈)

巨人肩膀初心:站在巨人肩膀上,避免无谓的重复劳动。 生产和汇聚行业技术、 知识经验、 工具组件 、案例产品,提供相关环境,为开发者提高生产效率提供切实有效的支持和帮助。并在这一进程中实现多方共赢。

由 深圳数智领航科技有限公司 提供动力 - 数智化领航者。

©2023-2025 - 巨人肩膀 - 粤ICP备2025395551号-1