无匹配社区
博客园
最新
热门
请选择社区
发布
Apache SeaTunnel 项目介绍
Apache SeaTunnel 项目的定位是 EtLT 时代的新一代数据集成平台。EtLT 是 ETL 和 ELT 的演进,ETL 是早期数据同步到数仓的一种方式,首先从数据源中抽取数据,接着对数据进行转化,比如聚合、校验等计算,再把数据加载到数仓中。随着数据源的增多和数仓架构的演进,ELT 时代到来,数据先加载到数仓,再利用数仓的计算集群进行大批量计算。
SeaTunnel
海星之梦
发布于 01月19日
108浏览
OPPO 选择 SeaTunnel:提升平台开发与生产能力
本文介绍了智能推荐系统的特征平台和样本中心建设,采用Apache SeaTunnel作为数据处理基础,实现特征高效生产和存储,样本管理、生成和回迁。采用Flink流批一体化计算架构,提升效率和一致性。未来规划包括源数据功能深化、多引擎多模式开发和与ChatGPT结合。
SeaTunnel
海星之梦
发布于 01月19日
51浏览
信也科技基于 Apache SeaTunnel 金融场景的应用实践
信也科技采用Apache SeaTunnel构建离线任务开发运维平台,解决数据推送痛点,实现全链路血缘打通和统一推送框架。已生产环境上线并取得成果,计划扩展更多数据推送场景。
SeaTunnel
海星之梦
发布于 01月19日
91浏览
教你从头到尾开发一个 SeaTunnel Connector
本文介绍了如何从头开发一个SeaTunnel Connector,包括认领Connector、编译工程、了解Connector相关代码结构、开发中的注意事项以及如何寻求帮助等。同时,也提到了编写E2E测试时需要注意的问题和解决方案。
SeaTunnel
海星之梦
发布于 01月19日
127浏览
HarmonyOS智能座舱体验是怎样炼成的立即查看
文章介绍了华为HarmonyOS智能座舱的设计理念、应用高效设计开发方法以及软硬件联合打造优秀体验的方法。包括智能座舱的人因设计理念、应用基础要求、开发禁止事项、更佳体验的设计规范,以及音频类应用快速接入和手机服务卡片快速适配座舱的方案。同时,通过小憩模式和K歌体验两个实际案例介绍了软硬件联合体验的创新应用。
春风得意
发布于 01月16日
51浏览
HarmonyOS语言基础类库开发指南上线啦
HarmonyOS语言基础类库开发指南包括并发能力、容器类库能力、XML生成解析与转换等。提供异步并发和多线程并发能力,TaskPool和Worker实现多线程。提供容器类库基础操作,包括线性容器和非线性容器。同时支持XML生成、解析与转换。我们期待您的反馈,不断提升文档体验。
春风得意
发布于 01月16日
33浏览
HarmonyOS开发指导类文档更新速递上
HarmonyOS 5.0.0 Release更新了文档,包括ArkUI框架、ArkWeb和AudioKit等内容的更新。新内容涵盖了UI框架的使用弹窗、自定义扩展、属性字符串等,Web组件丰富了网页端实现场景,优化了同层渲染。AudioKit提供了音频流类型和音频焦点管理指导。欢迎反馈意见,以持续提升文档体验。
春风得意
发布于 01月16日
64浏览
AI产品经理RAG面试知识点汇总
RAG是Retrieval Augmented Generation的缩写,是一种结合检索和生成技术的AI应用方法。它通过检索相关信息增强模型的回答,解决大型模型在知识更新和特定领域知识方面的局限。RAG包括优势、技术概述、核心技术、实际应用痛点、优化策略、评测方法、关键指标和能力、多模态和Self、架构优化等方面。
春风得意
发布于 01月16日
104浏览
面向AI的数据治理体系如何构建
人工智能与数据治理的结合,推动了大数据智能市场的蓬勃发展。数据治理为人工智能提供优质数据和保障数据隐私,而人工智能提升了数据治理的智能化水平。二者结合,形成了数据治理平台的智能化,推动了行业融合。面向人工智能的数据治理体系的建设,满足了AI应用对数据的高质量要求,形成了“治理+AI”的良性循环。
春风得意
发布于 01月16日
83浏览
大数据存储模型训练数据从哪来
大模型的训练数据源包括维基百科、书籍、杂志期刊、Reddit链接等。数据爬取和预处理是训练大模型的关键步骤,包括数据去重、文本语言识别与过滤以及质量过滤等。处理过程中使用WARC、WAT和WET格式的数据存储,以提高数据处理速度和降低数据量。
春风得意
发布于 01月16日
22浏览
企业架构规划的四次迭代八个阶段
企业架构规划围绕需求管理核心,分为准备、设计、云原生、实施治理等阶段。业务架构强调战略转化,应用架构关注领域设计,数据架构注重数据管理,技术架构助力系统开发运维。项目实施策略包括破釜沉舟、敏捷迭代和“双模IT”等。整体而言,企业架构规划需结合企业战略、业务需求和数字化转型趋势,逐步构建和优化企业架构。
春风得意
发布于 01月16日
59浏览
一文看懂OpenAI狂飙12天发布会
OpenAI在为期12天的发布会上推出了多项重大更新,包括更强大的模型o1和o3、视频生成工具Sora、生产力工具Canvas的开放,以及ChatGPT在电话和WhatsApp上的集成等。这些更新面向不同用户群体,提供了更强大的AI功能,改善了用户体验。
春风得意
发布于 01月16日
47浏览
LLM大模型为什么需要微调
大模型微调是在预训练模型基础上,使用特定数据集进行进一步训练,以适应特定任务或领域的方法。本文介绍了微调的定义、重要性、两个主要方法和类型,以及微调的主要步骤。微调有助于企业利用开源大模型,解决特定场景问题。标签:大模型、微调、机器学习、深度学习、预训练模型、基础模型、数据集、任务特定、监督微调、无监督微调。
春风得意
发布于 01月16日
73浏览
AI大模型数据底座之湖仓一体
随着数据大爆炸时代的到来,数据已从被存储对象转变为企业的核心资产。本文探讨了数据仓库和数据湖在应对大数据时代面临的挑战时的优势与不足,并介绍了湖仓一体(Data Lakehouse)的概念及其在数据管理中的应用。同时,文章还讨论了AI赋能湖仓一体化平台的发展趋势,以及AI在大数据处理中的协同作用。最后,总结了数据从结构化到非结构化融合的趋势与挑战。
春风得意
发布于 01月16日
158浏览
AI大模型四大技术架构演进选型
本文介绍了大模型技术架构的演进与应用,包括纯Prompt、Agent + Function Calling、RAG和Fine-Tuning等技术架构的特点和应用场景。随着AI技术的发展,大模型技术架构不断完善,为各行各业提供了更高效、更准确的智能服务。微软AI Day展示了AI技术的最新成果和应用前景。
春风得意
发布于 01月16日
37浏览
深度解析TCPIP模型网络通信的基石
本文详细探讨了TCP/IP模型的概念、结构、作用及其在网络通信中的运作机制。通过解析模型层次结构,阐述了TCP/IP模型各层次的功能及相互之间的关系。同时,文章还讨论了TCP/IP模型的局限性、挑战及在实际应用中的作用。总之,本文帮助读者全面理解了TCP/IP模型在网络通信中的重要地位和作用。
车车
发布于 01月14日
32浏览
windows下安装达梦数据库客户端以及常用操作
本文介绍了达梦数据库的安装过程,包括软件下载、解压、安装步骤等。还介绍了DM管理工具的使用,包括创建连接、常用操作等。涵盖了查询数据、修改表相关、导出sql、数据导出导入等操作。
车车
发布于 01月14日
158浏览
Shell内置命令大全Linux运维工程师收藏
本文介绍了Shell中常用的内置命令及其用法,包括文件操作、进程管理、环境变量设置等方面。
车车
发布于 01月14日
34浏览
Linux初学者必学的10个命令学习
Linux命令行基础导航和文件管理,包括导航命令、文件权限管理、文本搜索和文件查找等。
车车
发布于 01月14日
25浏览
Docker网络命令大全建议收藏
本文介绍了Docker中与网络相关的一系列命令,包括创建、连接、断开连接、检查网络、列出网络、清理未使用网络和删除网络等命令的用法和参数说明。这些命令可以帮助用户管理Docker中的网络,实现容器之间的通信和外部访问。
车车
发布于 01月14日
28浏览
1
18
19
20
21
22
72