数智先锋
的博客园
(29)
基于ChromeDriver的网页转图片实现
详解Java使用ChromeDriver进行网页截图的方法,包含版本兼容性解决方案和Linux部署完整流程。
AI应用开发
ChromeDriver
数智先锋
发布于21 days ago
50浏览
消费者洞察分析怎么做?以亚马逊用户调研为例
本文通过处理亚马逊消费者调研问卷数据,深入分析了消费者画像、购物链路及平台服务影响因素,发现年轻女性是主要消费群体,并强调消费者洞察是持续迭代的过程,需将数据转化为决策依据。
数据分析
亚马逊
消费者洞察
数据分析
可视化分析
购物链路分析
策略制定
数智先锋
发布于02月23日
139浏览
DeepSeek时代,中小IT公司生存受到哪些深远影响?
本文分析了普通IT公司面对AI技术变革的挑战和机遇,强调了在AI时代,IT公司需要转变思路,将AI技术融入产品和服务中,以适应市场需求。文章提出了普通IT公司如何在AI时代生存和发展的策略,包括避免与AI巨头正面竞争,聚焦垂直行业,建立数据护城河等。
AI应用开发
AI大世界
AI时代挑战与机遇
IT公司应对策略
AI技术在产品中的应用
垂直行业聚焦
数据护城河建立
数智先锋
发布于02月22日
50浏览
鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目
本文主要介绍了鹰角数据平台架构的演进过程,包括数据湖选型、湖仓交互平台、权限管理体系实施等内容。通过采用Paimon和Trino等技术,实现了数据的高效存储和查询分析,并建设了完善的权限管理体系。同时,还进行了定制化Trino基建和联邦查询等方面的探索和实践。
Flink
Hudi
Flink
Hudi
数据湖选型
湖仓一体建设
Paimon
Trino
数智先锋
发布于02月19日
170浏览
K8S异常诊断之俺的内存呢
本文解决Kubernetes集群中的OOM和Pod驱逐问题,通过信息采集和日志分析,定位到systemd覆盖kubelet设置的memory limit的问题,提供临时解决方案和升级集群以修复问题的建议。
Kubernetes
Docker
Kubernetes
资源问题
Systemd
日志分析
数智先锋
发布于02月18日
96浏览
计算效率提升 10 倍,存储成本降低 60%,灵犀科技基于 Apache Doris 建设统一数据服务平台
灵犀科技早期基于 Hadoop 构建大数据平台,在战略调整和需求的持续扩增下,数据处理效率、查询性能、资源成本问题随之出现。为此,引入 Apache Doris 替换了复杂技术栈,升级为集存储、加工、服务为一体的统一架构,实现存储成本下降 60%,计算效率提升超 10 倍 的显著成效。
Doris
数智先锋
发布于01月02日
49浏览
Apache SeaTunnel 社区 2024 年度报告
2024 年是 Apache SeaTunnel 社区高速成长的一年。从技术创新到用户生态,从版本发布到社区活动,我们见证了无数开发者与企业在数据集成领域的探索与突破。
SeaTunnel
数智先锋
发布于01月02日
42浏览
40% 降本:多点 DMALL x StarRocks 的湖仓升级实战
多点 DMALL 成立于2015年,持续深耕零售业,为企业提供一站式全渠道数字零售解决方案 DMALL OS。作为 DMALL OS 数字化能力的技术底座,大数据平台历经多次迭代平稳支撑了公司 To B 业务的快速开展。随着国家产业升级和云原生技术的成熟,平台架构也从存算一体逐步转向存算分离。本文将以 StarRocks 的升级演进为例,分享这一过程中的探索与实践。
StarRocks
数智先锋
发布于01月02日
254浏览
【全面解读】Apache SeaTunnel常见问题全攻略
Apache SeaTunnel 是一个分布式、高性能、易扩展、用于海量数据(离线&实时)同步和转化的数据集成平台
SeaTunnel
数智先锋
发布于2024年11月30日
80浏览
阿里重磅开源 Fluss: Flink Unified Streaming Storage
Fluss 项目是由阿里云智能 Flink 团队研发的一款面向流分析的下一代流存储,旨在解决流存储在分析方面长期存在的挑战。Fluss 的项目定位是为 Apache Flink 提供实时流存储底座,进一步提升 Flink 实时流计算的能力。因此,Fluss 的名字源自“FLink Unified Streaming Storage” 的首字母缩写。
Flink
数智先锋
发布于2024年11月29日
330浏览
1
2
3