AI编程
AI应用开发
AI大世界
Flink
Doris
SeaTunnel
数据分析
Dolphinscheduler
StarRocks
车联网
PowerData
用户画像
Kafka
Dinky
Agile Query
Hive
Hadoop
有趣的开源集市
Streampark
Gravitino
Linux
数据仓库/中台
数据治理
Paimon
Clickhouse
MySQL
Docker
新零售
Spark
Web前端
Atlas
Kubernetes
Java
Hudi
嵌入式开发
Python开发
智能制造
Calcite
Drools
物理围栏
数据平台架构
金融
规则系统
Dbeaver
Elasticsearch
Nifi
Git
Linkis
Ambari
Kettle
Redis
Datart
MongoDB
Hbase
Zookeeper
Ranger
SQLLineage
Celeborn
游戏
Datax
Gradle
Iceberg
Druid
OpenMetadata
数据结构和算法
Canal
maven
Kyuubi
指标中台
Amoro
HiDataPlus
MQTT
FineReport
物流
数据湖
Griffin
Superset
DataHub
Debezium
MinIo
Tidb
Airflow
StreamSets
小阳杂说
Zabbix
Azkaban
Flume
数智化
Sqoop
Kudu
Beam
Tez
Telegraf
Oracle
Zeppelin
Nmon
Kylin
Prometheus
Maxwell
Storm
Davinci
Sentry
Pulsar
Filebeat
Impala
大数据启示录
Phoenix
Hue
Svn
Presto
Oozie
Cassandra
Greenplum
Grafana
雷达视频设备应用
InfluxDB
Bigtop
巨人肩膀
Golang
提示词工程
网络安全
数智领航
书籍共享
asdasd
动力电池
d3ed4
测试私密home显示
dasdas55555
SFF
无匹配社区
博客园
最新
热门
请选择社区
发布
3 分钟快速了解 JuiceFS
💡 JuiceFS 是一款高性能、云原生分布式文件系统,拥有企业版与社区版两个版本。 企业版:面向海量文件、高性能应用场景,如 AI 模型训练、大数据平台分布式计算、高性能计算。 企业可采用云服务版或者本地部署。社区版:面向通用场景,易于维护和使用,方便定制化,适合热衷参与开源社区建设的团队。在 Apache 2.0 协议下发布,目前有约 10.8K GitHub 星标 。
洪波涌起
发布于 2024年12月01日
42浏览
Fluss-面向分析的实时流存储初探
编者荐语: 我超哥嘎嘎能写,写到凌晨3点44,超哥牛的,支持云邪偶像的Fluss
洪波涌起
发布于 2024年11月30日
237浏览
黑五来临!跨境电商该如何做数据分析?需要关注哪些指标?
跨境电商数据分析常常面临着数据的海量增长、多平台运营的复杂性、以及跨国交易的多变性等问题。这也导致从事跨境电商的朋友在分析数据时饱受困扰。但其实只要明确了思路,选对了工具,也可以实现高效的跨境电商数据分析。下面老李就结合我个人的从业经验,为大家系统说明一下跨境电商分析的思路和步骤。
数据分析
洪波涌起
发布于 2024年11月30日
42浏览
【全面解读】Apache SeaTunnel常见问题全攻略
Apache SeaTunnel 是一个分布式、高性能、易扩展、用于海量数据(离线&实时)同步和转化的数据集成平台
SeaTunnel
数智先锋
发布于 2024年11月30日
52浏览
阿里重磅开源 Fluss: Flink Unified Streaming Storage
Fluss 项目是由阿里云智能 Flink 团队研发的一款面向流分析的下一代流存储,旨在解决流存储在分析方面长期存在的挑战。Fluss 的项目定位是为 Apache Flink 提供实时流存储底座,进一步提升 Flink 实时流计算的能力。因此,Fluss 的名字源自“FLink Unified Streaming Storage” 的首字母缩写。
Flink
数智先锋
发布于 2024年11月29日
220浏览
eBay 基于 Celeborn RESTful API 进行自动化工具集成实践
Apache Celeborn 是一个统一的大数据中间服务,致力于提高不同MapReduce引擎的效率和弹性。为了Spark on Kubernetes的弹性以及解决External Shuffle Service的灵活性和稳定性不足,eBay引入 Celeborn 作为Remote Shuffle Service。本文介绍了eBay基于最新 RESTful API 进行自动化管理Celeborn
Celeborn
数智先锋
发布于 2024年11月29日
30浏览
内含福利 | StarRocks 2024年度技术峰会,与30+全球企业共探湖仓技术创新
StarRocks 社区的年度盛会——StarRocks Summit Asia 2024 将于 12 月 7 日在北京隆重登场! StarRocks 社区作为连接用户、平台方、业务方、技术爱好者与学术人员的开放平台,始终致力于打造标准化的行业解决方案,让每一位参与者都能在实践中汲取经验,在交流中碰撞创新。
StarRocks
巨人肩膀小编
发布于 2024年11月28日
94浏览
3点赞
为何大厂开发者纷纷抛弃小仓,转向大仓monorepo?
在软件开发领域,代码仓库的管理方式对项目的效率和协作有着重要影响。 随着项目结构的日益复杂和开发挑战的不断增长,传统的单一代码库(Monolith)在应对多项目、多库和多服务的情况下显得力不从心,正是在这个背景下,Monorepo(微服务大仓)和Multirepo(微服务多仓)的概念应运而生。
数据仓库/中台
海星之梦
发布于 2024年11月28日
95浏览
1点赞
从零开始了解推荐系统全貌
如果说互联网的目标就是连接一切,那么推荐系统的作用就是建立更加有效率的连接,推荐系统可以更有效率的连接用户与内容和服务,节约了大量的时间和成本。 如果把推荐系统简单拆开来看,推荐系统主要是由数据、算法、架构三个方面组成。
用户画像
海星之梦
发布于 2024年11月28日
80浏览
Apache Doris 现行版本 Docker-Compose 运行教程
随着 Apache Doris 项目的火热,很多想尝鲜或者试用的小伙伴都希望通过 Docker 来快速拉起一个功能测试或者开发的集群,但由于一些变更原因,Doris On Docker 这一块的内容还未来得及调整完,所以为了让更多的小伙伴不卡在快速使用的路上,特此出一版教程给大家快速拉起试用。
Doris
海星之梦
发布于 2024年11月28日
405浏览
Apache Flink 2.0-preview released
Apache Flink 社区正在积极准备 Flink 2.0,这是自 Flink 1.0 发布 8 年以来的首次大版本发布。作为一个重要的里程碑,Flink 2.0 将引入许多激动人心的功能和改进,以及一些不兼容的破坏性变更。为了促进用户和上下游项目(例如,连接器)尽早适配这些变更,提前尝试这些令人兴奋的新功能同时收集反馈,我们现在提供了 Flink 2.0 的预览版本。
Flink
海星之梦
发布于 2024年11月28日
35浏览
Apache Celeborn 让 Spark 和 Flink 更快更稳更弹性
大数据引擎的中间数据有两个来源: Shuffle 和 Spill,其中最重要的是 Shuffle,据统计有超过 15%的资源消耗在 Shuffle。
Celeborn
春风得意
发布于 2024年11月27日
66浏览
知乎基于 Apache Celeborn 优化 Spark Shuffle 的实践
知乎Hadoop集群上每天运行着大量的Spark作业,包括调度平台提交的例行作业、Kyuubi提交的Spark SQL作业,每天Spark作业的Shuffle量达到3PB以上,单个Spark作业Shuffle量最大接近100TB,单个Stage 50TB。同时Hadoop集群上每天有1PB左右的MR作业Shuffle,以及DataNode的磁盘IO。
Celeborn
春风得意
发布于 2024年11月27日
234浏览
解析 Apache SeaTunnel 的任务运行过程
解析 Apache SeaTunnel 的任务运行过程,欢迎交流。
SeaTunnel
Dataops
发布于 2024年11月27日
36浏览
VTS:基于Apache SeaTunnel的开源向量数据迁移工具
VTS(Vector Transport Service),全称向量传输服务,是一个由Zilliz开发的专注于向量和非结构化数据迁移的开源工具。VTS的核心特点在于其基于Apache SeaTunnel开发,这一事实使其在数据处理和迁移方面具有显著的优势。
SeaTunnel
Dataops
发布于 2024年11月27日
65浏览
SQL SERVER日常运维巡检系列——结构设计
SQL SERVER日常运维巡检系列——结构设计
u3077
发布于 2024年11月27日
42浏览
7点赞
Redis为什么这么快?
Redis为什么这么快?
Kha'Zix
发布于 2024年11月26日
60浏览
9点赞
1收藏
C++ —— 以真我之名 如飞花般绚丽 - 智能指针
C++ —— 以真我之名 如飞花般绚丽 - 智能指针
Kha_zix
发布于 2024年11月26日
49浏览
1点赞
如何在 Linux 上查看 SSH 日志?
SSH(Secure Shell)是 Linux 系统中最常用的远程管理协议之一。在服务器管理中,查看 SSH 日志是一项必备技能。通过分析日志,你可以监控登录活动、排查连接问题,甚至发现潜在的安全威胁。本文将深入讲解如何在 Linux 上查看 SSH 日志,从基础到进阶,一步步引导你掌握这一技能。
Linux
车车
发布于 2024年11月23日
151浏览
1点赞
网络安全工程师必须具备的八款工具,一次都分享给你!
网络安全工程师在维护和保护信息系统的安全性方面扮演着至关重要的角色。为了有效地完成这一任务,他们需要掌握并使用多种工具。本文将详细介绍八款网络安全工程师必备的工具,包括Snort、Wireshark、Nmap、Metasploit、Nessus、OpenVAS、Firewall和Proxy server。
网络安全
车车
发布于 2024年11月23日
39浏览
1
12
13
14
15
16
60