AI编程
AI应用开发
AI大世界
Flink
Doris
SeaTunnel
数据分析
Dolphinscheduler
StarRocks
车联网
PowerData
用户画像
Kafka
Dinky
Agile Query
Hive
Hadoop
有趣的开源集市
Streampark
Gravitino
Linux
数据仓库/中台
数据治理
Paimon
Clickhouse
MySQL
Docker
新零售
Spark
Web前端
Atlas
Kubernetes
Java
Hudi
嵌入式开发
Python开发
智能制造
Calcite
Drools
物理围栏
数据平台架构
金融
规则系统
Dbeaver
Elasticsearch
Nifi
Git
Linkis
Ambari
Kettle
Redis
Datart
MongoDB
Hbase
Zookeeper
Ranger
SQLLineage
Celeborn
游戏
Datax
Gradle
Iceberg
Druid
OpenMetadata
数据结构和算法
Canal
maven
Kyuubi
指标中台
Amoro
HiDataPlus
MQTT
FineReport
物流
数据湖
Griffin
Superset
DataHub
Debezium
MinIo
Tidb
Airflow
StreamSets
小阳杂说
Zabbix
Azkaban
Flume
数智化
Sqoop
Kudu
Beam
Tez
Telegraf
Oracle
Zeppelin
Nmon
Kylin
Prometheus
Maxwell
Storm
Davinci
Sentry
Pulsar
Filebeat
Impala
大数据启示录
Phoenix
Hue
Svn
Presto
Oozie
Cassandra
Greenplum
Grafana
雷达视频设备应用
InfluxDB
Bigtop
巨人肩膀
Golang
提示词工程
网络安全
数智领航
书籍共享
asdasd
动力电池
d3ed4
测试私密home显示
dasdas55555
SFF
无匹配社区
博客园
最新
热门
请选择社区
发布
流存储Fluss:迈向湖流一体架构
在大数据处理领域,Lambda 架构是使用非常广泛的一种架构。Lambda 架构将数据处理分成单独的两条链路,一条是离线计算链路,通常由 Hive 作为离线计算链路的存储,另外一条是实时链路,通常由流存储,如 Kafka 作为实时链路的存储。
Flink
车车
发布于 2024年12月16日
185浏览
Apache SeaTunnel 集群部署详细教程
SeaTunnel Engine 的Master服务和Worker服务分离,每个服务单独一个进程。Master节点只负责作业调度,RESTful API,任务提交等,Imap数据只存储在Master节点中。Worker节点只负责任务的执行,不参与选举成为Master,也不存储Imap数据。
SeaTunnel
车车
发布于 2024年12月13日
71浏览
第三方服务对目标进行被动信息收集
第三方服务或实体通过合法和非侵入性的手段,对特定目标(个人、组织、系统等)进行信息搜集和分析的过程。这种信息收集不涉及直接与目标交互或对其系统进行探测,而是通过公开可用的资源和数据来获取信息。
久安
发布于 2024年12月11日
83浏览
1点赞
B站大数据平台故障自愈实践
故障自愈系统通过智能化和自动化技术,显著提升了故障处理的及时性、智能化和可分析性,从而将被动响应转变为主动预防。
数据平台架构
随风
发布于 2024年12月10日
150浏览
Kubernetes 架构学习笔记(下)
在过去的两年中,我协助eBay云计算架构师做eBay云计算部门系统架构设计审核会议的组织协调工作,于是萌生了用我们日常工作中实际的架构设计讨论来深入理解社区 Kubernetes Design Principle 的想法。文中例子来源于真实的设计迭代, 我仅是做了汇总。借此机会感谢所有为云计算系统设计做出贡献的同事, 向你们学习才让我这些年对Kubernetes的设计理念有了进一步的理解。
Kubernetes
滴滴
发布于 2024年12月07日
33浏览
Kubernetes 架构学习笔记(上)
我把eBay 云计算部门的效率看成三个层面,第一层是代码开发的效率(包含持续集成持续发布), 第二层是架构效率,第三层是产品效率。这一篇博客主要讨论第二层架构效率。这件事情的缘起是一些架构讨论悬而不决,三年多前有一天我找到云计算部门的总架构师讨论一个设计困惑,他突然问我说许健你看过 Kubernetes 的设计原则吗?
Kubernetes
滴滴
发布于 2024年12月07日
58浏览
Hadoop平台进阶之路 | eBay Spark测试框架——Woody
新版本的Spark拥有更好的性能和稳定性,对于用户来说,如果长期停留在低版本的Spark,不仅会浪费集群资源,还会进一步加大平台管理团队的工作量。如果进行Spark大版本升级,考虑到版本间可能由于计算行为不一致而导致的数据质量问题,用户就要投入大量的精力去对比重要的job在不同版本下的数据质量,加大了版本升级的困难度。
Hadoop
滴滴
发布于 2024年12月07日
17浏览
一个快速且轻量的 Kafka 可视化工具,从此 Kafak 的运维管理简单化,Star 10K!
Kafka 以其高吞吐量和低延迟的数据传输能力而闻名,作为一个分布式流处理平台,广泛应用于大数据、实时流处理等领域。许多大型企业和开源项目都建立在Kafka之上,在互联网公司、金融行业、物联网(IoT)等多个领域都有广泛应用
有趣的开源集市
随风
发布于 2024年12月06日
118浏览
支持 Flink/Gluten/优雅升级...Celeborn0.3.0 介绍
Apache Celeborn(Incubating)[1] [2] 是阿里云开源的大数据计算引擎通用 Remote Shuffle Service,旨在提升 Shuffle 的性能/稳定性/弹性,目前已广泛运行在包含阿里在内的多家企业,每天服务着生产环境数十P的 Shuffle 数据,可稳定支撑单 Shuffle 超 600T 的大作业。
Celeborn
随风
发布于 2024年12月05日
96浏览
Iceberg x Amoro 在多点 DMALL 数据入湖的探索实践
随着大数据技术的迅猛发展,数据湖作为新兴的数据管理范式应运而生。在此基础上,通过简化架构、优化数据流程、引入创新技术等方式,降低企业数字化转型中的 TCO(总体拥有成本)成为可能。多点 DMALL 作为零售科技领域的先行者,我们持续探索和实践前沿技术,旨在提升数据处理效率,实现数据管理的标准化和自动化。通过这些努力,我们逐步构建了一个更高效、更具成本效益的大数据生态系统,赋能企业决策和生产运营。
Amoro
Iceberg
随风
发布于 2024年12月05日
94浏览
数据安全:105个必备词汇定义解读!
数据安全:105个必备词汇定义解读!
随风
发布于 2024年12月05日
26浏览
服务器重启后如何自动重启 Docker 容器?
在现代 IT 运维中,容器化技术的普及使得 Docker 成为服务器管理的重要工具之一。然而,在实际生产环境中,服务器因各种原因(如定期维护、意外断电或升级操作系统)重启后,如何让 Docker 容器自动恢复运行成为一个关键问题。本文将详细介绍如何确保 Docker 容器在服务器重启后自动重启,包括相关原理、配置方法以及一些常见的注意事项。
Docker
车车
发布于 2024年12月05日
46浏览
【禁止血压飙升】阿里大佬写的Controller太优雅了!
见过几千行代码的 controller吗?我见过。 见过全是 try catch 的 controller 吗,我见过。 见过全是字段校验的 controller 吗,我见过。 见过全是业务代码的 controller 吗?不好意思,我们公司很多业务写在 controller 的。 看见这些我真的血压高。
Java
春风得意
发布于 2024年12月04日
17浏览
推荐 10 个漏洞管理工具,漏洞猎手必备!
随着网络攻击的日益复杂,漏洞管理已经成为保障信息安全和保护企业资产的核心环节。漏洞管理工具能够有效地帮助企业及时发现、评估、修复系统中的安全漏洞,从而降低数据泄露、网络攻击等风险。漏洞管理不仅仅是一个技术层面的任务,它涉及到企业的各项安全操作,包括资产发现、漏洞扫描、补丁管理、以及合规性检查等。
网络安全
春风得意
发布于 2024年12月04日
39浏览
从3分钟到10秒:Doris统计信息背后不得不说的故事
让我们一起揭开统计信息的神秘面纱,看看这个默默无闻的"幕后英雄"如何让你的查询性能起飞!
Doris
春风得意
发布于 2024年12月04日
40浏览
Flink CDC 3.2.1 发布公告
Apache Flink 社区非常高兴地宣布,Flink CDC 3.2 系列的第一个稳定性修复版本 3.2.1 已经正式发布。
Flink
StarRocks
忆往昔
发布于 2024年12月04日
128浏览
Paimon x StarRocks 在同程旅行的湖仓构建方案
早期,同程旅行的数仓体系基于 Hive 来实现离线数据分析,在满足用户实时需求方面存在不足。为了解决这一问题,我们引入了 Apache Kudu 组件,将 ODS 层的数据同时写入 Hive 和 Kudu。由于 Kudu 不支持流式读取,我们通过 Spark 读取Kudu进行下游处理,以 10 分钟或 1 小时为周期调度任务,将处理后的数据写回 Kudu 表。
StarRocks
忆往昔
发布于 2024年12月04日
176浏览
写给小白的大模型入门科普
网上关于大模型的文章也很多,但是都不太容易看懂。小枣君今天试着写一篇,争取做到通俗易懂。
AI应用开发
春风得意
发布于 2024年12月02日
87浏览
只有中国人才懂的 6 个前端工具!
今天来分享 6 个只有中国人才懂的前端工具库,这些工具在特定场景下非常有用!
Web前端
agile query
发布于 2024年12月02日
68浏览
Hadoop3.4或者 hive4在jdk17运行报错 module java.base does not “opens java.net“ to unnamed module @305fd85d
Hadoop3.4或者 hive4在jdk17运行报错 module java.base does not “opens java.net“ to unnamed module @305fd85d
Hadoop
Hive
诗与远方
发布于 2024年12月02日
119浏览
1点赞
1收藏
1
11
12
13
14
15
60