博客园
最新
热门
发布
日榜
周榜
月榜
从零开始了解推荐系统全貌
如果说互联网的目标就是连接一切,那么推荐系统的作用就是建立更加有效率的连接,推荐系统可以更有效率的连接用户与内容和服务,节约了大量的时间和成本。 如果把推荐系统简单拆开来看,推荐系统主要是由数据、算法、架构三个方面组成。
海星之梦
发布于2024年11月28日
353浏览
知乎基于 Apache Celeborn 优化 Spark Shuffle 的实践
知乎Hadoop集群上每天运行着大量的Spark作业,包括调度平台提交的例行作业、Kyuubi提交的Spark SQL作业,每天Spark作业的Shuffle量达到3PB以上,单个Spark作业Shuffle量最大接近100TB,单个Stage 50TB。同时Hadoop集群上每天有1PB左右的MR作业Shuffle,以及DataNode的磁盘IO。
春风得意
发布于2024年11月27日
656浏览
网络安全工程师必须具备的八款工具,一次都分享给你!
网络安全工程师在维护和保护信息系统的安全性方面扮演着至关重要的角色。为了有效地完成这一任务,他们需要掌握并使用多种工具。本文将详细介绍八款网络安全工程师必备的工具,包括Snort、Wireshark、Nmap、Metasploit、Nessus、OpenVAS、Firewall和Proxy server。
车车
发布于2024年11月23日
164浏览
阿里云StarRocks使用感受:优点与挑战
在这个信息爆炸的时代,我们的业务对数据的实时性要求越来越高。为了应对这个挑战,我们选择了一款强大的OLAP数据库——阿里云的StarRocks。在这篇文章中,我将分享我们使用StarRocks的心路历程,包括它带给我们的便利,以及我们在使用过程中遇到的一些困扰和问题。
墨翼飞鸿
发布于2024年11月20日
1033浏览
2点赞
drools使用指南——动态增加、修改、删除规则
drools使用指南——动态增加、修改、删除规则
OAOA
发布于2024年11月19日
636浏览
2点赞
Seatunnel 概述
SeaTunnel是一个简单易用的数据集成框架,在企业中,由于开发时间或开发部门不通用,往往有多个异构的、运行在不同的软硬件平台上的信息系统同时运行。数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享
月影幽篁
发布于2024年11月19日
548浏览
215点赞
2收藏
一个AI驱动的搜索引擎内置SearXNG也许是未来搜索新姿态Star10K
一个LLM驱动的搜索引擎,不仅可以搜索网页内容,还可以理解你的问题,提供最优的回答。 使用先进的机器学习算法,如相似性搜索和嵌入式技术来完善搜索结果,并提供搜索结果的数据来源。
车车
发布于2024年11月16日
845浏览
Java使用JavaCV处理摄像头视频,并记录下遇到的坑
使用JavaCV实现摄像头视频帧推送到媒体服务器,通过FFmpegFrameGrabber采集视频帧,FFmpegFrameRecorder推流。项目开发需定义采集和推流地址,初始化grabber和recorder,通过start方法开始录制。JavaCV优势包括逻辑清晰、自定义能力强等。开发时需注意项目打包文件大、FFmpegFrameGrabber超时设置等坑。
OAOA
发布于2024年11月10日
590浏览
1点赞
利用Nginx+ffmpeg+rtsp搭建直播服务器,实现rtsp转rtmp/http-flv推流(同时拉流)
利用Nginx+ffmpeg+rtsp搭建直播服务器,实现rtsp转rtmp/http-flv推流(同时拉流)
OAOA
发布于2024年11月10日
545浏览
1点赞
从零开始搭建创业公司后台技术栈
哈喽,大家好,我是黑板报君,一个资深的软件开发工程师,致力于为大家分享各领域优质开源项目,开发前沿技术以及互联网技术圈动态。
车车
发布于2024年11月09日
88浏览
开放型数据开源社区 "PowerData" 的运营思考
你的热情可以感染身边的人,你的纯粹可以吸引志同道合的伙伴,你的热爱可以给大家力量,你即是社区,社区即是你,不要把运营社区当做一件工作,而是像对待生活一样对待 PowerData,passion!!!
PowerData
发布于2024年10月27日
180浏览
12:k8s的基础概念
k8s的基础概念
久安
发布于2024年10月23日
294浏览
Apache Dolphinscheduler Standalone 部署教程
Standalone 仅适用于 DolphinScheduler 的快速体验. 如果你是新手,想要体验 DolphinScheduler 的功能,推荐使用Standalone方式体检。 如果你想体验更完整的功能,或者更大的任务量,推荐使用伪集群部署。如果你是在生产中使用,推荐使用集群部署或者kubernetes。
实践
Dataops
发布于2024年10月16日
275浏览
1点赞
1收藏
饿了么基于Flink+Paimon+StarRocks的实时湖仓探索
本文整理自饿了么大数据架构师、Apache Flink Contributor 王沛斌老师在8月3日 Streaming Lakehouse Meetup Online(Paimon x StarRocks,共话实时湖仓架构)上的分享。主要分为以下三个内容:1. 饿了么实时数仓演进之路2. 实时湖仓方案选型与探3. 实时湖仓规划及展望。
数智先锋
发布于2024年09月10日
1162浏览
1 简介
中文,免费,零起点,完整示例,基于最新的Python 3版本。 Python是一种计算机程序设计语言。你可能已经听说过很多种流行的编程语言,比如非常难学的C语言,非常流行的Java语言,适合初学者的Basic语言,适合网页编程的JavaScript语言等等。
忆往昔
发布于2024年09月09日
321浏览
安装PDF转Markdown工具-Marker-阿里云-centos7
一个开源、先进的PDF转换工具,它利用深度学习技术将PDF文件高保真地转换成Markdown格式。能够处理多种语言,自动去除页眉页脚等非内容元素,并支持表格、代码块和图像的格式化。Marker在保持原有文档结构的同时,提供了快速准确的转换效果。
忆往昔
发布于2024年09月05日
589浏览
一个自托管的翻译平台,无需依赖外部服务,离线版的Google翻译,Star 7.8K!
一个自托管的翻译平台,无需依赖外部服务,离线版的Google翻译,Star 7.8K!
开源集市
发布于2024年09月05日
2039浏览
1点赞
1收藏
Linux远程管理工具推荐
前两天xshell不让用了,刚好一台新电脑要装一个远程连接工具,准备试试其他。网上找了一些资料整理如下。 欢迎各位看官评论区说出你在使用的工具,期待你的使用经验分享(有偿投稿到本专栏)。如对本文有所补充可以申请编辑权限。
忆往昔
发布于2024年09月04日
745浏览
4收藏
Spring IOC实现原理详解之IOC初始化流程
Spring IOC实现原理详解之IOC初始化流程
Java小白
发布于2024年09月04日
122浏览
Apache Doris 全新分区策略 Auto Partition 应用场景与功能详解 | Deep Dive系列
在当今数据驱动的时代,如何高效、有序地管理数据库中的海量数据成为挑战。为了处理庞大的数据集,分布式数据库引入了类似分区和分桶策略,通过将数据按特定规则划分成较小的单位并分布到不同节点上,利用并行计算能力以提升处理和分析性能,并加强了数据管理的灵活性。
Faith_xzc
发布于2024年08月27日
292浏览
1
8
9
10
11
12
83