AI大世界知道
1、通义千问Qwen3发布:推理能力显著增强   主要内容:   🧩 Qwen3系列模型在代码、数学和通用能力等基准测试中表现优异,展现出与顶级模型的竞争力。   🔍 Qwen3支持思考模式和非思考模式,用户可根据任务需求控制模型的推理程度,提升效率。   🌍 Qwen3开源多个模型并支持11...
查看更多
2浏览
1、OpenAI发布两款多模态推理模型o4-mini、满血版o3   主要内容:   🛠️ o4-mini和o3具备多模态处理能力,能同时处理文本、图像和音频,并自动调用外部工具。   📊 o4-mini在AIME2024和2025测试中准确率分别达到93.4%和92.7%,超越满血版o3。  ...
查看更多
19浏览
1、Kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4o   主要内容:   🛠️ Kimi-VL 和 Kimi-VL-Thinking 采用轻量级 MoE 架构,参数仅 30 亿,运行效率高。   📊 在 MathVision 和 Scre...
查看更多
20浏览
1、阿里通义千问Qwen2.5-Omni登顶全球开源模型榜单   主要内容:   🏆 Qwen2.5-Omni成为全球开源模型榜单第一,展现强大性能和多模态能力。   🔍 DeepSeek-V3-0324和SpatialLM-Llama-1B紧随其后,为开发者提供更多选择。   🌐 阿里通义千...
查看更多
31浏览
1、快手可灵AI全面接入DeepSeek-R1,DeepSeek灵感版已上线   主要内容:   🌟 快手可灵AI全面接入DeepSeek-R1,助力用户将灵感转化为专业提示词。   🔥 可灵AI持续迭代升级,进一步降低创作门槛,提升创作效率。   🎬 DeepSeek灵感版与“灵感词库”联动...
查看更多
20浏览
1、腾讯发布Hunyuan-TurboS:首款超大型混合Transformer-Mamba MoE模型震撼登场   主要内容:   ⚙️ Hunyuan-TurboS结合Mamba与Transformer优势,突破长文本处理瓶颈。   📈 在数学、推理和对齐性上超越GPT-4o等顶尖模型,展现强劲...
查看更多
28浏览
1、DeepSeek开源第四天发布并行策略升级:DualPipe与EPLB技术推动大模型训练革命   主要内容:   🔄 DualPipe算法实现双向数据流管道,提升计算吞吐量,适用于千亿至万亿参数规模的模型训练。   ⚖️ EPLB动态负载均衡器解决了混合专家模型中的热点专家问题,整体利用率提升...
查看更多
38浏览
1、通义万相开源视频生成模型Wan2.1:8.2G显存即可生成480P视频   主要内容:   🚀 Wan2.1模型在Vbench评测中以86.22%成绩位列第一,领先其他视频生成模型。   💡 采用3D因果VAE模块,实现256倍无损视频隐空间压缩,提高了视频重建速度。   🔧 支持多种主流...
查看更多
28浏览
1、Anthropic推出混合推理模型Claude 3.7 Sonnet:能力超DeepSeek   主要内容:   🧠 Claude 3.7 Sonnet是市场上唯一的混合推理模型,结合了推理和实时生成能力。   💻 新推出的Claude Code工具可搜索、编辑代码,并支持GitHub提交,...
查看更多
34浏览
1、百度文心一言4月1日起全面免费并新增深度搜索功能 主要内容: 🔍 百度文心一言自4月1日起全面免费,新增深度搜索功能,显著提升搜索体验。 ✨ 深度搜索支持多模态输入输出,提供更专业的内容回复,满足多场景需求。 2、OpenAI传言GPT-5可能免费无限使用 主要内容: 🌍 据传言,GPT-5...
查看更多
30浏览
  • 1
  • 2
  • 3
  • 4