这个春节假期DeepSeek太火了,好多文章提到“数据蒸馏”,作为数据人,又联想到“数据萃取”,但作为数据领域的小白,理解“数据蒸馏(Data Distillation)”和“数据萃取(Data Extraction)”的区别可能会有点抽象,通过学习整理而成通俗易懂的方式去解释它们的不同。 1. 核...

查看更多
头像滴滴提问于 02月08日
87浏览

DeepSeek V3 正式发布,模型与技术报告全开源,非常牛,又在大模型领域掀起了一股热议,概率为2句话: 便宜,正式训练成本仅要557万美元(2000张H800),而GPT-4o预估一亿美金 编程能力超过 Claude Sonnet 3.5 根据多个基准测试,DeepSeek v3 在代码方面甚...

查看更多
头像滴滴提问于 01月06日
231浏览