第82章黑色星期一

第82章黑色星期一 (第2/2页)

“R1:RedefiningCost-PerformanceTradeoffsinLarge-ScaleLanguageModels？”
　　
　　旁边的同学Sarah搜了一下，果然找到了这篇刚刚发布不久的文章。
　　
　　“这是哪个公司的成果吗？”因为作者的名单上长长一串一般只有公司的文章才会这样。
　　
　　“就是DeepSeek，之前他们不是发过一个V3版本的论文吗？当时老板还让我们看过，你不记得了？”
　　
　　“哦~好像有点印象，怎么，这篇R1有很大的提升吗？”他一边说着一边看向下面的摘要部分。
　　
　　“Reinforcementlearning（强化学习）？这不是和我们现在做的方向一样吗？”不过当他看到第一张图片的时候不由得歪了歪脑袋，发出了同样的惊呼：“Holy*&#$？真的假的？”
　　
　　图片上面显示了，其效果几乎和GPT-o1持平，而且文中写到了其推理成本的二十分之一还不到。
　　
　　Leo苦笑着摇头“不知道，我希望是假的，但我感觉应该是真的。”
　　
　　搞科研最为悲伤的事情之一——你有了一个很好的idea，并且已经做了一段时间，就在快要有成果的时候，却发现人家已经做出来了，而且比自己做的更好。
　　
　　好消息：LLM有了新的突破，坏消息：你论文白写了。
　　
　　“哎~没办法，我再看看吧，如果是真的，估计老板肯定会要求我们复现的。”
　　
　　“说的也是。”
　　
　　和他们一样反应还有很多人，公司的工程师们，高校的学生老师，对搞科研的人来说熬夜是常态，所以哪怕论文是在夜里发的也有很多人看到了这篇文章。
　　
　　仅仅是论文发布后的第二天，各个视频网站或者学术论坛上就涌现出了不少针对R1的解读。
　　
　　之后几天，随着不断有人成功复现出DeepSeek，谷歌、Meta等大厂的AI部门负责人连夜召集紧急会议。
　　
　　因为DeepSeek的低成本将有可能会直接威胁到所有依赖高收费模式的云服务和AI公司的盈利预期。
　　
　　很快，市场上谣言四起，比如什么多家云服务提供商正在紧急重新谈判未来的GPU采购合同，规模可能大幅缩减。
　　
　　这一类的传言难辨真假，这就导致了在极度敏感和恐慌的市场情绪下，成为了压垮骆驼的最后一根稻草。
　　
　　DeepSeek的成功让资本市场看到了开发成本较低的强大AI模型的可能性。
　　
　　27号，正好是周一，美股开盘。
　　
　　周昀提前候在电脑面前，两块屏幕，一块屏幕放着电影，另一块屏幕显示着英伟达的股价。
　　
　　桌上还摆着一盘小零食，他盘着腿靠在椅子上，巴适的很。
　　
　　和记忆中新闻报道的一样，刚一开盘Nvidia就以无可匹敌之势一路下探，除此之外，其他芯片股也集体大跌。
　　
　　周昀吃着零食笑呵呵地看着下跌的股价，心里冒出一个念头，也不知道老黄现在是个什么表情。
　　
　　反正他的嘴角是真的难压。

零点看书

第82章 黑色星期一

第82章黑色星期一