deepseek 第44页_飘花电影网

AI科学家杨立昆离职后揭秘Meta模型作弊疑云

离职的杨立昆（lecun），转身便向 meta 抛出一记重击：饱受诟病的 llama 4，确实存在“刷榜”操作！结果的确被轻微调整过。为追求更优指标，团队在不同基准测试中切换使用了多个模型版本。常言道：莫招惹离职人。不只杨立昆，田渊栋也在其个人年度复盘中悄然揭开一角内情。明明是被临时抽调来为 Llama 4 紧急救场的，出发前我预设了四种可能路径，结果扎克伯格直接甩给我第五种…… （扶额苦笑.jpg） Anyway，关于离职后的动向，两位业界泰...

2026-01-09/ 27 次浏览/ 资讯

DeepSeek新论文提出流形约束超连接框架，梁文锋参与撰写的研究论文揭秘

最新论文DeepSeek提出了一项名为“流形约束超连接”（mHC）的新框架，该框架由梁文锋等人参与撰写，该框架旨在解决复杂数据集中信息连接的问题，通过引入流形约束理论，提高了数据处理的效率和准确性，这一创新性的研究对于推动人工智能领域的发展具有重要意义。deepseek团队近期发布了一篇题为《mhc: manifold-constrained hyper-connections》（《mhc：流形约束超连接》）的论文，正式推出全新网络架构——mhc（流形约束超连接）。该设计聚焦...

2026-01-09/ 16 次浏览/ 资讯

英伟达GB200 NVL72性能超越AMD MI355X达惊人28倍差距！

英伟达GB200NVL72性能卓越，远超AMDMI355X，性能提升高达28倍，该处理器提供出色的计算能力和响应速度，能够满足各种高负荷任务需求，其强大的性能使其在市场上备受瞩目，成为消费者和专业人士的首选，英伟达不断优化的技术和不断创新的精神，使得其产品在性能上持续领先，满足用户不断变化的需求。在最新公布的 semianalysis inferencemax 基准评测中，signal65 对 deepseek-r1 0528 混合专家（moe）模型的推理能力进行了深度评估。...

2026-01-09/ 15 次浏览/ 资讯

智谱首席科学家唐杰透露，新一代模型GLM-5即将推出

晚点独家获悉，1 月 8 日智谱上市当天，清华大学计算机系教授、智谱创立发起人兼首席科学家唐杰发布内部信，宣布很快将推出新一代模型 GLM-5。唐杰说，今天是 “智谱生命中激动人心的一天”。他没有直接回应大模型公司的商业模式争议或给出智谱 2026 年商业化目标，但强调，真正 “有人用”，能帮到更多的人的理论、技术或产品才是智谱在追逐 AGI 路上的重要成就。除了 GLM-5 的发布，内部信还介绍了 2026 年智谱聚焦的三个技术方向，包括全新的模型架构设计，...

2026-01-09/ 25 次浏览/ 资讯

‹‹ ‹ 35 36 37 38 39 40 41 42 43 44 ››