飘花电影网

展开菜单

AI科学家杨立昆离职后揭秘Meta模型作弊疑云

AI科学家杨立昆离职后揭秘Meta模型作弊疑云
离职的杨立昆(lecun),转身便向 meta 抛出一记重击:饱受诟病的 llama 4,确实存在“刷榜”操作! 结果的确被轻微调整过。 为追求更优指标,团队在不同基准测试中切换使用了多个模型版本。 常言道:莫招惹离职人。不只杨立昆,田渊栋也在其个人年度复盘中悄然揭开一角内情。 明明是被临时抽调来为 Llama 4 紧急救场的,出发前我预设了四种可能路径,结果扎克伯格直接甩给我第五种…… (扶额苦笑.jpg) Anyway,关于离职后的动向,两位业界泰...

DeepSeek新论文提出流形约束超连接框架,梁文锋参与撰写的研究论文揭秘

DeepSeek新论文提出流形约束超连接框架,梁文锋参与撰写的研究论文揭秘
最新论文DeepSeek提出了一项名为“流形约束超连接”(mHC)的新框架,该框架由梁文锋等人参与撰写,该框架旨在解决复杂数据集中信息连接的问题,通过引入流形约束理论,提高了数据处理的效率和准确性,这一创新性的研究对于推动人工智能领域的发展具有重要意义。deepseek团队近期发布了一篇题为《mhc: manifold-constrained hyper-connections》(《mhc:流形约束超连接》)的论文,正式推出全新网络架构——mhc(流形约束超连接)。该设计聚焦...

英伟达GB200 NVL72性能超越AMD MI355X达惊人28倍差距!

英伟达GB200 NVL72性能超越AMD MI355X达惊人28倍差距!
英伟达GB200NVL72性能卓越,远超AMDMI355X,性能提升高达28倍,该处理器提供出色的计算能力和响应速度,能够满足各种高负荷任务需求,其强大的性能使其在市场上备受瞩目,成为消费者和专业人士的首选,英伟达不断优化的技术和不断创新的精神,使得其产品在性能上持续领先,满足用户不断变化的需求。在最新公布的 semianalysis inferencemax 基准评测中,signal65 对 deepseek-r1 0528 混合专家(moe)模型的推理能力进行了深度评估。...

智谱首席科学家唐杰透露,新一代模型GLM-5即将推出

智谱首席科学家唐杰透露,新一代模型GLM-5即将推出
晚点独家获悉,1 月 8 日智谱上市当天,清华大学计算机系教授、智谱创立发起人兼首席科学家唐杰发布内部信,宣布很快将推出新一代模型 GLM-5。 唐杰说,今天是 “智谱生命中激动人心的一天”。他没有直接回应大模型公司的商业模式争议或给出智谱 2026 年商业化目标,但强调,真正 “有人用”,能帮到更多的人的理论、技术或产品才是智谱在追逐 AGI 路上的重要成就。 除了 GLM-5 的发布,内部信还介绍了 2026 年智谱聚焦的三个技术方向,包括全新的模型架构设计,...