Thinking Machines Lab最新发文,深入探讨了大型语言模型(LLM)在推理过程中的不确定性问题,文章指出,尽管LLM在许多任务上表现出色,但在推理过程中存在的不确定性是其固有特性,这限制了模型的决策准确性和可解释性,文章强调了理解并量化这些不确定性对于提高LLM性能和可靠性至关重要。
由前 OpenAI 首席技术官 Mira Murati 创立的 Thinking Machines Lab 近日发布了其首篇技术博客:《在 LLM 推理中战胜不确定性》("...
DeepChat企业AI应用平台新增智能体发布嵌入网站功能,这一更新将AI智能服务无缝集成到企业网站中,提升用户体验和效率,通过智能体发布功能,企业可以更方便地管理和发布AI应用,而嵌入网站功能则使得这些智能服务触手可及,这一创新举措旨在帮助企业更充分地利用AI技术,推动业务智能化发展。
经过一段时间的持续开发,由单人携手AI共同打造的 deepchat 项目终于初具雏形。
项目地址:https://www.php.cn/link/1a98639f7a5974a45c...
摩尔线程发布大模型训练仿真工具SimuMax v1.0,该工具具备高度精确的显存模拟功能,误差仅为1%,SimuMax v1.0可帮助开发者在大规模并行计算环境中进行模型训练和性能优化,提升大模型训练的效率与准确性,这一创新工具将促进人工智能领域的发展,为科研工作者和开发者提供强大的支持。9月11日,摩尔线程正式推出并开源其大模型分布式训练仿真工具simumax v1.0,在显存占用与性能仿真精度方面实现重大突破,同时新增多项核心功能,显著提升对各类模型的兼容性与使用灵活性。...
快手发布开源多模态大模型Kwai Keye-VL-1.5,该模型具备强大的自然语言处理和计算机视觉能力,能够处理文本、图像等多种模态数据,该模型的开源将促进人工智能领域的技术进步和创新应用,有助于推动多模态交互技术的发展和应用落地,该模型具备广泛的应用前景,可应用于智能客服、智能推荐、自动驾驶等多个领域,快手通过不断投入研发和技术创新,在多模态大模型领域取得了重要进展。快手近日正式推出了多模态大语言模型keye-vl-1.5-8b。
https://www.php....
在即将举办的2025服贸会上,墨迹天气将展示其AI驱动的先进气象科技,该公司致力于将气象科技应用于各行各业,助力绿色可持续发展,通过其精准的气象预测和数据分析,墨迹天气能够为各行各业提供有针对性的解决方案,促进产业的智能化和可持续发展。9月10日,2025年中国国际服务贸易交易会(简称“服贸会”)在北京首钢园正式拉开帷幕。国内领先的综合气象服务平台墨迹天气集中展示了其在商业气象服务领域的最新技术突破与多元化应用场景,充分体现了气象科技在推动各行业数字化升级、助力绿色低碳发展中...
9 月 12 日消息,据 BusinessInsider 报道,微软 AI 部门 CEO 穆斯塔法・苏莱曼(Mustafa Suleyman)在一场内部会议上透露,公司正计划“大规模投资”建设专属的 AI 芯片集群,目标是实现人工智能核心技术的“自主可控”。
长期以来,微软在 AI 战略上高度依赖与 OpenAI 的深度合作。然而,随着双方关系出现微妙变化,微软正在加速构建独立的技术路径。苏莱曼指出,尽管将继续通过 Azure 为 OpenAI 提供强大的云基础设施...
蚂蚁与中国人民大学合作发布了首个原生MoE扩散语言模型,该模型基于多出口(MoE)架构,融合了先进的人工智能技术,实现了自然语言处理的扩散效果,这一创新性的语言模型将助力智能对话、智能推荐等应用场景的发展,标志着人工智能领域的重要进步。
蚂蚁集团联合中国人民大学正式发布业界首个基于原生MoE架构的扩散语言模型(dLLM)——“LLaDA-MoE”。
该模型采用非自回归的掩码扩散机制,突破了传统语言模型依赖自回归生成的固有范式,在上下文学习、指令理解、代码生成与数学推理...
AMD锐龙AI Max+ 395迷你AI工作站是最佳的端侧AI解决方案之一,具有卓越的性能和可靠性,它结合了AMD的先进技术和人工智能算法,为用户提供高效、智能的工作体验,这款工作站能够满足各种计算需求,助力用户轻松应对复杂的AI任务。amd strix halo处理器可以说是一款划时代的产品,尤其是旗舰型号锐龙 ai max+ 395,拥有史上最强集显,可以轻松媲美桌面级rtx 4060独立显卡。
但是说它划时代,远不只是因为强悍的图形性能,更是因为它“生逢其时”,恰...
NVIDIA即将发布首款桌面PC,定价最高达6.5万,这款PC搭载顶级硬件配置,注重高性能计算和图形处理能力,专为游戏玩家和创意工作者设计,其发布标志着NVIDIA在桌面计算领域的进一步拓展,预计将引起市场广泛关注,摘要字数控制在100-200字以内。9月12日最新消息,nvidia年初推出的“project digits”项目终于有了新进展。该项目被官方定义为桌面级ai超级计算机,也被称作迷你ai工作站,是nvidia首款自主设计的桌面pc产品。
该设备最初命名为“D...
阿里通义发布下一代基础模型架构Qwen3-Next,该架构针对人工智能领域的需求进行了全面升级和优化,Qwen3-Next模型具备更高的性能和可扩展性,能够处理更加复杂的数据和任务,该架构的发布将加速人工智能技术的普及和应用,为各行业提供更高效、智能的解决方案,推动数字化转型进程。阿里通义qwen团队近日推出了全新一代基础模型架构qwen3-next,并正式开源了基于此架构的qwen3-next-80b-a3b系列模型。
据悉,该架构在前代Qwen3的MoE结构基础...