最新OpenAI测试显示,GPT-5和Claude在某些特定任务上的表现可以与人类专家相媲美,这两款人工智能模型展现了出色的性能,进一步验证了人工智能在模拟人类智能方面的进步,GPT-5和Claude的能力提升,意味着人工智能在解决复杂问题、提供专业建议等方面具备更大的潜力,这一进展标志着人工智能技术的又一里程碑,未来或将改变专家工作的面貌。
OpenAI近日推出了一项全新的基准测试GDPval,旨在衡量其AI模型在实际经济价值创造任务中与各行业专业人士的表现对比。这一...
近日,Zed编辑器将其AI辅助编程功能的收费模式改为按Token用量收费,这一变革旨在提供更加灵活和透明的服务,使用户能够根据实际需求支付费用,用户将能够根据所使用的编程辅助量来选择合适的套餐,以满足不同项目的需求,这一改变有望促进AI编程工具的更广泛使用,并推动编程行业的发展。开源代码编辑器 zed 宣布对其 ai 辅助功能的计费模式进行重大调整,将从原有的“按 prompt 提交次数”计费,转向基于“token 实际用量”的新机制。此举旨在让费用结构更贴近实际资源消耗成本...
Moondream 3.0凭借仅有的2B激活参数,实现了对GPT-5和Claude 4的碾压,这一表现展示了其强大的性能和优化能力,即便在参数较少的情况下,也能展现出卓越的表现,Moondream 3.0的优异表现令人瞩目,成为当前技术领域的一大亮点。
最新推出的 Moondream3.0(预览版)凭借创新的混合专家(MoE)架构,以总计9B参数、实际激活仅2B的轻量化设计,在视觉理解与推理任务中展现出顶尖性能。这一版本在保持高效推理速度的同时,显著提升了模型能力边界,...
近日,OpenAI被指控面向付费用户“偷换”低算力模型,这一行为已经得到了证实,据悉,OpenAI提供的模型性能并不符合其宣传的算力水平,引发了用户的不满和质疑,这一事件引发了公众对于人工智能领域透明度和诚信问题的关注,也提醒着企业在推广产品和服务时需要遵守诚信原则,不得欺骗消费者。近日,openai被曝在未通知用户的情况下,悄然将chatgpt中原本使用的gpt-4与gpt-5等高性能模型替换为两款低算力的“隐形模型”——gpt-5-chat-safety和gpt-5-a-...
Grok 4 Fast 是一款高性能的推理工具,其成本降低了高达 98%,为用户提供了极具性价比的推理体验,通过优化算法和降低硬件成本,Grok 4 Fast 成为市场上极具竞争力的选择,为用户带来更快的推理速度和更经济的成本效益。
作为轻量化推理模型的重要突破,xAI于上周五正式推出其旗舰级模型的高效版本Grok 4 Fast。
该模型通过端到端强化学习实现智能密度的显著提升,在多项基准测试中性能与Grok 4持平。得益于推理过程中平均token消耗降低40%,此次...
蚂蚁集团发布了首个万亿参数推理大模型Ring-1T-preview,该模型具备强大的自然语言理解和生成能力,标志着蚂蚁集团在人工智能领域取得了重要突破,这一模型的发布将有助于推动人工智能技术的发展,提升机器学习和深度学习等领域的进步,为各行各业提供更高效、更智能的解决方案,摘要字数在100-200字之间。蚂蚁集团近日宣布开源其自研的万亿参数思考模型 ring-1t 的预览版本——ring-1t-preview。
该模型继承了Ling 2.0高效的MoE架构,基于20T高...
OpenAI宣布其AI编程助手Codex正式进入一般可用(GA)阶段,Codex能够帮助开发人员更高效地编写代码,提高编程生产力和准确性,这一宣布标志着人工智能在编程领域的应用取得了重要进展,有望改变开发人员的编程体验。openai 宣布其 ai 编程助手 codex 正式进入全面可用阶段(general availability),同时为团队和企业级开发者推出三大关键升级。
第一项更新是与 Slack 的深度集成。现在开发者可以在 Slack 聊天中直接 @Codex...
信通院发布了最新的“方升”3.0体系及其大模型基准测试结果,该体系经过全面升级,具备更强大的功能和性能,基准测试结果显示,该大模型在各种应用场景下表现出色,具有较高的准确性和可靠性,这一发布对于行业和用户来说,意味着更高效的数据处理能力和更优质的体验,摘要字数在要求的范围内,满足要求。中国信通院于日前正式发布新版本“方升”基准测试体系3.0。
“方升”大模型基准测试体系3.0在原有基础上实现系统性跃升,新增模型基础属性测试,对参数规模、推理效率等底层特征进行体系化测试;...
Anthropic公司推出的开源Petri工具利用AI代理自动进行模型安全审计,这一创新技术旨在提高模型的安全性,通过智能代理自动检测和识别模型中的潜在风险和问题,该工具能够自动化复杂的审计流程,从而提高工作效率,确保人工智能系统的可靠性和安全性。
Anthropic 宣布正式发布并开源一款名为 Petri 的新型工具,该工具基于英国人工智能安全研究所(AISI)开发的“Inspect”评估框架,致力于通过 AI 代理实现对 AI 模型安全性的自动化审计。
公司指出,...
OpenAI 正式推出 GPT-5 Pro API,为用户提供更强大的自然语言处理功能,该 API 能够帮助开发者实现更智能的应用程序,提升用户体验,GPT-5 Pro API 具备了更高的性能和更精准的语义理解能力,可以更好地应对复杂的自然语言任务,这一更新将为开发者带来更多机会,推动人工智能技术的进一步发展。openai 目前最强大的模型 gpt-5 pro 已正式面向所有开发者开放 api 接入。该模型默认启用并仅通过 responses api 提供 reasonin...