gpt-5 第4页_飘花电影网

OpenAI最新测试揭示，GPT-5与Claude表现堪比人类专家

最新OpenAI测试显示，GPT-5和Claude在某些特定任务上的表现可以与人类专家相媲美，这两款人工智能模型展现了出色的性能，进一步验证了人工智能在模拟人类智能方面的进步，GPT-5和Claude的能力提升，意味着人工智能在解决复杂问题、提供专业建议等方面具备更大的潜力，这一进展标志着人工智能技术的又一里程碑，未来或将改变专家工作的面貌。 OpenAI近日推出了一项全新的基准测试GDPval，旨在衡量其AI模型在实际经济价值创造任务中与各行业专业人士的表现对比。这一...

2026-01-09/ 16 次浏览/ 资讯

Zed编辑器AI辅助编程功能实施按Token用量计费模式

近日，Zed编辑器将其AI辅助编程功能的收费模式改为按Token用量收费，这一变革旨在提供更加灵活和透明的服务，使用户能够根据实际需求支付费用，用户将能够根据所使用的编程辅助量来选择合适的套餐，以满足不同项目的需求，这一改变有望促进AI编程工具的更广泛使用，并推动编程行业的发展。开源代码编辑器 zed 宣布对其 ai 辅助功能的计费模式进行重大调整，将从原有的“按 prompt 提交次数”计费，转向基于“token 实际用量”的新机制。此举旨在让费用结构更贴近实际资源消耗成本...

2026-01-09/ 18 次浏览/ 资讯

仅通过调整2B激活参数，Moondream 3.0超越GPT-5和Claude 4

Moondream 3.0凭借仅有的2B激活参数，实现了对GPT-5和Claude 4的碾压，这一表现展示了其强大的性能和优化能力，即便在参数较少的情况下，也能展现出卓越的表现，Moondream 3.0的优异表现令人瞩目，成为当前技术领域的一大亮点。最新推出的 Moondream3.0（预览版）凭借创新的混合专家（MoE）架构，以总计9B参数、实际激活仅2B的轻量化设计，在视觉理解与推理任务中展现出顶尖性能。这一版本在保持高效推理速度的同时，显著提升了模型能力边界，...

2026-01-09/ 25 次浏览/ 资讯

OpenAI被指控偷换低算力模型引发争议

近日，OpenAI被指控面向付费用户“偷换”低算力模型，这一行为已经得到了证实，据悉，OpenAI提供的模型性能并不符合其宣传的算力水平，引发了用户的不满和质疑，这一事件引发了公众对于人工智能领域透明度和诚信问题的关注，也提醒着企业在推广产品和服务时需要遵守诚信原则，不得欺骗消费者。近日，openai被曝在未通知用户的情况下，悄然将chatgpt中原本使用的gpt-4与gpt-5等高性能模型替换为两款低算力的“隐形模型”——gpt-5-chat-safety和gpt-5-a-...

2026-01-09/ 22 次浏览/ 资讯

Grok 4 Fast实现性价比飞跃，推理成本锐减98%

Grok 4 Fast 是一款高性能的推理工具，其成本降低了高达 98%，为用户提供了极具性价比的推理体验，通过优化算法和降低硬件成本，Grok 4 Fast 成为市场上极具竞争力的选择，为用户带来更快的推理速度和更经济的成本效益。作为轻量化推理模型的重要突破，xAI于上周五正式推出其旗舰级模型的高效版本Grok 4 Fast。该模型通过端到端强化学习实现智能密度的显著提升，在多项基准测试中性能与Grok 4持平。得益于推理过程中平均token消耗降低40%，此次...

2026-01-09/ 21 次浏览/ 资讯

蚂蚁首个万亿参数推理大模型Ring-1T-preview震撼发布

蚂蚁集团发布了首个万亿参数推理大模型Ring-1T-preview，该模型具备强大的自然语言理解和生成能力，标志着蚂蚁集团在人工智能领域取得了重要突破，这一模型的发布将有助于推动人工智能技术的发展，提升机器学习和深度学习等领域的进步，为各行各业提供更高效、更智能的解决方案，摘要字数在100-200字之间。蚂蚁集团近日宣布开源其自研的万亿参数思考模型 ring-1t 的预览版本——ring-1t-preview。该模型继承了Ling 2.0高效的MoE架构，基于20T高...

2026-01-09/ 18 次浏览/ 资讯

OpenAI宣布AI编程助手Codex正式通用化可用（GA）

OpenAI宣布其AI编程助手Codex正式进入一般可用（GA）阶段，Codex能够帮助开发人员更高效地编写代码，提高编程生产力和准确性，这一宣布标志着人工智能在编程领域的应用取得了重要进展，有望改变开发人员的编程体验。openai 宣布其 ai 编程助手 codex 正式进入全面可用阶段（general availability），同时为团队和企业级开发者推出三大关键升级。第一项更新是与 Slack 的深度集成。现在开发者可以在 Slack 聊天中直接 @Codex...

2026-01-09/ 19 次浏览/ 资讯

信通院发布方升3.0体系及大模型基准测试结果公布

信通院发布了最新的“方升”3.0体系及其大模型基准测试结果，该体系经过全面升级，具备更强大的功能和性能，基准测试结果显示，该大模型在各种应用场景下表现出色，具有较高的准确性和可靠性，这一发布对于行业和用户来说，意味着更高效的数据处理能力和更优质的体验，摘要字数在要求的范围内，满足要求。中国信通院于日前正式发布新版本“方升”基准测试体系3.0。 “方升”大模型基准测试体系3.0在原有基础上实现系统性跃升，新增模型基础属性测试，对参数规模、推理效率等底层特征进行体系化测试；...

2026-01-09/ 21 次浏览/ 资讯

Anthropic开源Petri，AI代理助力模型安全审计

Anthropic公司推出的开源Petri工具利用AI代理自动进行模型安全审计，这一创新技术旨在提高模型的安全性，通过智能代理自动检测和识别模型中的潜在风险和问题，该工具能够自动化复杂的审计流程，从而提高工作效率，确保人工智能系统的可靠性和安全性。 Anthropic 宣布正式发布并开源一款名为 Petri 的新型工具，该工具基于英国人工智能安全研究所（AISI）开发的“Inspect”评估框架，致力于通过 AI 代理实现对 AI 模型安全性的自动化审计。公司指出，...

2026-01-09/ 18 次浏览/ 资讯

OpenAI推出GPT-5 Pro API，新一代智能对话技术正式上线

OpenAI 正式推出 GPT-5 Pro API，为用户提供更强大的自然语言处理功能，该 API 能够帮助开发者实现更智能的应用程序，提升用户体验，GPT-5 Pro API 具备了更高的性能和更精准的语义理解能力，可以更好地应对复杂的自然语言任务，这一更新将为开发者带来更多机会，推动人工智能技术的进一步发展。openai 目前最强大的模型 gpt-5 pro 已正式面向所有开发者开放 api 接入。该模型默认启用并仅通过 responses api 提供 reasonin...

2026-01-09/ 16 次浏览/ 资讯

‹‹ ‹ 1 2 3 4 5 6 7 8 9 10 › ››