飘花电影网

展开菜单

蚂蚁发布并开源Ring-1T思考模型,综合能力逼近GPT-5里程碑

蚂蚁发布并开源Ring-1T思考模型,综合能力逼近GPT-5里程碑
蚂蚁发布并开源了万亿参数思考模型Ring-1T,该模型综合能力逼近GPT-5,这一模型具备强大的自然语言处理能力,能够完成更加复杂的任务,如智能问答、文本生成等,蚂蚁方面表示,该模型的发布旨在推动人工智能领域的发展,促进技术共享和创新,该模型的开源性质,将有助于其他研究者和开发者进行进一步的研究和改进,共同推动人工智能技术的进步。10月14日凌晨,蚂蚁集团正式发布了具备万亿参数的思考型模型ring-1t,并全面开放其模型权重与训练方法的源代码。该模型在9月30日发布的预览版本...

谷歌NotebookLM视频概览功能升级,引入Nano Banana全新体验

谷歌NotebookLM视频概览功能升级,引入Nano Banana全新体验
谷歌NotebookLM视频概览功能迎来升级,新增“Nano Banana”功能,这一升级将提供更流畅的视频播放体验,优化视频加载速度,并增强用户与视频内容的互动体验,通过“Nano Banana”,用户能够更轻松地浏览和观看视频内容,享受更快速加载和更顺畅播放的优越性能,这一升级将为用户带来更加便捷的视频体验。 谷歌近日宣布,其NotebookLM的视频概览功能迎来关键升级,依托Gemini最新研发的图像生成技术“Nano Banana”,现已支持根据文档内容自动生成...

通义千问 Qwen3-VL发布4B与8B稠密模型更新

通义千问 Qwen3-VL发布4B与8B稠密模型更新
通义千问Qwen3-VL推出新型稠密模型,包括4B和8B版本,这一更新可能涉及更高效的数据处理能力和更强大的性能表现,用户可期待在人工智能语言模型方面获得更出色的体验,具体性能需进一步了解和测试。阿里通义 qwen 团队近日正式推出了 qwen3-vl 系列的新成员 —— 4b 与 8b 参数规模的视觉语言模型。该系列于上月首次发布,是目前 qwen 系列中性能最强的多模态模型。 此次更新新增了 4B 和 8B 两种尺寸,每种均提供 Instruct 与 Think...

Stateof.ai发布2025人工智能现状报告,揭示AI发展趋势与挑战

Stateof.ai发布2025人工智能现状报告,揭示AI发展趋势与挑战
stateof.ai正式发布了《2025年度人工智能现状报告》(State of AI Report 2025),这是该系列的最新一版年度洞察,全面追踪全球AI技术、应用与政策的发展脉络。今年的关键亮点如下: --------------------- ? OpenAI仍领跑前沿,但领先优势缩小 OpenAI在最先进模型的研发上继续保持微弱领先,然而随着Meta逐步退出第一梯队的竞争,全球格局正变得更加开放。中国模型如DeepSeek、Qwen和Kimi在推理...

谷歌即将发布VEO 3.1版本,更新涉及Gemini和API功能提升

谷歌即将发布VEO 3.1版本,更新涉及Gemini和API功能提升
谷歌即将发布VEO 3.1版本,该版本将在Gemini和API上推出,此次更新可能会带来更多功能和改进,进一步提升用户体验和性能表现,具体更新内容和细节尚未公布,但预计将引起业界和用户的广泛关注。谷歌近期有消息称,veo3.1的公共发布即将到来。随着gemini应用程序中出现了相关免责声明,谷歌正准备向广大用户展示veo3.1的各项功能,这些功能或将通过用户熟悉的gemini界面呈现。 社区知名人士Logan Kilpatrick在社交媒体平台X上发布的动态被广泛解...

Anthropic发布Claude Haiku 4.5,速度飙升,价格更亲民

Anthropic发布Claude Haiku 4.5,速度飙升,价格更亲民
Anthropic公司发布了Claude Haiku 4.5版本,该版本速度更快,价格更便宜,这一更新为用户带来更加流畅的使用体验,同时降低了使用门槛,让更多人能够享受到高品质的人工智能服务。anthropic 推出了全新模型 claude haiku 4.5。官方称,该模型在成本极低的前提下,实现了接近顶级模型的强劲性能,旨在成为实时性要求高、低延迟任务(如对话助手和客户服务)的首选方案。 Claude 系列目前包含三种不同规模的模型:Claude Opus(大杯)、...

谷歌Veo 3.1全新发布,增强音频功能并提升精细化编辑能力

谷歌Veo 3.1全新发布,增强音频功能并提升精细化编辑能力
谷歌发布新版Veo 3.1,新增音频功能和精细化编辑能力,这一更新为用户提供了更全面的视频编辑体验,包括更精准的音频调整和优化功能,以及更细致的编辑选项,此次更新旨在满足用户对视频编辑的多样化需求,提升用户创作效率和视频质量。谷歌近日发布了其视频生成模型veo3.1,作为今年5月推出的veo3的进阶版本。此次升级在音频生成、编辑控制精度以及图像转视频的表现质量上均有显著优化,能够产出更加逼真的视频内容,并更精准地响应用户的提示指令。 在功能方面,Veo3.1支持向现有画...

百度发布多模态文档解析模型方案 PaddleOCR-VL方案亮相

百度发布多模态文档解析模型方案 PaddleOCR-VL方案亮相
百度正式发布了一项创新的多模态文档解析模型方案,名为PaddleOCR-VL,该方案结合了深度学习技术和先进的算法,旨在实现对文档图像的高效解析,通过集成光学字符识别(OCR)和视觉语言模型(VL),PaddleOCR-VL能够更准确地识别和理解文档内容,这一技术的推出将极大地促进文档数字化和自动化处理的发展,有望为企业和个人提供更便捷、高效的文档解析服务。百度正式发布并开源自研多模态文档解析模型paddleocr-vl。在全球权威文档解析评测榜单omnibenchdoc v...

AI模型易受操控,仅需少量文件即可影响ChatGPT的回应

AI模型易受操控,仅需少量文件即可影响ChatGPT的回应
AI模型可以被操控,只需使用特定文件就能影响ChatGPT的回应,通过输入特定指令和数据,可以“洗脑”AI模型,使其产生特定的回应,这种操作只需大约250份文件就能实现,这一发现揭示了人工智能的脆弱性,也提醒人们在使用AI时需要注意安全问题,在使用AI模型时,需要谨慎对待其回应,并对其进行必要的验证和审查。10月19日,anthropic、英国ai安全研究所与艾伦·图灵研究所联合发布一项最新研究成果:当前主流大语言模型(包括claude、chatgpt和gemini等)对数据...

谷歌即将发布旗舰AI模型Gemini 3.0,新一代AI技术预览

谷歌即将发布旗舰AI模型Gemini 3.0,新一代AI技术预览
谷歌计划于今年十二月发布其下一代旗舰人工智能模型Gemini 3.0,这一更新将带来一系列新的特性和改进,有望进一步提升人工智能的性能和应用范围,具体细节尚未公布,但预计Gemini 3.0将带来重要的技术突破和创新。 根据最新消息,谷歌正筹备其旗舰AI模型Gemini的升级版本——Gemini 3.0,并计划于今年12月正式推出。此举延续了该公司近两年来在年末发布新一代Gemini系列产品的惯例。尽管近期有传言称该模型可能提前在“下周”亮相,但知情人士透露,这并非谷歌...