谷歌推出集成至Gemini API的文件搜索系统File Search Tool,可帮助用户快速找到所需文件,该系统能够搜索各种格式的文件,包括文本、图片、音频和视频等,并支持在云端和本地进行搜索,通过Gemini API,File Search Tool与其他应用程序和服务无缝集成,提高了用户的工作效率,这一创新工具为用户带来了更便捷的搜索体验。谷歌近日宣布,其gemini api正式推出file search tool(文件搜索系统)。该工具是一项完全托管的检索增强生成(...
谷歌即将发布新一代图像生成与编辑模型“Nano Banana 2”,该模型将带来更加精细的图像生成和编辑能力,相较于之前的模型,Nano Banana 2将拥有更高的效率和更强大的性能,能够更快地完成复杂的图像处理任务,同时保持图像的高质量和清晰度,这一技术的推出将有助于推动图像处理和人工智能领域的发展,为用户带来更加便捷和高效的图像编辑体验。
根据 TestingCatalog 的最新消息,Google Gemini 网页端近日出现了一张新的功能预告卡片。
该信息显...
StepFun AI推出了一项创新的开源音频编辑模型——Step-Audio-EditX,该模型为用户带来了全新的音频编辑体验,通过该模型,用户可以轻松实现音频的剪辑、混合、降噪等编辑操作,极大地提高了音频编辑的效率和便捷性,这一创新技术的推出,将推动音频编辑领域的发展,为用户带来更加丰富多彩的音频体验。stepfun ai 近日发布了其开源的音频编辑模型 step-audio-editx,这一创新的3b 参数模型将音频编辑的操作变得像文本编辑一样直接和可控。通过将音频信号的...
GPT-5.1的“马甲”疑似被泄露,引发了业界的高度关注,随着年底AI大战的临近,这一事件可能加剧竞争态势,各方都在积极应对,以应对潜在的风险和挑战,这一泄露事件也引发了关于AI安全和隐私保护的热议,人们开始关注如何更好地保护AI技术的核心秘密,后续发展和影响尚待观察。谷歌的gemini 3还未见踪影,openai的gpt-5.1,似乎已在“路上”了。
近日,在知名的AI模型路由平台OpenRouter上,突然上线了一个全新的、匿名的神秘模型。在经过了部分网友的尝鲜体验...
StepFun AI推出了一项开源音频编辑模型Step-Audio-EditX,该模型旨在提供强大的音频编辑功能,包括音频剪辑、混音、降噪等,该模型采用深度学习技术,能够自动化处理音频数据,提高音频编辑效率和质量,该模型的开源性质使得开发者可以自由地对其进行修改和优化,进一步推动音频编辑技术的发展。
StepFun AI 最近推出了其开源音频编辑模型 Step-Audio-EditX,这款拥有30亿参数的创新模型让音频编辑如同文本编辑般直观且高度可控。它通过将音频信号的...
恶意软件利用先进的AI技术实现自我重写,使得检测和防范变得更加困难,这些自我重写的恶意软件能够不断变异,逃避传统的安全检测措施,随着技术的不断进步,这种新型威胁的检测难度日益加剧,对网络安全构成严重威胁,需要持续加强研究和开发新的安全策略,以应对这种不断进化的恶意软件威胁。
Google 威胁情报小组的安全专家在近期的网络行为分析中,识别出一个名为 PROMPTFLUX 的新型实验性恶意软件家族。该恶意程序的独特之处在于,它能够通过远程调用 Google 的 Gemin...
据最新消息,苹果公司计划最早于明年推出自研的Apple Intelligence模型,该模型将拥有高达一万亿参数,这一创新标志着苹果公司在人工智能领域的深度探索和发展,有望为用户带来更加智能、高效和个性化的体验,这一模型的推出将进一步提升苹果产品的智能化水平,引领行业的技术创新潮流。
据彭博社《Power On》专栏的马克·古尔曼(Mark Gurman)最新消息,苹果正计划在明年推出一款完全自主研发、参数规模约为1万亿的基础AI模型,作为其Apple Intellig...
商汤近日正式推出并开源了 sensenova-si 系列空间智能大模型,据官方披露,在多项权威评测的空间理解与推理任务中,该系列模型不仅显著超越同规模的开源多模态大模型,更在性能上优于 gpt-5 和 gemini 2.5 pro 等国际领先的闭源模型。
SenseNova-SI 定位于专注空间智能的大模型,此次开源涵盖 2B 和 8B 两个参数量版本。最新测评结果显示,该系列在多个空间智能基准测试(VSI、MMSI、MindCube、ViewSpatial)中表现优异...
Google Maps推出全新AI功能,实现个性化旅游路线推荐,只需一句话,即可轻松生成符合用户需求的定制旅游路线,该功能基于智能语音识别技术,结合用户偏好和目的地信息,为用户提供便捷、个性化的出行方案,无论是探索城市景点、寻找美食,还是规划长途旅行,这项新功能将为用户带来前所未有的便捷体验。google maps 推出基于 ai 的全新功能,让开发者乃至普通用户都能通过自然语言快速创建互动式地图,如导览路线、地点故事与即时数据可视化,无需具备编程基础即可轻松上手。这项升级由...
历史手稿破译工作取得重大进展,Gemini 3首次逼近“人类专家”水平,通过先进的破译技术和人工智能算法,Gemini 3成功解读了复杂的手稿内容,展现出近乎人类专家的能力,这一突破不仅有助于历史研究的深入,也为人工智能在文化遗产保护领域的应用开辟了新的前景。
一位历史学者对 Gemini3Pro 展开了一项极为严苛的评估:使用50份总计约一万词的英文历史手稿图像,涵盖多种复杂笔迹风格与不同成像质量条件。测试结果令人震惊——Gemini3在字符错误率(CER)和词语错误...