蚂蚁金服近日宣布推出业内首个高性能扩散语言模型推理框架dInfer,该框架旨在加速自然语言处理任务中的推理速度和提高模型性能,dInfer框架具备高效的计算和推理能力,可支持多种语言模型,为语言模型的应用提供更广泛的可能性,蚂蚁金服一直致力于在金融领域推动技术创新,此次推出的dInfer框架将为行业内的自然语言处理领域带来革命性的变革。蚂蚁集团近日正式开源了业界首个高性能扩散语言模型推理框架dinfer。
在多项基准测试中,dInfer展现出卓越的性能表现:其推理速度相...
Radical Numerics公司发布了开源的30B参数RND1技术,该技术是一种创新的数值计算方法,旨在提供更高的计算效率和准确性,通过开源,该公司鼓励开发者使用该技术,共同推动数值计算领域的发展,这一举措有望促进科技创新和行业发展。ai 研究组织 radical numerics 推出了 rnd1-base,这是目前规模最大的开源扩散语言模型,总参数量高达30b,其中每次推理仅激活3b参数,依托稀疏专家混合(moe)架构实现高效计算。该模型不仅在多项基准测试中表现优异,...
通义千问Qwen3-VL推出新型稠密模型,包括4B和8B版本,这一更新可能涉及更高效的数据处理能力和更强大的性能表现,用户可期待在人工智能语言模型方面获得更出色的体验,具体性能需进一步了解和测试。阿里通义 qwen 团队近日正式推出了 qwen3-vl 系列的新成员 —— 4b 与 8b 参数规模的视觉语言模型。该系列于上月首次发布,是目前 qwen 系列中性能最强的多模态模型。
此次更新新增了 4B 和 8B 两种尺寸,每种均提供 Instruct 与 Think...
通义千问发布新功能Qwen Chat Memory,该功能旨在提供更智能的记忆存储和检索体验,通过该功能,用户可以轻松保存和回顾对话内容,以便更好地参与对话和交流,这一创新功能将为用户带来更加便捷和高效的沟通方式,提升日常交流体验,通义千问推出新功能Qwen Chat Memory,实现智能记忆存储与检索,让用户轻松参与对话和交流,提升沟通效率和体验。
阿里旗下通义千问(Qwen)正式上线全新 Qwen Chat Memory 功能,用户现已可通过 chat.qwen....
百度正式发布了一项创新的多模态文档解析模型方案,名为PaddleOCR-VL,该方案结合了深度学习技术和先进的算法,旨在实现对文档图像的高效解析,通过集成光学字符识别(OCR)和视觉语言模型(VL),PaddleOCR-VL能够更准确地识别和理解文档内容,这一技术的推出将极大地促进文档数字化和自动化处理的发展,有望为企业和个人提供更便捷、高效的文档解析服务。百度正式发布并开源自研多模态文档解析模型paddleocr-vl。在全球权威文档解析评测榜单omnibenchdoc v...
Airbnb首席执行官表示公司大量依赖阿里通义千问,认为其在某些方面比OpenAI更好更便宜,硅谷众多公司也在使用,这一表态反映了阿里通义千问在技术和经济层面具有竞争优势,成为企业选择的热门AI工具。爱彼迎airbnb首席执行官布莱恩·切斯基在近期的一次媒体访谈中透露,公司目前正“大规模采用阿里巴巴旗下的通义千问模型”,并直言该模型“相较openai的方案更高效且成本更低”。
他还补充道:“我们确实会接入OpenAI的最新模型,但在实际生产环境中并不会广泛部署,毕竟市场...
Qwen3-VL家族推出新模型,包括2B和32B版本,这些新模型增强了性能并提供了更广泛的功能,作为家族的新成员,这些模型将为用户带来卓越的性能和可靠性,以满足不同需求,这一更新将为用户带来更多选择和灵活性,以满足各种应用场景的需求。阿里通义 qwen 团队最新宣布,qwen3-vl 系列迎来重磅升级,新增 2b 与 32b 两款密集型(dense)模型,实现从轻量级到高性能级的全面布局,全方位覆盖各类视觉语言理解应用场景。
此次发布的两个版本各具特色,满足多样化需求:...
Airbnb首席执行官表示公司大量依赖阿里通义千问,认为其在性能和价格方面优于OpenAI,并且已经在硅谷得到广泛应用,CEO强调通义千问在帮助公司提升服务质量和效率方面发挥了重要作用。10月22日,爱彼迎airbnb首席执行官布莱恩·切斯基在接受媒体采访时透露,公司目前“正在大规模采用阿里巴巴的通义千问模型”,并明确指出其“比openai的方案更优且成本更低”。他还补充道:“我们确实会使用openai的最新模型,但在实际生产环境中并不会广泛部署,因为市场上已有更快、更具性价...
阿里巴巴推出了一项新功能——阿里夸克对话助手,该助手采用了最新的闭源模型Qwen,这一功能旨在为用户提供更加智能、高效的交互体验,能够自动理解用户的意图和需求,并作出准确的回应,阿里夸克对话助手的上线,标志着阿里巴巴在人工智能领域取得了新的进展,将为用户带来更加便捷、智能的服务体验。阿里巴巴“c计划”的首款成果近日正式亮相,即夸克app推出的全新对话助手功能。
据《科创板日报》消息,该对话助手基于Qwen(通义千问)最新闭源大模型打造。用户可通过点击夸克App首页的助手...
本研究提出了一种基于信息论的大模型强化学习微调框架,该框架旨在通过信息论的理论指导,优化强化学习模型的性能,通过微调框架,软件能够在大规模数据上进行训练,并利用信息论原理对模型进行精细化调整,这一创新方法有望提高强化学习模型的适应性和泛化能力,为机器学习和人工智能领域的发展提供新的思路和方法。中国科学院软件研究所天基综合信息系统全国重点实验室的研究团队围绕大语言模型(llms)在复杂推理任务中的性能优化问题,提出了一种创新的强化微调框架——learning to think...