当前位置:首页 > 探索 > 财经观察:提升人机交互效率 多模态大模型易用性进一步推进

财经观察:提升人机交互效率 多模态大模型易用性进一步推进

2026-01-06 03:59:36 [探索] 来源:三明市某某国际贸易运营部

人民网北京5月14日电 (焦磊、财经实习生张泊洋)陪人聊天、观察帮助分析工作中的提升态拉萨市某某橡塑制品厂问题并给出解决方案,甚至和人建立起情感羁绊……在科幻电影《Her》中,人机聊天机器人“Samantha”用充满智慧和幽默的交互进回答展示出高度的智能性和适应性。当下,效率性进这些来自过去的多模科幻想象正加速照入现实中。

北京时间5月14日凌晨,模型美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。易用据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,步推GPT-4o可以接收文本、财经拉萨市某某橡塑制品厂音频和图像的观察任意组合作为输入,并实时生成文本、提升态音频和图像的人机任意组合进行输出,其中“o”代表“omni全能”。交互进

一直以来,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。

模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。业内分析认为,相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现得更加智能,能够执行更大范围的任务。

作为面向未来人机交互范式的全新大模型,GPT-4o具有文本、语音、图像三种模态的理解力,并可以综合对话者语气和所处环境空间等因素进行回答,展现出了高度智能性。

发布会上,GPT-4o展示了多项多模态交互能力。在进行实时语音交流时,其响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。

米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”

此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,此次GPT-4o的发布,将促使多模态综合交互成为生成式AI的重点发展方向,进而提升人机交互效率,逐渐向AGI方向迈进。

国盛证券研报分析,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化。

多模态大模型包含的图文、音频、视频内容数据量巨大,进而引发人们对算力供应的关注。业内分析认为,未来AI的发展对算力的需求将会是几何式增长,算力限制可能是影响生成式AI应用开放使用的重要因素,而算力的可获取性以及成本将是挑战之一。此外,多模态大模型还将带来更严峻的安全挑战。

米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。

据介绍,用户可有数量限制地免费使用GPT-4o模型来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。

OpenAI CEO山姆·奥特曼在发布会后表示,“我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,我们所有人都会从中受益。”此外,他还表示OpenAI其他业务收入将帮助公司向数十亿人提供免费的人工智能服务。

(责任编辑:知识)

推荐文章
  • 网上爆火的“以油养肤”,真有用还是“智商税”?

    网上爆火的“以油养肤”,真有用还是“智商税”? 网上爆火的“以油养肤”,真有用还是“智商税”?2025-12-31 00:14:07 来源:科普中国微信公众号 ...[详细]
  • 机会来了?巴萨中场巴勃罗

    机会来了?巴萨中场巴勃罗 巴塞罗那中场巴勃罗-托雷在社交媒体上晒出了加练的照片,他正在锻炼自己的力量。巴塞罗那目前中场伤病满营,奥尔莫、费尔明、弗朗基-德容、加维、贝尔纳尔都因伤无法出战。对于巴勃罗-托雷来说,他有望获得证明自 ...[详细]
  • 赫本的白裤子,办公室穿最出彩

    赫本的白裤子,办公室穿最出彩 #记录我的9月生活#赫本对于白色的喜欢可以说是贯穿始终的,经常看她照片的人,都能摸索出这个穿衣规律,而且今天所要讲述的白色裤装,也是赫本时常宠幸的一员。S姐时常想,我们喜欢白色到底喜欢的是什么?毕竟它 ...[详细]
  • 执教巴萨前六场西甲全胜,弗里克成队史第五人

    执教巴萨前六场西甲全胜,弗里克成队史第五人   来源:懂球帝  西甲第6轮,巴萨客场5-1大胜比利亚雷亚尔,据统计,弗里克成为第五位执教巴塞罗那前6场西甲全胜的主帅。  今年夏天,弗里克接替哈维成为巴萨新任主帅,在弗里克本赛季带队参加的前六场西 ...[详细]
  • 实测豆包手机助手:AI 操作手机的时代来了?

    实测豆包手机助手:AI 操作手机的时代来了? 字节正和多家手机厂商谈合作。文丨贺乾明“对比一下京东、美团外卖、淘宝上的肯德基香辣鸡腿堡哪个更便宜,选价格最低的下单,送到三里屯 SOHO A 座的地址,下单的时候备注 ‘放前台’,下单后把订单截图微 ...[详细]
  • 邱淑贞23岁女儿担心自己嫁不出去,只信一见钟情,追求者全被拒绝

    邱淑贞23岁女儿担心自己嫁不出去,只信一见钟情,追求者全被拒绝 邱淑贞大女儿沈月越大越漂亮,要是参选今年的港姐的话,大家觉得能进三甲吗?沈月出生于2001年,上个月过完23岁生日,像她这样漂亮温柔的小女生,身边有数不清的追求者,但沈月的眼光很高,受访时公开自己的择 ...[详细]
  • 央视秋晚这一夜,唐嫣莞尔一笑融化月亮,刘涛轻挥衣袖美得像月光

    央视秋晚这一夜,唐嫣莞尔一笑融化月亮,刘涛轻挥衣袖美得像月光 今夜月明人尽望。又到中秋。每年中秋节,除了朋友圈被各种各样的月亮刷屏,最大的乐趣,就是看各个电视台中秋晚会上,明星们争奇斗艳。今年中秋夜,湖南卫视请来周深唱了《嗨》,苏醒唱了《做你的星光》,魏大勋带来 ...[详细]
  • 居家自助理发指南:有门槛,但小帅

    居家自助理发指南:有门槛,但小帅 有哪些开销,是在消费降级之后才被筛选出来的?我先提一个:剪头发。自从常去的理发店托尼老师话少且不推销办卡)团购价都突破了100大关之后,我就再没剪过头发,一个硬朗的短发女小伙活脱脱穷到长发及腰。但是对 ...[详细]
  • 工欲善其事,必先利其器:课堂纪律是高效课堂的核心保障

    工欲善其事,必先利其器:课堂纪律是高效课堂的核心保障 每学期的质量分析会上,“学生基础差”“班级纪律乱”“家长不配合”总是教师们常提及的困扰。这些问题反复出现却难以根治,让不少教师陷入“想管却无从下手”的困境。不可否认,农村学校面临着“五天培养抵不过两天 ...[详细]
  • 西媒:巴萨在和乌奈

    西媒:巴萨在和乌奈 据西班牙媒体Jijantes报道,巴塞罗那在和球队中场乌奈-埃尔南德斯谈判续约。报道表示,巴塞罗那和乌奈-埃尔南德斯的经纪人已经恢复联系,从而商谈续约事宜。乌奈-埃尔南德斯和巴塞罗那的现有合同将于20 ...[详细]