财经观察:提升人机交互效率 多模态大模型易用性进一步推进
人民网北京5月14日电 (焦磊、财经实习生张泊洋)陪人聊天、观察帮助分析工作中的提升态拉萨市某某橡塑制品厂问题并给出解决方案,甚至和人建立起情感羁绊……在科幻电影《Her》中,人机聊天机器人“Samantha”用充满智慧和幽默的交互进回答展示出高度的智能性和适应性。当下,效率性进这些来自过去的多模科幻想象正加速照入现实中。
北京时间5月14日凌晨,模型美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。易用据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,步推GPT-4o可以接收文本、财经拉萨市某某橡塑制品厂音频和图像的观察任意组合作为输入,并实时生成文本、提升态音频和图像的人机任意组合进行输出,其中“o”代表“omni全能”。交互进
一直以来,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。
模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。业内分析认为,相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现得更加智能,能够执行更大范围的任务。
作为面向未来人机交互范式的全新大模型,GPT-4o具有文本、语音、图像三种模态的理解力,并可以综合对话者语气和所处环境空间等因素进行回答,展现出了高度智能性。
发布会上,GPT-4o展示了多项多模态交互能力。在进行实时语音交流时,其响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。
米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”
此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,此次GPT-4o的发布,将促使多模态综合交互成为生成式AI的重点发展方向,进而提升人机交互效率,逐渐向AGI方向迈进。
国盛证券研报分析,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化。
多模态大模型包含的图文、音频、视频内容数据量巨大,进而引发人们对算力供应的关注。业内分析认为,未来AI的发展对算力的需求将会是几何式增长,算力限制可能是影响生成式AI应用开放使用的重要因素,而算力的可获取性以及成本将是挑战之一。此外,多模态大模型还将带来更严峻的安全挑战。
米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。
据介绍,用户可有数量限制地免费使用GPT-4o模型来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。
OpenAI CEO山姆·奥特曼在发布会后表示,“我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,我们所有人都会从中受益。”此外,他还表示OpenAI其他业务收入将帮助公司向数十亿人提供免费的人工智能服务。
(责任编辑:热点)
-
文 | TMT星球,作者 | 黄燕华即将过去的2025年,汽车行业加速行驶在转型的快车道上。这一年,新能源汽车渗透率持续上升、智能技术加速落地;这一年,是传统燃油车企承受着来自新能源车企的冲击,努力稳
...[详细]
-
英超第13轮的焦点之战,切尔西主场1-1战平阿森纳,赛后查洛巴晒出冰敷的照片,他在本场比赛被因卡皮耶的肘部撞到了。比赛第40分钟,因卡皮耶肘部击打到小查洛巴面部,裁判出示黄牌,随后镜头给到小查洛巴面部
...[详细]
-
无需标注图像,RL自我进化框架VisPlay突破视觉推理难题
在 Vision-Language Model 领域,提升其复杂推理能力通常依赖于耗费巨大的人工标注数据或启发式奖励。这不仅成本高昂,且难以规模化。最新研究 VisPlay 首次提出了一个自进化强化学
...[详细]
-
北京时间12月1日,NBA常规赛洛杉矶湖人主场133-121击败新奥尔良鹈鹕,成功拿下7连胜,此战艾顿出场27分钟,砍下22分12篮板4盖帽,投篮9中7,罚球8中8,湖人的战绩也提升至15胜4负,继续
...[详细]
-
近日,全红婵在新疆机场候机的照片火爆网络,在刚结束滑雪之行的全妹,身着宽松卫衣与运动长裤的白色休闲装,搭配软糯毛线帽,清爽惬意,在人群中卓然出众,吸睛无数。不巧的是,新疆突然起了大雾,不少航班不得不延
...[详细]
-
来源:科技日报科技日报北京11月30日电 记者张梦然)包括美国加州大学圣克鲁兹分校、约翰斯·霍普金斯大学以及德国、瑞士多家机构联合团队,借助名为类器官的微型人脑组织模型,揭示了大脑天生预置“操作系统”
...[详细]
-
在12月4日的外交部例行记者会上,有媒体提问称,今天是反对单边强制措施国际日,近年来,我们已看到许多国家持续频繁采用单边措施对俄罗斯、中国、伊朗等国实施经济制裁。中方认为此类措施会带来哪些风险?外
...[详细]
-
IT之家 12 月 1 日消息,小米汽车官方今日宣布,「现车选购」即将开启,现车包含全新现车、官方展车、准新车。所有现车都已通过严格质检,部分车型经官方修复,都是没有登记过的车辆。小米汽车官方今日发布
...[详细]
-
北京时间11月30日,英超第13轮的一场比赛,曼联在客场2-1逆转水晶宫,上半场约罗送点,下半场芒特的进球帮助曼联将比分反超为2-1。比赛第32分钟,约罗对马特塔犯规送点,马特塔点球罚进,曼联0-1落
...[详细]
-
由特斯拉技术班底“组团”加盟,Sunday Robotics携家用机器人正式亮相
来源:环球网【环球网科技综合报道】12月1日消息,据businessinsider报道,新兴机器人初创公司Sunday Robotics于11月19日正式结束隐秘运营状态,并发布了其首款家用机器人产品
...[详细]

马杜罗证实近日曾与特朗普通话
米兰冬奥会火种抵达罗马
野外找不着“北”?这些户外应急技巧,关键时刻能救命