设为首页 加入收藏
  • 首页
  • 综合
  • 知识
  • 热点
  • 探索
  • 热门资讯
  • 休闲
  • 当前位置:首页 > 热点 > 财经观察:提升人机交互效率 多模态大模型易用性进一步推进

    财经观察:提升人机交互效率 多模态大模型易用性进一步推进

    发布时间:2025-12-16 15:07:40 来源:上海市某某电气维修站 作者:综合

    人民网北京5月14日电 (焦磊、财经实习生张泊洋)陪人聊天、观察帮助分析工作中的提升态河北某某金属制品教育中心问题并给出解决方案,甚至和人建立起情感羁绊……在科幻电影《Her》中,人机聊天机器人“Samantha”用充满智慧和幽默的交互进回答展示出高度的智能性和适应性。当下,效率性进这些来自过去的多模科幻想象正加速照入现实中。

    北京时间5月14日凌晨,模型美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。易用据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,步推GPT-4o可以接收文本、财经河北某某金属制品教育中心音频和图像的观察任意组合作为输入,并实时生成文本、提升态音频和图像的人机任意组合进行输出,其中“o”代表“omni全能”。交互进

    一直以来,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。

    模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。业内分析认为,相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现得更加智能,能够执行更大范围的任务。

    作为面向未来人机交互范式的全新大模型,GPT-4o具有文本、语音、图像三种模态的理解力,并可以综合对话者语气和所处环境空间等因素进行回答,展现出了高度智能性。

    发布会上,GPT-4o展示了多项多模态交互能力。在进行实时语音交流时,其响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。

    米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”

    此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,此次GPT-4o的发布,将促使多模态综合交互成为生成式AI的重点发展方向,进而提升人机交互效率,逐渐向AGI方向迈进。

    国盛证券研报分析,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化。

    多模态大模型包含的图文、音频、视频内容数据量巨大,进而引发人们对算力供应的关注。业内分析认为,未来AI的发展对算力的需求将会是几何式增长,算力限制可能是影响生成式AI应用开放使用的重要因素,而算力的可获取性以及成本将是挑战之一。此外,多模态大模型还将带来更严峻的安全挑战。

    米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。

    据介绍,用户可有数量限制地免费使用GPT-4o模型来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。

    OpenAI CEO山姆·奥特曼在发布会后表示,“我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,我们所有人都会从中受益。”此外,他还表示OpenAI其他业务收入将帮助公司向数十亿人提供免费的人工智能服务。

    • 上一篇:哪种沟通方式更适合与孤独症患者交流?专业人士解答
    • 下一篇:东部战区发布重磅主题海报《大刀·祭》

      相关文章

    • 国防部评“汉光演习”:演来演去都是做戏
    • 身披金色车标 这台大众SUV有什么特别之处
    • 看了《玫瑰的故事》,我找到了养好女儿的偏方
    • 和布朗尼一样菜的人,咋进NBA?
    • 离职员工遭“职场霸凌”?华熙生物:恶意炒作
    • 日本富士山顶附近,已发现4人死亡
    • 东方甄选“配不上”贵州旅游
    • 上海迪士尼被游客吐槽:这个项目太臭了,洗手五遍还有味儿,客服回应
    • 三大数论猜想:简单到初中生都懂,却难倒数学家
    • 当一个东亚小孩不再「听话」,这是Ta可以拥有的8种人生

      • 泰国陆军:目前不存在停火安排
      • 频繁接触静电会加速钙流失?没有科学依据
      • 谷歌TPU芯片崛起,英伟达短期需要慌吗?
      • 清华大学与赛力斯共建电池创新技术联合研究中心
      • 国泰航空A350客机飞抵香港机场后机尾擦地!称正检查维修
      • 一加Ace 6T支持全新明眸护眼:通过了最严苛的护眼小金标认证
      • 觅睿科技冲刺北交所:模组销售模式存疑 外协生产合理性遭追问
      • 心理咨询不是“万能药” 4个常见误解要注意
      • 欧盟理事会批准对乌支付第六笔约23亿欧元援助
      • 午评:深成指、创业板指均涨近1% 消费电子板块爆发

        随便看看

      • 奥司他韦、玛巴洛沙韦、玛硒洛沙韦...“流感神药”你选对了吗?
      • 扎哈罗娃:俄罗斯保留对日本采取强硬回应的权利
      • 泽连斯基称乌美代表团将于本周晚些时候举行会谈
      • 我国快递年业务量首次突破1800亿件
      • 刚需专业!材料科学与工程,就业科研双吃香
      • “流感神药”耐药了?传言不实
      • 国台办回应大陆配偶在岛内参政问题
      • 这些爆火的防静电“妙招”靠谱吗
      • 2025亚洲通用航空展闭幕 “未来装备”惊艳亮相
      • 乌代表团赴美谈判 俄乌互相袭击
      hgtkbf.com TTS新传名词解释:非虚构写作|新闻学重要名词 巴菲特再捐53亿美元股票,称子女将管理99%遗产 黎真主党称对以军多个基地及军营发动袭击 A股低开低走:沪指跌0.9%,银行股逆势大涨 山东辟谣因吃牛羊肉一两百人被隔离 菲律宾军方与叛军组织发生交火 10人死亡 长江2024年第1号洪水形成 今年下半年内地居民前往港澳地区定居审批分数线公布 太可惜了,江苏一考生物理、数学满分,外语仅86分,或与清北无缘 北京购房新政落地,一线城市有望提振
      • Copyright © 2025 Powered by 财经观察:提升人机交互效率 多模态大模型易用性进一步推进,上海市某某电气维修站   sitemap