找回密码 立即注册
查看: 215|回复: 0

[休闲灌水] OpenAI 免费推出世界上最强大的模型 GPT-4o

[复制链接]

11

主题

31

回帖

262

积分

特邀体验者

积分
262
发表于 2024-5-14 10:14:45 | 显示全部楼层 |阅读模式
GPT-4o ("o"代表"omni") 就是 AI 竞技场中神秘的"gpt2-chatbot",公众评审结果为断崖式世界第一。与 GPT-4 Turbo 相比,GPT-4o 价格降低一半,速度提高 2 倍。为了确保人人能从 AI 中受益,OpenAI 将向世界免费提供 GPT-4o。

不像曾经的多个模型合作方案,GPT-4o 由单一神经网络同时处理文本、音频和图像。它可以区分多个特定说话者,识别音调或背景噪音,还可以自由切换声线,输出笑声、歌唱或表达情感。GPT-4o可以实时对音频、视觉和文本进行推理,能处理超过50种不同的语言,并且速度和质量大大提升。

在视觉方面,GPT-4o 可以指定细节生成/编辑图像,如按特定顺序堆叠不同颜色和不同数字的积木、将多角度照片合成为 3D 模型、使一致的人物/物体出现在不同的场景中,又或者以纹身的样式将整首古诗编辑到你的手臂上。

此前GPT-3.5语音对话的平均延迟为2.8秒、GPT-4为5.4秒,音频在输入时还会由于处理方式丢失大量信息,无法识别笑声、歌唱声和情感表达等。而GPT-4o可以在232毫秒内对音频输入做出反应,甚至还能随意打断,与人类在对话中的反应时间相近,彻底颠覆了以往的“语音助手”




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


快速回复 返回顶部 返回列表