实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式,OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens,ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战,ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型,阿里通义免费开放奥运AI大模型,要把大模型拉下神坛,周鸿祎:360安全大模型免费,Meta战略调整:明星AI聊天机器人退场,用户自制AI成新宠,黄仁勋与扎克伯格支持 AI 大模型开源,互换外套展兄弟情谊,Getty与英伟达推出高效AI文生图:4图6秒生成,支持长提示词,实现千人千面的普惠化AI?波形智能发布新一代个性化自适应私人语言模型,AI引领奥运新风尚!小度成为用户全能“奥运伙伴”,OpenAI下周推出GPT-4o语音模式,ChatGPT Plus用户将率先体验无缝AI聊天,智谱AI新推“清影”工具:30秒生成视频,免费试用!,OpenAI人事变动:AI安全高管马德里转岗,专注AI推理新领域,作家集体反对番茄小说AI协议,公司回应:已上线解除条款功能入口,橡鹿科技再获京东近 2 亿元战略投资

【ITBEAR科技资讯】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha版本)将对部分ChatGPT Plus用户开放,计划在今年秋季将该功能逐步推广至所有ChatGPT Plus订阅用户。

据ITBEAR科技资讯了解,OpenAI首席技术官米拉・穆拉蒂(Mira Murati)在早前的演讲中阐述了GPT-4o的技术特点。她指出,GPT-4o是一个全新的跨文本、视觉和音频的端到端统一模型,其特色在于所有的输入与输出都由单一的神经网络负责处理。由于这是OpenAI首个融合多种模式的模型,因此在功能和局限性的探索上,他们还处于初步阶段。

原计划于今年6月底邀请小部分ChatGPT Plus用户测试GPT-4o语音模式的OpenAI,因需要更多时间来完善模型并提升其特定内容的检测和拒绝能力,故官方在6月宣布了测试推迟的消息。

实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式,OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens,ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战,ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型,阿里通义免费开放奥运AI大模型,要把大模型拉下神坛,周鸿祎:360安全大模型免费,Meta战略调整:明星AI聊天机器人退场,用户自制AI成新宠,黄仁勋与扎克伯格支持 AI 大模型开源,互换外套展兄弟情谊,Getty与英伟达推出高效AI文生图:4图6秒生成,支持长提示词,实现千人千面的普惠化AI?波形智能发布新一代个性化自适应私人语言模型,AI引领奥运新风尚!小度成为用户全能“奥运伙伴”,OpenAI下周推出GPT-4o语音模式,ChatGPT Plus用户将率先体验无缝AI聊天,智谱AI新推“清影”工具:30秒生成视频,免费试用!,OpenAI人事变动:AI安全高管马德里转岗,专注AI推理新领域,作家集体反对番茄小说AI协议,公司回应:已上线解除条款功能入口,橡鹿科技再获京东近 2 亿元战略投资

早期信息显示,相较于GPT-3.5模型2.8秒的平均语音反馈延迟,GPT-4的5.4秒延迟在语音交互上显得不足。然而,新一代的GPT-4o预计将大幅降低这一延迟,实现更为流畅的对话体验。

GPT-4o语音模式的亮点在于其迅速的反应速度和高度逼真的声音。OpenAI更是声称,该模式能够感知语音中的情感语调,包括悲伤、兴奋甚至是歌唱。

OpenAI 发言人林赛・麦卡勒姆(Lindsay McCallum)明确表示:“ChatGPT不会冒充他人的声音,无论是个人还是公众人物,且系统会阻止与预设声音不符的输出。”这一声明为GPT-4o在语音交互的真实性和安全性上提供了保障。

_烟台vps,河南vps

© 版权声明

相关文章