OpenAI 公司最近新闻有点多,前 CEO 及董事会间纷争不断、很是热闹。11 月 22 日 ChatGPT 突然开放了 voice 对话功能,体验了一下:
1、可直接通过语音与 GPT 进行交互,与文字输入的交互效果基本无差别,大家也许还记得以前“小爱同学”、“google home”等语音交互工具的局限性和弱智吧,相比之下,这个强很多了。
“chatgpt voice”+“AutoGPT”/”gpt agent”/”GPTs”,AI 以后可以根据人类的语音指令,通过云端的大模型 AI 能力 + 实时联网(目前 4.0 已开放)+ 自动处理 + 自动迭代,可能将会形成非常可怕的执行能力。对于人类世界的影响将会非常深远,远不是目前看到的样子了。
2、让 lindon 同学尝试用英文通过 voice 直接与 chatgpt 对话,gpt 的发音很生动和人性化,基本听不出 TTS 的痕迹了,其实也可以作为练习口语与听力的基本工具了(可能受网络影响,与真人完全无时延的对话效果还有点小差距,但在可接受范围)。lindon 第一次聊天就直奔塞尔达的游戏攻略去了,英文语音聊完后,对话记录会形成英文文本,看了下,gpt 的措辞还是很不错的。另外,中文的发音效果目前感觉还一般。

正文完