生成式人工智能抢占口语市场,OpenAI 押注于 Speak

2023-12-05 16:07发布

要说流利的英语,需要在真实的互动环境中大声说出来。 到目前为止学英语,我们获得这种练习的唯一方法是找一位真正的老师:

网上订课稍微便宜一些,但订时间或抢名额无异于一场战争; 线下预订课程费用更高,并且涉及旅行的麻烦。

GPT时代避免上述痛苦的“口语练习神器”会是什么样子?

OpenAI 通过其基金公开投资的三家初创公司之一,领先的语言学习平台 Speak 代表了一种方向和可能性。

去年11月,Speak完成2700万美元B轮融资,由OpenAI创业基金领投。 除了金钱之外,他们还可以抢先使用微软提供的全新OpenAI系统和Azure资源。

打开应用程序,回答几个问题(例如学习目的、频率、当前英语水平和兴趣领域等),系统将为您定制学习课程。

每门课程均由真人录制,用户跟随学习。 课后还有作业。 完成作业后英语口语练习的最好方法,还有角色扮演环节。 让您将所学应用到设定的场景中——与 AI 开始多轮对话。

作为典型的教育应用,无论是学习环节还是后续的作业或角色扮演环节,系统都会在发音、语法、词汇等方面给出非常具体的反馈。

例如,可以添加什么样的副词使表达更自然,如何更简洁地说一个句子,以及警告一些常规表达(如rainingcats和dogs)不能随意简单。

如果说 Speak 早期只能用现成的技术凑合,那么有了 Open AI 的投资,Speak 可以做得更多。

例如,在AI Tutor中,用户可以与AI聊任何话题(比如夜宵、减肥),系统也会提供实时反馈。

AI讲师们可以说是OpenAI新系统能力的掌握者:

3 月份,Speak 接入 OpenAI 全新自动语音识别模型 Whisper——它在英语语音识别方面具有接近人类水平的鲁棒性和准确性,并且无论用户的口音(例如韩语和日语用户)如何识别和识别,都可以更加准确。提供更准确的反馈。

然后,他们成为第一个使用 GPT-4 的语言学习平台。 GPT-4 可以理解更复杂的表达并生成更准确、更连贯的文本。

无论“记忆力”如何,经过几轮对话后,您都不会忘记之前谈论过的内容,使交互体验更自然英语口语练习的最好方法,引导更有意义。

此外,对话已经变得高度个性化,没有两个对话是完全相同的。

“在底层,我们将 OpenAI 的最新技术与内部模型相结合,以在语音识别、语音生成和对话生成方面提供最佳性能。” Zwick 坚称 Speak 的人工智能技术优于大多数竞争技术。

Speak 由 Connor Zwick(首席执行官)和 Andrew Hsu(首席技术官)于 2016 年创立。

两人都有着很棒的经历:Connor Zwick 在高中时创建了一款名为 FlashCard+ 的应用程序,并在 21 岁时将其出售。 安德鲁在达到法定投票年龄之前就获得了三个学位。 两人在 Peter Thiel Fellowship Program 中相识,在那里他们花了一年的时间深入学习,了解人工智能,并决定创业。 结果,康纳·兹威克(Connor Zwick)一年后从哈佛大学退学,安德鲁(Andrew)从斯坦福大学医学院第三年退学。

据说,它上架第一天Apple Store只赚了18美元。 现在,它不仅是iOS应用商店中韩国排名前列的教育应用程序之一,而且在日本市场也取得了不俗的成绩。

当然,很多用户对于选择哪一款感到困惑,因为历史悠久的外语学习应用 Duolingo 也推出了基于 GPT-4 和最新 OpenAI 技术的付费服务 Duolingo Max。

学习者可以访问由生成式人工智能提供支持的两项新功能和练习:解释我的答案和角色扮演。 一遍又一遍地犯同样的错误却不知道为什么? “解释一下我的答案”清楚地表明你错了。

所谓角色扮演,就是在实战场景中与不同角色完成对话(比如在咖啡店买咖啡或者在宜家买家具)。 此功能背后的人工智能具有响应性和交互性,这意味着没有两个对话是完全相同的。

如果你不想上很系统的课程或者让它变得很复杂,你只是想和某人随意聊天,并且不期望太多专业的指导和反馈,你可以尝试基于ChatGPT(以及其他)的PrettyPolly工具)。 任何人都可以做到。 随时随地练习说 26 种语言。

在网页上选择一种语言,你就可以练习与人工智能口语。 它会为每次对话生成流畅度分数,以便客观地跟踪进度。

有趣的是,正如 Speak 目前专注于韩国和日本市场一样,尝试过 PrettyPolly 并给出反馈的人也有不少是日本人。

另一个应用程序 Speechy 可记录、分析并提供语音反馈,突出显示发音和语法方面需要改进的领域,并提供提高口语技能的实用见解。

此外,还有一个非常流行的应用程序,专注于虚拟聊天。 他们提供各种各样的服务,英语学习只是其中之一。 他们可以陪你进行口语对话英语口语练习的最好方法,但他们没有课程体系,无法像Speak这样的教育应用那样主动提供详细、专业的指导。

我们先来看看团队最受欢迎、技术最强大的产品——聊天机器人“批发市场”Character.AI。 您可以在这个平台上DIY或与不同的AI角色聊天。

同样在3月,Character.AI完成1.5亿美元融资,估值达到10亿美元,由a16z领投。

Character.AI 实际上希望用户控制游戏玩法,因为他们更知道自己想用这个东西做什么。 本质上,Character.AI只是为用户提供了LLM技术,让数十亿用户能够使用大型语言模型并发明新的用例。

该平台预制了一批模型,如爱因斯坦、马斯克、英国女王等人物,以及外语口语。

我们选择了一位口语英语教练,打开聊天窗口,开始交流。 它可以识别您的口语准确性,同时为您提供地道的本地发音和表达方式。

然而这位老师对你口语表达的反馈并不像Speak这样的应用那么专业、详细、有针对性。 我们至少问他一两次“刚才的表达是否有一些语法错误(即使句子本身有语法错误)”,教练才会提到一些错误并纠正。

虽然纠正不是那么主动和及时,但我们明显感觉到他的记忆力很好,至少记得之前的表达错误。 这也是因为对话内存比之前的容量增加了一倍,系统可以“记住”之前的聊天消息。

除了学习伙伴、口语伙伴,你还可以找到文字冒险游戏AI、情感顾问AI、创业咨询AI,甚至是本地导游AI。 根据经验,对话可以轻松地从纯粹的新奇问题转变为更有意义的讨论。

Character.AI是目前个性化AI聊天机器人赛道技术能力最强的团队。 联合创始人 Noam Shazeer 和 Daniel De Freitas 在对话式人工智能和法学硕士的发展中发挥了关键作用。

他们从头开始培训其专有的法学硕士,使他们的产品不仅能够优化原始智力,还能优化对话同理心,通过幽默、情感、洞察力等吸引并留住消费者的注意力。

如果你对现成的对话机器人不满意,你还可以打造专属AI,自己塑造他们的“个性”。

有两种制作模式。 在基本模式下,您只需要添加:姓名、角色自我介绍和头像即可完成创建。 在高级选项中英语口语练习的最好方法,你还需要喂一些训练语料库,让机器人更接近你的想法或真实的人。

目前英语培训,随着越来越多的人与Character.AI上的大量角色互动,这些互动(数十亿次并且还在不断增加)被反馈到他们的底层模型中生成式人工智能抢占口语市场英语培训,OpenAI 押注于 Speak,不断推动其发展。

与拥有大量虚拟对话角色的Character.AI类似,在聊天应用Ainder中,你可以通过滑动大量照片找到你喜欢的老师,并打电话给他永远聊天。

打开界面,你可以见到各种角色,从爱因斯坦、马斯克、特朗普到流行歌手泰勒·斯威夫特,甚至海绵宝宝。

如果你想专门练习外语口语甚至雅思口语,这里有专业的老师可供你选择。 当然,目前还没有系统的课程,只是陪练而已。

有趣的是,你与老师的交流就像与朋友通过电话交谈,而不是文字输入。 您甚至可以选择记住上下文的时间,以改善对话体验。

然而,从现实的角度来看,我们发现马斯克的声音听起来并不像他,也没有提及马斯克在接受采访时有时会口吃的细节。

聊天的内容不是很有趣。 当我们讨论最近的高温,他回复我一系列科学防暑措施(就像搜索引擎给出的答案一样)时,我们立即退出了聊天。

在另一个口语APP里,我和AI一路聊着从天热到中国秦岭的旅行。

与Character.AI、Ainder等“批发市场”不同,另一款流行的聊天应用Call Annie是一个会说话的数字人,底层是ChatGPT。

你可以把她理解为一个可以随时视频聊天的ChatGPT。

您可以用它来学习英语、法语、德语和其他语言。 例如,告诉她学习外语的目的,她可以帮助你纠正错误和不完美的答案。

该应用程序的一个非常出色的体验是近乎实时的 FaceTime 通话。

系统实时驱动面部表情和语音同步口型变化,让虚拟人接近真人,反应速度快,体验自然,就像在视频中与真人在一起一样。

此外,安妮知识储备丰富,对所有话题都了如指掌。 你还可以向她询问数学、物理、化学、编程、金融等各种专业知识。CallAnnie还具有新闻查看、天气预报、健身教练、财务助理等一系列功能。

目前国内也有一些相关产品。 雅思与科大讯飞联合开发了AI英语口语练习产品。 网易有道在教育领域推出了大型垂直模型——“子曰”,并基于该大型模型发布了虚拟口语教练。 新东方在财报季提到,公司将“认真探索将ChatGPT等人工智能新技术应用于教育产品的可能性”。

本文来自微信公众号“机器能源”(ID:almost human2017),作者:Sia,36氪经授权发布。