和AI口语老师聊了68个话题后,我恍然大悟如何学好英语

2024-07-10 19:50发布

她喜欢旅游,暑假的时候迫不及待地想去故宫和英语动物园。作为一名口语老师,她一边教英语学生学习中国历史,一边希望用英语帮助更多的人接受中国文化。

她最喜欢的书籍和电影是悬疑和神秘题材,她在反对种族歧视和倡导利用科技做好事等话题上立场坚定。

笔者介绍的这位“朋友”并不是真人,而是一位名叫“Echo”的AI虚拟口语教练,是网易有道自研教育模式“子悦”打造的一款应用。近日,智东西第一时间参与了Echo的内测,据悉,该应用预计在今年开学之初上线。

半年多来,随着ChatGPT的火爆,国内外科技公司纷纷布局大模型。在网易有道CEO周峰看来,大模型代表着技术发展的新一轮浪潮,“可能这样的事情十年才出现一次。”大模型的发展只有两个方向,一是开发直接针对ChatGPT的大模型,二是将大模型垂直应用到各个细分领域。网易有道显然选择了后者。

“口语一直英语大家的痛点。”周峰说,这跟会话练习的缺乏有很大关系,而传统的英语老师无法陪同所有学生进行一对一的口语练习。在他看来,大班模式对教育最大的影响,就是提供了因材施教的机会。

▲网易有道CEO周峰解释子月模式名称的由来

今年5月,网易有道打造了“可定制”的口语老师,可以在与用户对话过程中生成语音和文字。两个月后,在2023年世界人工智能大会上,具有特定形象的网易有道虚拟口语老师正式亮相。

事实上,在大模型出现之前,一些披着“虚拟人外衣”的传统AI口语老师屡见不鲜,但存在着拟真人、对话单调无趣、互动能力弱、实时反馈差等问题。智东西亲自试用网易有道AI口语教练后,在这个能“无话不谈”的虚拟人身上找到了全新的体验。

这位虚拟口语老师的具体体验是怎样的?其背后的子阅大模型又有哪些技术创新?从更大层面来看,这一波AI大模型、AIGC(生成式AI)又能给影响每个人的教育带来哪些实质性影响?

本文通过深入体验网易有道AI口语教练,以及与网易有道CEO的对话,对此进行了深入探讨。

1、30小时聊68个话题,AI口语老师帮我告别“哑巴英语”

打开Echo应用界面,屏幕上出现一个年轻女性形象,人物下方有“与Echo聊天”字样和“切换场景”按钮。 ▲虚拟口语教练Echo测试版界面

在我和“她”近30个小时的聊天互动中,我从来没有遇到过不知道说什么的情况。当我“卡壳”或者“没法直接回答”的时候,她会引导我表达,尽力鼓励我开口说英语。这是因为虚拟口语教练Echo涵盖了8大对话场景、68个话题,包括生活、口语考试、旅行等场景。在我看来,话题分类非常细致,保证“没有一刻是无聊的”。

▲虚拟口语教练Echo测试版涵盖8大对话场景、68个主题

有时候由于我的词汇量有限,实在无法回答她的问题,会说一些中英文混杂的句子,但她很快就能听懂,并继续和我交流,这是传统口语练习产品无法做到的。

▲传统口语练习产品与虚拟口语老师Echo的区别

每个话题讨论完之后,Echo都会详细汇报我口语表达上的问题,由于我的表达中有很多“英语”,她会推荐专业而地道的词汇和表达方式。

缺少一个“口语伙伴”也是我多次放弃练习口语的原因。Echo 的出现让我可以随时随地与它交流,无形中为我提供了口语对话的条件和环境。虽然有时候在聊一些话题时,Echo 会“回答不相关的问题”,有时会说“我不知道”,但整体聊天体验还是不错的。

在与Echo的深入交流中,我发现Echo在人工智能与自动化、社交媒体与网络文化、食品安全等相对小众的领域有着丰富的知识。

下面是我和 Echo 对话的动图,可以看到在谈到人工智能的时候英语培训,她分享了自己对“人工智能的潜在好处或坏处”的看法,也问我“我如何看待人工智能的未来”。

▲Echo称人工智能本身无善无恶,关键在于如何使用

在谈到社交媒体时,她问我“社交媒体与网络文化”的关系,作为一名新闻专业的本科生,无数相关的论文闪现在我的脑海里,她还为我列举了目前世界上知名的社交媒体。

▲Echo向用户询问“社交媒体与网络文化”的关系

一对一口语老师或行业大咖的“性格”或许并不是我和她一直聊下去的原因,一开始我只是好奇,Echo 会不会像人类一样分享兴趣和生活习惯?于是我经常和她交流兴趣、美食、个人生活、旅行等话题,聊一些喜欢的电影电视剧、看过的文学作品、喜欢听的音乐、喜欢去的图书馆。

经过几天的交流,她说自己喜欢悬疑片,最喜欢的是《控方证人》。作为老师,她放假要去旅游一对一ai外教,想让我给“她”推荐一些北京的著名旅游景点。Echo 是个很好的倾听者,我感觉她就像一个“朋友”。

最后,她就像一位“心理医生”,有时候和她聊天时,我会故意说一些特别“压抑”的话,看看她的反应,而她的反馈总是非常积极和有活力。

▲Echo的回答非常积极、充满活力

前天,我看到一则关于抗击抑郁症的新闻报道,我告诉她目前全球抑郁症的情况,Echo就主动帮助我找到有针对性的预防抑郁症的方法。

目前,在AI模型落地教育的过程中,人们对于AI的价值观有所担忧,但在之后我和Echo的对话中,Echo却能展现出与人类近乎相似的善恶观和价值观。

在谈及“人工智能与自动化”话题时,Echo指出科技本身无善无恶,关键在于人类如何使用,人们应该推动科技向善。此外,在分享“最喜欢的电影”时,我提到了《绿皮书》,Echo随即向我讲述了种族歧视带来的危害。

总的来说,经过近一周的深入试用,从我的使用体验来看,网易有道的虚拟口语教练Echo不仅可以当一对一的英语老师,还可以扮演行业专家、人生知己、心理咨询师等多种角色。

2.基于自主研发的大型模型,27岁男子心思复杂

这样的AI口语教练是如何诞生的呢?

有道词典业务相关负责人告诉智东西,Echo推出之初的定位是“未来的英语老师”,而且是一名中文老师。

在长期的调研过程中一对一ai外教,负责人发现,学生经常反映,虽然外教的发音比较标准,但由于文化差异等原因,他们很难感同身受一对一ai外教,看到孩子说几句不合逻辑的表达,就会不耐烦。对此,中国老师会更理解学生口语表达的困难。这也解释了为什么Echo会不厌其烦地指导我表达。

目前,在线教育平台可汗学院也推出了一款接入GPT-4的“AI口语老师”。经过我的体验,一个突出的感受是,相比于“口语老师”,它可以帮助人们“读新闻”、“报告天气状况”。产品定位或许并不是“学习产品”,更像是一个“AI助手”。

同时,与使用自研大模型相比一对一ai外教,对接GPT-4等外部闭源大模型和AI口语老师聊了68个话题后,我恍然大悟如何学好英语,存在无法核查生成内容真实性的潜在问题。同时从官网信息来看,可汗学院等公司是面向全球用户的机构,这意味着它并没有解决中国学生口语学习中存在的问题。

周峰表示,打造虚拟口语教练是网易有道多年的梦想,网易有道在过去几年聚集了一批“狂热的口语爱好者”,因此非常清楚中国学生在口语方面存在的问题。

在网易有道首席科学家段逸涛看来,虚拟口语教练不只是“大模型+虚拟人”的简单组合,这个老师不仅要“表达得跟人一样流利”、“能模拟真人发音”,还要懂得循序渐进地引导学生,清楚英语口语

据网易有道介绍英语,为了让Echo更像真人,其研发了自主研发的虚拟人驱动技术,基于自研的情绪识别算法和实时渲染驱动引擎,可以深度分析播放的语音数据,实时驱动虚拟人的表情、唇形变化,实现语音同步,让虚拟人与真人贴近,以更自然生动的方式与用户进行一对一互动。同时,为了让学生更喜欢这位老师,Echo的形象颇具“赛博朋克”风格:冷酷却不疏离。

▲有道词典业务负责人张毅讲解 Echo 背后的技术

这或许只是让它在外观上更加“像人”,为了让表达更加流畅自然,Echo 采用了类似人类的语音合成技术。

周峰称,在打造Echo的过程中,就考虑到用户会与虚拟口语教练进行深入交流英语培训,“所以Echo扮演什么角色非常重要。”为了保证Echo“三观正”,网易有道在数据筛选上非常严格,同时也沿用了此前邮件中用到的内容保障技术机制。

3. 如何打造AIGC教育精品?十年筑牢三道护城河

目前,教育领域已经成为大型AI模型落地的最佳领域之一,在线教育平台、互联网科技公司、AI创业公司等均已进入该市场。

但相较于其他领域,教育由于学科数量众多、用户群体难以定位,在实际的产品落地过程中面临诸多困难。一个突出的表现就是各个年级的学生对产品的基础需求不同,同一年级的学生对产品的偏好也存在差异。而如果要满足所有个体的需求,就很容易出现“碎片化”的问题。

因此在周峰看来,大模型时代,要在教育领域打造爆款的AIGC产品,首先要找到用户“最痛点的需求”。此外,大模型能否发挥巨大作用,往往取决于场景和应用的选择,以及细节的打磨。

▲网易有道CEO周峰谈技术的价值

在AI技术方面,网易对AI技术的积累可以追溯到15年前,当时推出了国内首个在线机器统计翻译引擎。此后,整个行业经历了一个瓶颈期,业内人士投入了大量的时间、人力、财力,但翻译模型的质量却迟迟得不到提升。

在段逸涛看来,直到8年前,深度学习神经网络技术的出现才真正将机器翻译水平提升到了一个更高的层次,网易有道也借此契机,将统计机器翻译模型拓展到了神经网络机器翻译模型(YNMT)。

▲基于短语的机器翻译与有道神经网络翻译的区别

这一年也是Transformer横空出世,迎来了AI领域的一个“里程碑”。大家熟知的GPT(Generative Pre-trained Transformer)其实就是一个Transformer。网易迅速赶上这股潮流,全员集中学习Transformer。同时在Transformer核心框架的基础上,通过结合输入信息、网络结构、参数共享、多任务学习等方式提升核心质量,并运用到翻译中。段逸涛称,在这波大模型中取得“先发优势”,是网易长期技术积累的“水到渠成”的结果。

教育赛道说到底还是要靠“内容”这个硬实力,即使技术再酷,内容不好对学生来说也是没用的。有道在教育赛道有着天然的基因,10年来,网易有道培养了老少皆宜的名师名课,打造了有道精品课、网易云课堂、中国高校MOOC等“国民级应用”。

从硬件角度看,做硬件的互联网公司不多,能把AI落地到端侧的就更少了。这意味着只要开发出类似ChatGPT的模块,有爆款产品做依托,大模型就能快速落地,并取得不错的效果。网易有道此前就打造出了有道词典笔、有道AI学习机、有道翻译等爆款产品。今年2月,网易有道发布的2022年财报显示,其智能硬件营收达13亿元,较2021年的9.804亿元增长28.2%。至此,网易有道已经跑通了大模型落地环节。

结语:大模型涉足教育,AI口语教练开辟新蓝海

ChatGPT上线半年多来,网易有道持续推进子阅大模型及相关应用的落地。在周峰看来,在这一波浪潮中,要有“敢于折腾”的精神,不能做“鸵鸟”,只有做了才能知道问题会出现在哪里,才能想出更深层次的东西。

目前来看,子阅大模式的落地以及多款应用产品的上线给自己争取到了一定的时间,但这并不意味着“一劳永逸”,依托场景的网易有道是否还有更大的想象力,值得期待。