专访首席科学家林辉:大数据时代的算法让AI+教育更有温度

2024-12-12 21:39发布

两亿人,什么概念?可以是中国总人口的七分之一,也可以是过去十年新增人口的三倍。但同时,它也可以是智能英语学习产品的注册总数。

自2012年成立以来,来自175个国家、384个城市的2亿用户选择流利说学习英语。正是这2亿人完成了超过39亿分钟对话、532亿句子录音的数据积累,让流利说拥有了全国最大的“中国英语语音数据库”。

作为一家孵化和创新人工智能驱动的在线教育产品的公司,流利说自成立以来就将大数据作为公司发展的核心。以自适应学习为核心,满足大数据时代持续多元化发展的需求。语言学习需要。

值得注意的是,从成立到赴美上市,经过多年的发展探索和行业起伏,流利说在今年一季度实现了上市后的首次盈利。公司实现营收1.99亿元,净利润1220万元,毛利率稳定。增至77.6%。这是流利说自上市以来不断探索长期发展战略的阶段性成果,也进一步凸显了流利说的产品价值主张。

借此机会,我们有幸与流利说联合创始人兼首席科学家、负责课程开发和AI算法的林辉博士进行了深入对话。我们就流利说的产品线、核心壁垒、对用户需求的理解、AI技术的延伸方向以及未来智能教育的技术趋势进行了沟通和讨论。

1 移动互联网趋势催生的智能学习产品

在线教育行业的萌芽始于2011-2012年,这与互联网的爆发高度吻合。随着移动互联网技术的进步,在线教育行业尤其是移动在线教育领域加速增长,呈现井喷发展态势。仅2012年,百度教育关键词收入就超过40亿元。

移动设备的普及和互联网技术的成熟加速了在线教育的发展。高速带宽和4G移动时代也大大增加了直播课程和碎片时间学习的可能性。

林辉博士曾就职于谷歌,在过去的工作中积累了大量的语音识别、产品研究和业务输出的经验。最初的行业调研结合创始团队留学期间对英语学习的需求,让林辉博士和创始团队试图解决“哑巴英语”的教学短板,流利说最初的产品雏形由此诞生。

格隆汇:作为智慧教育最早的倡导者,您和创始团队为何选择打造如此先进的英语学习产品?

林辉:首先是因为我们看到了移动互联网的大趋势。 2012年智能手机开始普及,给计算和人机交互带来了根本性的变化。移动是随时随地能够更好承载智能计算的载体。同时,智能手机摄像头和麦克风也为更便捷的人机交互提供了基础。摄像头可以提供视觉理解的交互通道,麦克风使更自然、便捷的人机语音交互成为可能。移动计算在某些场景下有可能改变原有的生活方式和商业模式。我们想抓住这个机会,在移动互联网上做一些有趣的事情。

当时团队观察了金融、医疗、教育等几大行业,最后我们觉得教育是一个很好的切入点。这也和创始团队自身的经历有关。从国内读书到出国留学工作,再到回国创业,一方面我们是教育的受益者,另一方面我们也看到了教育行业的一些低效现象,比如很多我们的时间都花在了英语学习上流利说一对一外教如何进行,但我们自己,以及身边的同学、同事的共同感受是,学习时间长,口语能力却很差,这实际上反映了语言教育的弊端。

2013年初,流利说推出了首款搭载智能技术的智能英语学习产品。例如,用户可以录制一段英语,算法可以对语音进行评分。流利说可以根据评分来安排后续的学习。这在当时是一个相对较新的产品功能,推出后我们的用户群显着增长。

当时一个重要的技术创新就是我们需要把原来PC系统上成熟的算法做的更小,以便能够在手机上运行。把PC上几百兆的系统,放在手机上只需要几兆的内存容量,对于流利说第一版来说是一个非常重要的技术创新和突破。核心算法可以在手机上运行,​​无需联网。这使得随时随地提供即时反馈以及游戏化的核心玩法成为可能,同时避免了当时移动网络不稳定和资费昂贵的问题。

移动互联网实际上对算法如何与产品结合提出了更高的技术要求。因此,率先将其商业化对我们来说具有重要意义。后续很多技术层面的优化和迭代都是基于此。进行于.

格隆汇:流利说运营初期缺乏用户数据,但算法需要数据反馈。如何开始?

林辉:流利说从一开始就在做AI算法的落地,在过去几年的研发过程中,形成了很多AI产品化的方法论。比如,在产品的冷启动阶段,我们可以利用相关领域的大量公开数据来构建模型,然后迁移到口语评分等特定领域,形成可供用户使用的版本。 MVP。在此基础上进行产品落地,通过创新的产品设计保证基本的用户体验。随后,特定场景的数据将随着流量的增加而积累并用于算法优化,打造更好的产品体验,实现“产品形成-数据积累-算法优化-产品升级”的正循环。

格隆汇:流利说可以为用户提供“个性化、自适应”的学习课程。应该如何理解“适应性”?

林辉:适应性学习的概念在教育界经常被提及。事实上,其本质是个性化的学习体验,以学习者为中心,自动为学习者调整学习体验。

但对于AI技术来说,用户能感知的大多是在交互层面,隐藏在后台的推荐逻辑并不容易被感知。因此,虽然“个性化自适应”的概念被很多人提及,但一款学习产品是否真的具有自适应功能却很难验证,而关心自适应是否真的给用户带来价值的企业较少的。流利说不仅长期停留在概念阶段,现在已经进入自适应学习和探索的深水领域。也是业内为数不多的真正推广个性化、适应性产品和技术的公司之一。

我们在当前的业务链上对基于强化学习的自适应算法进行了大量的A/B实验,比较不同的模型和算法,看看能否提高用户留存和复购。通过算法迭代和数据积累,我们将核心学习产品的复购率提升了30%。这是个性化学习的用户价值和商业价值的非常直观的体现。

2 海量数据驱动算法优化和多元化业务发展

海量数据的不断积累持续赋能算法模型的优化,完善流利说的学习操作系统,赋能C端覆盖全球的在线语言学习产品升级,增加B端企业服务、语言学术研究的数量和其他领域。规模扩张,逐步释放更大的价值潜力。隐藏在后台的算法的核心任务实际上是了解用户。有了成熟的数据分析技术,“知己知彼”之后,发现、挖掘甚至创造新的需求就水到渠成。

通过多年的技术和行业积累,流利说逐渐形成了“评价+内容+推荐+互动”组成的四大引擎英语,使能更加多元化、定制化的需求服务。

格隆汇:基础技术的成熟会对流利说构成威胁吗?流利说的竞争壁垒是什么?

林辉:我个人认为单点技术不会构成技术壁垒。真正的障碍在于智能技术与实际场景的结合,强调AI产品化的能力。

能够形成竞争壁垒的类别不超过四类:先进技术、网络效应、规模经济和品牌。

我认为单点技术要形成竞争壁垒,至少需要两个条件:技术性能比别人好至少10倍,有专利等保护措施。这类技术的研发投入往往巨大,需要重大技术突破,比如5G技术。实现先进技术的另一个途径是联合技术创新。例如,iPhone并不是单一技术的突破,而是多种技术的组合创新,创造了改变时代的产品。

在智慧教育领域专访首席科学家林辉:大数据时代的算法让AI+教育更有温度,相信单点技术不会成为障碍。我们更加注重智能技术与场景的结合,强调AI产品化的组合创新能力。人工智能技术需要与场景深度打磨,而场景又离不开产品和业务。在实际应用场景中,与用户体验相关的技术要求非常高,需要多种技术达到一定的效果,才能组合出一个用户体验好的产品。我们推出的AI外教就是这样一款产品。如果我们仅使用市场上其他语音或图像识别技术提供商,将很难满足相同的产品要求和用户体验标准。

网络效应一旦形成,就是很好的竞争壁垒,尤其是超线性、指数增长的网络效应。在线教育的网络效应比较弱,但是我们在过去的实践中也实现了一些具有网络效应的环节。每增加一个用户都会增加产品对其他用户的价值英语培训,形成正反馈循环。

从规模经济来看,在线教育行业目前面临着规模能做大但经济上不行的挑战。我们从去年开始加强对规模经济的探索,通过精细化经营取得了一些小成绩。今年一季度,我们实现了上市后的首次盈利。同时,流利说过往在智能个性化学习产品研发方面的大规模投入,已积累成包含四大引擎的学习操作系统。基于这样的操作系统,我们可以更经济地生产更多学习领域的智能学习产品,实现更大的价值释放。

一切最终都归结于品牌。在机会成本和时间成本都比较高的教育行业,品牌非常重要。流利说拥有近2亿注册用户,在英语学习领域具有品牌效应。

但总的来说,我认为在复杂的商业环境中,一个产品或者一个组织的竞争优势往往是综合能力的体现。

格隆汇:独特的数据库能否输出新的价值,为流利说未来的业务赋能?

林辉:数据的价值是巨大的。近两年流利说一对一外教如何进行,我们出版了一本学术书,分析了全国不同方言地区所学英语的发音。对推动语言学研究和大学英语教育发挥了较为积极的作用。

学术价值只是冰山一角。海量数据也帮助我们开发出更加智能的产品。阅读场景中积累的数据可以训练出最能听懂中国人说英语的语音识别引擎,这已经成为流利说AI老师的基本能力之一。我们最新的Alix人工智能老师在用户端也获得了非常高的成绩。评估。

此外,流利说的多模态数据存储了大量的用户学习行为数据,这些数据也在我们的AI系统中不断处理和使用,让我们能够更深入地了解用户的学习行为和习惯。从产品化的角度来看,这些数据帮助我们构建了一个学习操作系统,可以作为企业培训和SaaS平台的独立产品。未来,我们将为更广泛的用户提供个性化的学习体验。

格隆汇:未来流利说的产品会延伸到英语学习产品之外吗?

林辉:这是不可避免的。流利说积累的AI产品化知识,解构了智能化、个性化学习,沉淀了四大AI引擎,可以支撑和赋能多元化的智能学习产品。

评估引擎支持形成性和终结性评估流利说一对一外教如何进行,其对学生对象的刻画和细粒度的评估支持是任何学习产品和学习场景中都不能跳过的环节;内容引擎负责教学和实践内容的下级评估。比如知识点、技能点的自动和半自动结构提取,同时通过系统和人工智能生成算法提高优质内容的生产效率;推荐引擎基于前两项的支持,实现个性化推荐;交互引擎主要注重学习体验学英语,引导用户实现心流体验。这四类引擎通过多种SaaS或PaaS产品实现,并集成到我们的学习操作系统中,让研发人员无需了解底层智能技术,就能生产出具有智能属性的学习产品。

目前,我们正在与合作伙伴共同打造基于学习操作系统四大引擎的除英语学习以外的领域的产品,比如为企业客户提供定制化服务。

3 打破坚冰,凸显人工智能在线教育产品的价值主张

智慧教育是大势所趋。顶层设计的完善和行业新技术的不断涌现,将打破行业发展瓶颈,推动智慧教育行业在不同场景下的价值实现。

采访前,笔者对人工智能也有一个常见的刻板印象,认为AI是冷酷的、非交互的。未来如何摆脱算法的冰冷触感,如何让在线语言学习产品更有温度,更贴近市场和用户,实现真正的个性化学习,或许是行业未来探索的方向之一。针对这个问题,健谈的林辉博士也分享了他的看法。

在流利说看来,未来人工智能的“温度”将更多体现在通过对全球日益增长的在线语言学习需求的深刻理解和持续探索,提供更加个性化、便捷实用的自适应解决方案。了解产品和支持服务。未来,智慧教育在学校、家庭、移动场景的应用,本质上将进一步完善用户的个性化需求,促进互动。这种互动不是简单的数据对接或者需求对接,而是产品价值主张的凸显。同时,它也在利用人工智能技术缩短人与人、人与产品、人与场景之间的距离。

格隆辉:AI系统是固定的,但用户的需求是动态变化的。流利说如何满足不断变化的需求?

林辉:首先,我认为需求并不是一直在变化的。人类的最低需求其实是没有改变的。只是当需求不那么强烈的时候,会给外界一个改变的面貌,需要我们去激发一些情境和情绪。

我负责的上海市人工智能与认知学习重点实验对人脑认知做了一些研究。事实上,人类的各种行为,包括学习行为,都是可以科学解释的。大家都说学习违背人性,但事实上,不存在符合人性的学习方法。学习可以是自我驱动的。自我探索式学习、互动式学习等等都是可以快乐的,这也是我们正在努力探索的方向。

这里非常重要的第一步是深入洞察和识别学习者的认知状态,这本质上是用户个性化学习需求的表达。这正是流利说的评测引擎和交互引擎所做的事情。系统将不断评估用户的学习过程。当检测到用户的学习状态和学习效果不好时,它会针对情绪变化调动更多有吸引力的内容来提高学生的学习兴趣。而且,要实现大规模个性化,肯定离不开机器和系统。为每个人分配一位真正的老师来随时随地深入了解学习者的情况是不现实的。这只能借助系统和智能算法来实现。

另外,AI系统也不是固定的。系统可以根据用户反馈、数据反馈等进行闭环迭代,目前的技术在一定程度上还可以基于数据进行自我更新和迭代,实现“进化”。我们最近发布的 AIix 老师是一个进化的系统。有趣的是,虽然他只是一个AI,但“我喜欢这个老师”却是用户喜欢我们产品的三大原因之一。事实上,无论是AI系统还是产品,投射给用户的都是背后研发人员的温暖。每行代码、每一句文字,都可以通过“活”的产品向用户传递关怀的温暖。

格隆汇:未来智慧教育会朝什么方向发展?

林辉:从长远来看,我认为教育数字化、智能化的趋势是不可逆转的。具体的发展方向需要分不同的年龄段、地域、学习内容、场景等,简单说一下学校场景、家庭场景、随时随地自学场景的一些可能的发展。

在学校场景中流利说一对一外教如何进行,未来3-5年将会发生巨大的变化。数字传感技术和硬件基础已经成熟。国家减轻学生课业负担和校外培训的决心非常坚决。同时,加大数字教育转型投入。接下来,我们将看到如何真正改变教师教学和学生学习。减轻学生负担的办法。可以预见,智能技术将进一步为学校场景带来价值。

在家庭场景,政策限制了低年龄段的校外培训,但家长的焦虑和孩子更好成长的需求仍然是真实的。也许这部分教育需求会转移到家庭场景。智能教具将为家长提供一些教学工具和输出教学理念,协助家长教育孩子,促进亲子关系,引导孩子更好地学习和发展。

在自主学习场景中,类似流利说的AI智能教师将在移动以及新的AR、VR平台上迎来更大的发展空间。超级AI老师可能会出现在某些细分领域。他们会非常了解用户,并且在这个领域有非常完整的知识体系。在此基础上,他们将为用户提供个性化的流程学习体验。

虽然浪潮下不乏“裸泳者”,但更多的“好币”将迎来快速发展机遇,一大批智能教育技术、产品理念和理想有望在现阶段成为现实。

最后,林辉博士告诉格隆汇,一款成功的智能学习产品,除了需要对技术的充分理解和前瞻性判断,以及优秀团队的聚集,更需要的是对用户需求的感知。 ,理解和控制。他认为“这种共情能力非常重要,只有了解用户想要什么,才能做出有需求的产品”。

俄罗斯作家陀思妥耶夫斯基曾说过,世界上有很多种力量,尤其是意志和欲望的力量,它有沸水和红铁的温度。或许正是因为流利说具有与用户共情的能力,以及利用人工智能帮助实现教育公平的初衷,在线语言学习产品才能真正摆脱冰冷的感觉,拥有“滚烫的开水”。 “像烧红的铁的温度”,让每个人都能发挥最大的潜力。