全文字数:7649字 精读时间:20分钟
核心摘要:
无论是学界还是业界,其对AI+教育的发展理念基本达成共识,即以学习者为中心,从外置型技术辅助走向内融型技术渗透。学界将继续挖掘教学目标与机器规则的可适配性,开发特定教育场景下的关键技术,对不同发展阶段的业界玩家而言,具备差异化竞争优势的高质量数据资源将成为其竞争的突破口,可在当前关注度不高的特殊教育领域或者其他细分赛道当中探索更多应用场景。
AI+教育的定位
为教育现代化建设打造智能引擎
在人工智能产业当中,金融、营销、安防、客服领域在IT基础设施、数据质量、对新技术的接受周期等AI发展基础条件方面表现较优,其商业化渗透率和对传统产业的提升程度较高。而教育行业整体AI化程度较低,数据质量参差不齐,解决方案的落地效果表现一般,但得益于政策的大力支持与市场对AI的强烈需求,AI+教育的商业模式逐渐清晰,价值空间较高。
在教育产业当中,校外教育向在线化发展,校内教育向信息化发展。校外教育方面,在线化教学的的用户体验粗糙且教学效果模糊,用户对新技术的接受周期较长,更加智能化的产品值得探索。此外,校内师生的信息素养不高,且信息化设备使用频率较低,均导致核心教学数据缺失,最终加大了教育数据挖掘分析的难度,因此亟待智能化解决方案的落地实施。
AI+教育的定义
人工智能技术在教育场景下的应用
对“AI+教育”的定义既要回归技术的本质,始终围绕基础数据、核心算法与服务目的,也要回归教育教学活动的出发点,始终关注教育目标及其评价方式。因此,本文认为,“AI+教育”是指在人工智能与教育深度融合与发展的条件下,以基于教育场景的人工智能应用为路径,促进教育公平,提升教育质量,实现教育个性化。具体来看,“AI+教育”是人工智能在教育领域中创新应用的技术、模式与实践的集合,可划分为“计算智能+教育”、“感知智能+教育”和“认知智能+教育”,即AI+教育正从“能存会算”向“能听会说与能看会认”发展,最终实现“能理解与会思考”。
AI+教育行业的应用场景
教、学、管、考场景下均有已落地的人工智能教育应用
从教育教学活动的角度来看,当前的教育场景可划分为教、学、管、考。其中,“教”和“管”的主体是教育者,前者负责执行教学任务,主要工作包括教研、备课、授课、答疑、出题、阅卷等,工作内容繁琐,核心需求是减轻负担,实现精准化教学。后者负责统筹教务环节,主要工作包括教职工招募、师生督导、招生、分班排课、校园建设等,决策环节考虑因素较多,核心需求是提高效率,实现科学化管理。“学”与“考”的主体是受教育者,“学”的场景下,学生的主要任务包括预习、听课、看书、做作业、复习、考试、实习等,由于学生个体差异大,核心需求是自适应,实现个性化学习。“考”的场景下,主要面向大规模标准化测试,组卷阅卷的工作庞大,部分测评环节劳动力密集且效率底下,核心需求是保证准确性的前提下,实现自动化评阅。
AI+教育行业的技术架构
数据是基础,算法是核心,服务是目的
从AI+教育的技术架构来看,可初步分为三个部分,即基础层、算法层、应用层,每一层分别表现出不同的特点。基础层主要包括算力、数据与算法框架,其中数据量级庞大冗杂,质量参差不齐,基于教学过程的非结构化和半结构化数据的处理难度大,线下教学环节的数据普遍缺失。算法层是实现技术的核心,2006年提出的深度学习算法视为人工智能在算法层的突破,该算法通过具备更多隐层节点的人工神经网络,实现逐层特征变换与学习,解决了很多复杂的模式识别难题。感知层技术目前发展得较为成熟,在深度学习算法的助力下,感知技术应用场景广泛。认知层技术是未来发展的重要方向,预期在特定领域内可实现机器一定程度上的认知推理能力,有显著的技术门槛。AI+教育的应用发展阶段各异,越外围的教育环节,技术渗透率越高,技术的有用性与易用性也越好。
AI+教育行业的发展历程:产业视角
依托于在线教育与教育信息化而发展,行业仍处初级阶段
AI+教育行业的发展历程:资本视角
融资规模呈上升趋势,K12与教育信息化领域最受资本追捧
随着近年来人工智能的快速发展,AI+教育赛道备受资本关注。2013年-2019年,AI+教育领域共发生274笔投融资事件,总融资额达145亿。从融资增速上来看,融资事件数复合增速达34%,融资总额增速达57%,资本一度狂热,其中K12与教育信息化领域的融资规模领跑其他细分赛道,期间各自总共融资78亿与20亿,分别占整体融资额的53.5%和13.6%。
AI+教育行业的发展驱动力
产业、技术、政策、资本四力合一,全面驱动AI+教育发展
产业方面,在线教育渗透率不断提升,教育数据量增长迅速,为人工智能技术的实施提供了数据基础。由于目前在线教育的体验及效果不佳,倒逼行业进行技术升级,人工智能解决方案将成为在线教育体验提升的主要途径。技术方面,互联网基础设施全面普及,在大数据、云计算和5G等支持性技术不断成熟的背景下,数据量和算力将获得进一步提升,人工智能技术有望实现突破。政策方面,近几年来,我国针对人工智能及人工智能+教育领域的政策层出不穷,人工智能已上升至国家战略级别,教育更是关乎国计民生的大事,行业尚处红利期。资本方面,教育行业巨头纷纷布局,知名投资机构频频出手,融资规模超百亿,融资阶段覆盖天使轮至IPO,成为教育领域近年来最大投资热点。
AI+教育行业的竞争力分析
五类玩家各有所长,行业定位逐渐清晰
从技术与业务的角度来看,AI+教育的主要行业玩家可分为具有教育与业务背景的线上与线下教育机构和具有技术与产品背景的AI技术供应商与互联网巨头,以及综合教育与技术背景的教育信息化厂商,这五类玩家各有所长,对AI+教育的渗透程度不一,发展阶段各异,其中在线教育机构与AI技术供应商因业务与数据资源积累和技术开发优势,渗透程度较高。随着各类行业玩家对AI+教育领域的不断探索,未来行业分工将进一步明确,在竞争中走向融合创新。
AI+教育产业图谱
AI+教育行业的市场规模
市场规模超400亿,泛AI产品渗透率普遍较低
服务提升需求驱动校外在线产品AI化,效率提升需求驱动校内信息系统AI化,校外AI技术的市场渗透率小于校内。从目前AI+教育的实际应用来看,AI产品的工具化与功能化属性较重,校外产品商业化价值的驱动因素仍为优质教育资源(师资、内容),AI在教学上的价值尚未被家长普遍认可,直接付费意愿不强。校内信息系统在政府政策主导下,财政预算驱动着教育信息化的普及与升级,泛AI产品应用场景丰富,整体渗透率较高。
AI+教育的应用:口语测评
朗读与复述能力测评技术成熟,自由表达测评技术仍在发展
从“测”的角度来看,口语应用场景包括朗读与复述、陈述与表达、演讲与问答,不同场景对应考察学生不同的口语能力,并且学生表达的主观灵活性逐渐提升。从“评”的角度来看,核心功能是实现自动评分与纠正,即告知学生其在不同口语能力上的掌握程度,并指明正确的练习和表达方式。其中,朗读题因高度测试有用性(即朗读题有较高的测试效度)及材料既定性等特点,在学界被广泛研究,目前已有成熟的语音评分与口语训练系统。复述题的标准相对灵活,即学生可以摆脱范文以进行转述,但这就要求机器能够“听懂”学生的复述的整体内容,而非仅仅是逐词校对,目前复述题模型需要基于朗读题数据做自适应处理,以提升识别性能。
以自适应口语学习和配音产品ToC,以口语考评系统ToB
C端方面,口语测评功能主要嵌入自适应口语学习产品和配音产品当中,其中后者的打分系统相对模糊,且“测”的场景主要为原文朗读,技术实现难度较低。对于自适应口语学习产品,交互场景较为丰富,其中情景对话/看图说话场景已涉及对具备一定主观灵活性的复述与表达能力的测评。B端方面,在英语教学改革的大背景下,口语纳入中高考考试范围,由地方教育部门统一采购的英语口语考试评测系统成为各个学校考前突击的重要学习工具,根据行业主流考评系统供应商的反馈,目前口语考评系统已在大部分地区全面推行,并已经替代了教师的部分评阅工作,但仍需专家参与评阅过程。
语言学习与考试的标配,商业模式成熟,技术渗透率高
口语测评主要涉及语音识别、语音合成与语音评测技术,由于目前测评的能力维度相对单一,基础测评功能的实现不需要太高的技术门槛,在语言学习产品当中应用广泛,技术渗透率较高,用户覆盖面广。从商业模式上来看,对于C端产品而言,口语测评内嵌于口语教学与练习产品,并以课程费和会员权益费的形式向用户收取费用,而对于B端产品,除了口语考评系统外,智慧课堂场景下的口语作业批改环节也会用到口语测评功能,服务商收取API接口调用费或解决方案服务费。
AI+教育的应用:拍照搜题
核心技术为图像识别与内容检索,竞争壁垒在于题库
拍照是信息的输入方式,搜题是用户的具体行为,本质上,搜题行为在PC时代就已经非常普遍,基于各类垂直题库或者更大的流量入口的搜索(例如Google和百度),用户能够检索到相应的结果,内容检索技术的发展已经相当成熟(主要分为基于关键词匹配和基于分类目录的两种检索方式,搜索引擎的算法多为前者)。随着移动端智能机的爆发,借助智能机的前置摄像头,用户可随时随地以图片的形式存储题目信息,并利用OCR技术将试题图片识别成可编辑的文本信息,继而用文本信息进行搜索从而得到试题及答案与解析。目前OCR技术已趋于成熟,手写体识别准确率可达90%以上,印刷体的识别准确率更高。因此,在技术层面上,各类拍照搜题产品都大同小异,能够构建起竞争壁垒的部分是需要依靠强大的人力和组织力生产的题库,这是决定产品用户体验的关键因素。
从作业工具引流到教学内容增值再到课程服务变现
拍照搜题的战争已经结束,CR2超过80%。最初,产品依靠拍搜功能引流,并基于作业场景下的其他需求,提供背单词、作文库与同步练习的功能,实现工具时代的流量原始积累。随后,各类玩家基于用户需求衍生出了不少增值服务,从1对1答疑到VIP视频知识点讲解再到直播课程,一边夯实题库,一边自建教研教学体系,逐渐从工具产品向内容产品转型。最后,产品加大对教学环节的渗透,通过“主讲教师+辅导教师”的双师授课模式,全面提升教学服务质量。
大面积覆盖K12,正在向家长批改场景和考试类领域拓展
拍照搜题产品主要渗透高学龄段(四五六年级)的小学生、大部分初中生和大部分高中生,其中小学渗透率超过40%,初高中渗透率超过90%,未来K12学段渗透率的提升主要在低学龄段(一二三年级),该学龄段的核心用户群是家长,比较常见的应用场景是家长对学生口算作业的批改,拍照搜题产品可以实现实时计算功能,提高家长批改的效率,未来还将针对家长批改的场景,逐步开发基于主观题与应用题的批改功能,其技术原理与拍照搜题一致。另一方面,从题库生产的逻辑上来看,考试类教育领域的题库资源丰富,用户对搜题也需求不少,但目前仍以手动输入的方式进行检索。
AI+教育的应用: AI课堂
进入弱人工智能阶段,AI模式识别能力点缀教学环节
自1979年以来,课堂教学改革一直是教育学重要的研究领域,知识联系实际、自主合作学习、个性化学习逐渐成为课堂教学的构建原则。这种背景下,通过信息化手段辅助课前导学、同步备课、课中互动、在线检测、课后作业成为了必然选择。自2011年起,“智慧课堂”产品就开始在市场上热起来,这一时期强调的是基础数据整合、利用大数据分析学生错题情况,兼有基础的语音朗读和评测能力;2016年之后,通用AI语音、视觉等模式识别能力开始进入课堂,AI课堂质量监测开始引发关注,到2019年已基本实现了在课堂场景下的可用;未来,为了进一步弥合课堂教学改革的需求,发扬“互动课堂、翻转课堂”等教学模式的优势,AI课堂将继续进阶,下一阶段AI辅助实现的策略化点播和发散性学习将是重点突破功能,在更远的未来则可能帮助教师实现真正的千人千面教学。
公立校V.S.教培机构AI课堂的产业链与商业模式
公立校和教培机构都在关注AI课堂,但AI课堂在两类机构的应用差异很大。公立校延续智慧课堂的建设方式,主要通过改造多媒体教室,在实验教学中使用AI课堂(学生轮班上课),需要引入的内容包括:教育资源及其系统和本地部署的服务器,授课与备课系统,及支持AI功能的教、学平板电脑终端,一般由教育类ISV通过渠道商完成当地教育局或学校招标的商业模式进行;教培机构对AI课堂的使用又划分为线下和线上,线下由教培机构将解决方案投放进直营校和加盟校,利用AI边缘设备和硬件传感采集设备进行课堂信息实时采集,建设完成的AI课堂会常态化使用,而且常常与“双师” 模式结合应用,由AI负责录播课过程中的课质监测、学生个性化关注,进而把控授课进度与难度;线上则利用AI关注录播课中学生实时反应,提供差异化辅导;教培机构AI课堂在商业模式上主要收取销课费、加盟费。
公立校:普通智慧课堂与AI课堂混合建设,AI课堂约10%
公立学校的智慧课堂建设是教育信息化的一部分,目前呈现出普通智慧课堂与AI化智慧课堂混合建设的现状,其中达到AI化智慧课堂的比例约10%。从发展空间来看,智慧课堂的主流用户为中小学生,我国有21.4万所中小学,智慧课堂的建设空间总计在2000亿元左右,而远期AI课堂能够完成对智慧课堂的较高渗透。从现状看,2018年,我国教育信息化市场规模约为4000亿元,智慧课堂相关建设大约占比3.7%,即150亿元左右,其中软件系统占比38%左右,教师、学生平板终端占比50%左右,其余为无线网AP与用电设施等。从项目的区域分布上看,东南(26%)、华南(21%)、华东(17%)等沿海地区的智慧课堂建设走在前沿。
教培机构:线上与线下AI课堂发展动因不同,线下渗透率低
线上录播课场景中AI课堂功能的核心有课质监测与学习内容的个性化推荐,AI对学员在学习中的问题进行分析,辅导老师可以针对性跟进指导,部分产品还可提供师生智能匹配功能,相比而言,线上AI课堂数据实时采集的质量受环境噪音、摄像头角度影响小,普及难度稍低,较多机构已经参与尝试,未来的发展重心将结合学习资源的快速生产,如利用AI形成课程视频、形成测题集,解决生产力的问题。线下AI课堂的设置初衷是缓解三四线地区缺乏优质师资的问题,帮助线下培训机构以较低成本、较低收费提升学生课堂体验,推广刚刚起步。加盟校区较难统计,而从机构直营校区看,部分大型K12教培机构线下直营AI课堂教学中心渗透率仅2%,如果将市场上不计其数的中小培训机构纳入核算,则渗透情况微乎其微。
海量数据的获取与利用是制约AI课堂发展最大的问题
AI课堂的受众以小学中高年级和初中为主。对于社会普遍期待的由AI实现个性化学情分析和学习路径最优策略推送,以帮助学生强化薄弱知识点、考点的掌握而言,虽然这样的功能已经陆续上线,但应用效果还不尽如人意,究其原因,一方面是因为我国AI课堂的建设刚刚起步,数据需要一定的积累周期才能产生价值,其效果显著的时间相比建设时间有滞后性;另一方面则是因为数据的获取与利用程度还很低。我国公立校AI课堂作为实验性教学使用,每个月每个学生只有1-2个课时,而课外辅导班中AI课堂的渗透比例也还很低,整体测算中小学生AI课堂学习时长的渗透率在其学科教育总时长中仅千分之一,单个学生用户在AI课堂系统中的使用频次和活跃度都不足支撑千人千面的分析,而校内、校外、线上、线下、不同辅导机构等授课渠道的AI课堂积累的数据无法相互打通,阻碍了对学生进行全面、完整的分析从而优化学习辅导策略。
只有少数企业有实力进行自研,形成未来的AI课堂生态核心
AI课堂作为教学综合性解决方案,涉及的研究方向较为复杂,若想在真实教学场景中达到可用,大量的教学实践场景与经验必不可少,这是获取算法训练数据的主要来源,也是积淀实际场景需求理解的最好渠道;同时,AI算法的突破依赖于大量、稳定的研发团队,资金实力和品牌效应是保障。整体而言,AI课堂的参与壁垒较高,只有少数企业真正具备自研先进AI课堂产品的能力。
AI+教育的应用:走班排课
高考从标配走向自选,催生走班排课系统的旺盛需求
AI+教育的应用:校园安全
AI视频监控守护校园人身财产及食品安全
校园安全是办学的基础要求、也是生命线。过去的平安校园监控系统,在AI的赋能下,能够实现陌生人出入警报、高空抛物预警、楼梯拥挤预警等,为校园人身财产安全增加了一重保障。而食品安全也是安全管理的重心,2019年4月国务院食品安全办全国校园食品安全工作电视电话会议明确,学校食堂推行“明厨亮灶”的比例要达到70%,适逢视频监控行业AI升级化大潮,在此背景下,具备AI视频分析功能的明厨亮灶餐厨解决方案开始成为主流。
竞争策略方面
教育公司主导产业升级,差异化的高质量数据是竞争突破口
目前AI+教育行业仍处于初级阶段,AI技术与产品的研发消耗巨大,不同发展阶段的市场玩家将采取不同的市场竞争策略,总体上仍然是以教育公司来主导整个产业升级的过程。对于成熟的教育公司而言,AI中台战略已初见端倪。此类公司教学业务多元,教学场景丰富,各业务线具有各自的数据储备,AI中台可促进各部门数据互通互融,基于各个场景搭建独立的算法模型,最终通过业务数据的增长来反哺业务部门。对于初创的教育公司而言,自研某一细分领域的数据引擎可建立相应的竞争优势。就语音识别与合成领域而言,儿童语料库与成人语料库差异较大,全行业在儿童语料库的积累上仍存不足,教育场景强调交互体验,但目前的语音合成技术还无法做到抑扬顿挫的表达,实际教学体验较差,值得初创企业探索。