们如何利用人工智能,让老师和学生减负增效?

2018-09-14  来自: 中关村众恒创新创业信息化发展研究院 浏览次数:286

9月7-8日,2018创新中国DEMO CHINA总决赛暨秋季峰会在杭州洲际酒店举行,雪松湾教育创始人兼CEO李文建发表了《人工智能赋能教育评价》的主题演讲。 犀利观点如下: 

1、我们目前的定位很简单,就是要让老师在大数据、人工智能的支持下,利用一些人工智能工具和系统的结合,使平常的操作变得简单,减负增效。

2、很多高中生坐在课桌前,做的练习册比人还要高,但实际上他刷的很多题都是重复无效的。

正文:

很高兴今天给大家接着分享这个话题“人工智能如何赋能教育评价”,因为我们是做评价的,所以我们谈谈怎样来赋能教育评价。

简单介绍一下个人的经历,以前我在大学工作了10年,研究认知语言学,后来自己开设了培训机构,学生规模有6000多人的少儿英语培训,两个省三个市做了八年,2011年去了香港大学跨专业读教育学博士。2014年从香港回来以后,从事教育大数据,围绕着国家的新高考来做。

今天的话题在讲人工智能,我在读书的时候很喜欢引用吴军博士的这句话,这是一个智能的时代,无数据不智能。

人工智能不单是教授技能

大家都在谈智能教育,都在谈人工智能的学习,当然现在我们在做的工作可能还不能称之为自适应学习,我们的测评系统现在只能做自适应测试。

从教育的角度来讲,我们在采集数据。其实大家采集的数据无外乎两大类:

一类是我们说的行为数据;

一类是学习本身的学习数据的分析。

我们目前采集的数据,没有学生在课堂上的行为数据抓取,我们的学业评价完全是围绕着学生学科学习来做的。

那么,我们的人工智能除了教授学生技能、知识点以外,能否育人?我们目前的测评已经不单是知识维度的评价,而是围绕着国家在2011版新课标做的三维课标:知识技能能力、情感态度与价值观、方法过程策略,我们围绕着这个三维来做的。

在去年年底,今年年初的时候,教育部提出了高中生的核心素养评价,里面也可以看到能力模块和思维倾向模块。我们曾经做过很详细的对比,通过思维倾向和能力模块,把核心素养涵盖在内,当然不可能表述完全一致,但是基本上可以涵盖。

测评大数据的价值是什么?

公司从起步到现在,一直在服务B端市场,目前已服务1500家全日制学校,600多家培训机构,15个地市教育局,今年还和省平台进行合作。

从教学管理、智能教学、学习资源、加强互动的几个层面来进行。目前,无论是线下考试的测评,还是线上的测试,通过数据采集,可以从这些层面来服务学校或组织,如教育机构、在线教育公司。目前,我们同他们都有很多合作,从资源建立,到整个思维诊断学习分析,从个人到班级、年级、学校、区域,以及学生的学习反馈和预测,包括个性化提升,为学校、教育局来提供服务。

我们目前的定位很简单,就是要让老师在大数据、人工智能的支持下,利用一些人工智能工具和系统的结合,使平常的操作变得简单,减负增效。

我们可以让老师自动上传整道题,并进行自动切割,包括知识点的标定、技能维度标定、能力维度标定,这是一个人工智能小工具的应用,我们还不能说语意分析,尤其是NLP技术这块的语意分析,还不能完全做到自动化,但题目的切割和知识点的标定,以及后面几个维度的自动标定这方面,这个系统是可以完全实现的。目前像衡水中学这样有名的高中,都是我们的客户,我们也帮助他们建立了自己的校本资源库。

那么,我们在帮助B端市场的同时,老师和教育机构怎样用这些AI的工具减负增效?

大家今天都在谈自适应学习,所谓自适应学习的前提是什么?必须有自适应测试。因为后面要进行学习路径规划,根据学习的知识图谱或者它的认知来推送它的学习内容。但是现在在国内,大家做知识空间地图、知识树比较多,但是真正做知识图谱的,恐怕还没有人能够做到,一旦学生的认知树是重叠的,就非常难处理。

我们是通过人工智能的方式,做了一些自适应测试的工作,在6个地级市,通过教育质量检测的方式做了50万学生的工作,用了3个学期才做了英语和数学,初高中的英语和数学的自适应测试。

目前通过D-CAT理论,诊断性自适应测试,计算机自适应测试的方式,可以通过模型的设计,设计10~15道题,类似于托福机考的技术,学生第一个题上来是均值难度,做完以后算法会迅速的判定这个学生的对错,是提升难度,还是降低难度。

目前,我们的算法可以做到,每推送一道题的耗时约0.0172秒,基本感觉不到延时。

所以我们可以让学生,通过很短的时间,不再狂刷题,因为用传统的经典测量理论,以做区分度的方式来命题,难度系数加区分度,导致前20%的学生,其实80%的题跟他没有关系。后20%的学生,其实前80%的题也跟他没有关系。

所以测量的公平性和效率,通过自适应测试的方式,就可以得到很好的解决。希望能够降低学生的作题量,别再狂刷题了,很多高中生坐在课桌前,做的练习册比人还要高,但实际上他刷的很多题都是重复无效的。ETS在20年以前发表的一篇学术论文研究就表明,通过自适应的方式,可以降低学生50%的做题量,达到同样的测评精度,意味着它的测试效率比传统的测量理论,一千人、一万人都做同一张试卷的效率高很多。

不仅服务B端,也服务C端

不管从B端服务,还是从C端服务方面,我们现在做的一些工作,都围绕着诊断性评价和自适应测试,目前我们的客户服务的主要是两大类:

一方面是教育局层面,全区的教育质量监测。因为大家知道,在新高考模式下,整个全区域的教育资源的投入和产出是否均衡,教育局每年都要做大规模的教育质量监测。我们目前不单可以通过学业的方式,把非智力因素,不单是学生的学习情况,包括它的非智力因素,比如说在新高考模式下的选科、学生的职业倾向、学业兴趣数据和学业能力跨学科做出来,对走班选科也会进行指导建议。

所以整个新型教育质量监测,我们可以通过全区域的,比如一个地级市的区域,指导到学校层面和学生层面。

另一方面,还包括个人测试。我们在2016年,耗时3个学期,和6个地级市通过教育质量监测免费提供服务的方式来进行服务置换。之所以耗时3个学期,做了50万人的工作,是因为要做自适应测试,前提要把一个学科里面的所有知识点培养出来,把学生的能力均值情况计算出来,这样计算机后面所有的参数和模型才能够得到矫正。

此外,在整个在AI技术如何服务教育测评方面,我们做了两大方面的尝试:

第一,教育局、学校层面,让老师少干一点工作,并让他们的教学更有针对性。我们认为教育应该由三个大闭环组成,一个是我们说的教育实施环节,比如说大家做的线上双师课堂、线上的直播课、线上一对一。

教育实施的好与坏,怎么来体现呢?一定是通过评价的方式来进行反馈,所以我们目前做的是评价环节,目前还没有涉及教学内容环节,我们认为每个企业都有自己的基因和自己擅长的方向。

以创新驱动为指导,以提升创新创业信息化综合实力水平为目标,为创新创业信息化发展做贡献。


CopyRight © 版权所有: 中关村众恒创新创业信息化发展研究院 技术支持:北京创新创业信息化技术服务联盟 网站地图 XML


扫一扫访问移动端