首页 科技 正文

逼学员舞弊的AI判卷教师

边策 萧箫 发自 凹非寺量子位 报道 | 公众号 QbitAI

上学的时刻,师长教师一定教训过你:碰着不会的问答题,就算是瞎写,也要随意写两句。或许阅卷师长教师表情好,可能会酌情给分呢。

师长教师会不会给分,不知道。然则,AI真的会给分,甚最多是满分,即使你甚么也不知道。

比来,一个号称处事于美国2万所黉舍的AI传授教化平台翻车了,行使它的裂缝去“裸考”就可以轻松合格,切实其实就是“学渣福音”。

翻车历程

工作的缘由是如许的:

一名美国度长Dana有一天发现,她正在读七年级的儿子倏忽哭了。由于有道汗青题,孩子只拿了50%的分数。

这意味着他必需把剩下标题问题所有答对,不然就会不合格。

这道题问的是:君士坦丁堡的地理位置是若何匡助拜占庭帝国变得富有强大年夜的?

而孩子的答复是根基没有问题的。(请疏忽最后一句话,这句话不是孩子写的,缘由后面自见分晓。)

一最早,Dana感觉,改卷子的师长教师是不是是太刻薄?她如许安抚儿子。

然则孩子说,他把谜底提交1秒后就获得了分数。所以Dana意想到,批阅试卷的应当不是人,而是AI。

Dana敌手艺有一定的体会,她感觉,AI系统极多是按照关头词来评分。为了验证本身的设法,他把儿子的作业做了一遍。

她考试考试在谜底里到场“财富、商队、中国、印度”,也就是上图中的最后一句,横竖能想到的关头词都一股脑儿填进去。

事业呈现了,这道题她拿了满分。即使这些关头词之间没有任何串联。

单词沙拉——Dana找到了一种获得高分的好举措,就是把所有可能的关头词组合起来,总有能蒙对的。这类方式对短问答题稀奇有用。

当然,这只是Dana本人的意料。实际上这家公司在官方的匡助中央里已承认了:我们就是遵照关头词的百分比来评分的。

没有关头词0分,有一个就拿一点分,所有射中拿100分。

绕过AI的做弊“妙招”

供应这项AI评分手艺的公司叫做Edgenuity。

新冠疫情让美国的良多黉舍没法开学,学生只能在家进修,所以良多黉舍就用上了Edgenuity的长途传授教化和考试方案。

而Edgenuity的AI评分问题早已有之,只是比来才被外媒发现。

一周前,有网友抱怨本身只拿了0分,良多人就指出了Edgenuity是靠关头词评分的事实。

一名多年前利用过该系统的高中生说,他昔时就发现了这个做弊方式。当他完全不知道怎样答题的时刻,就在答复框里填入各类单词,而且“常常会生效”。

还有学生发现,把问题粘贴到谜底里也可以或许得分,由于问题里常常包孕了关头词。

想昔时师长教师说过,碰着不会的问答题,把问题抄一遍。诚不欺我也!AI真的比阅卷师长教师还好措辞。

有些学生示知记者,他们在上学期都利用了这个技术,并每次都考到了不错的分数。

假如你去Google搜索Edgenuity,那末就会发现,“如何在Edgenuity里做弊”一向处在热搜的位置。

在Reddit论坛的Edgenuity板块里,学生们公开会商着若何做弊。这款号称防做弊、主动判卷子的Edgenuity其实裂缝百出。

进入这个链接后,真是打开了新世界的大年夜门,本来美国中学生对如何在AI系统中做弊有着颇深的研究。

Edgenuity不是可以免学生开网页找谜底吗?没问题。

设置阅读器在封闭时删除缓存和Cookie,打开别的一个阅读器窗口作为搜索谜底利用,满分so easy。

其实也没需要这么麻烦,而今智妙手机这么发财,去Brainly(近似于国内的作业帮)找一下谜底就好。横竖手机和电脑是分隔的嘛。

也就是说,Edgenuity必需和人类教师连络,需要人类帮手在线监考、审核阅卷后果,如许才能阐扬其功能。

明显,美国的一些教师偷懒了。

逾越2万所美国黉舍在用

那末,这家分娩“人工智障”的公司Edgenuity,事实是甚么来头?

事实上,1998年就成立的Edgenuity,是美国K-12市场的在线课程和传授教化处事的领先供给商。

2011年,Edgenuity以5000万美元被Weld North收购后,今朝已有逾越2万所黉舍利用这个传授教化平台,包孕全美排名前25的学区中的20个。

也就是说,全美国教育资本最顶尖的地区,80%都能见到Edgenuity的身影。

不外,本来的Edgenuity,首假如一家教育内容供应商,但它于2016年收购了一家名为Compass Learning的教育软件供应商。

Compass Learning成立于1964年,主要负责做小学和中学阶段的进修评测软件,被收购时,已有逾越200万个美国学生、1万多所美国黉舍在利用。

前段时候有网友回忆起曾被Compass Learning相干软件放置的悚惶,在社交媒体上获得了网友的剧烈响应。

而今由于疫情缘由,大年夜部分美国黉舍将眼光转向了在线教育课程,个中一些黉舍更是直接将传授教化和考试都外包给了像Edgenuity如许的在线教育公司。

针对此事,Edgenuity做出了回应,称AI打分永久只会供应“算法上的指点”,不克不及决意学生的课程成就。

Edgenuity不会利用算法去取代教师评分,只会供应一个打分参考。师长教师们有能力接管或否定举荐的分数。AI不会为测试打分,也不会决意学生的测试成就。

但即使如此,Edgenuity的影响却还在美国扩大年夜。

据美通社消息,Edgenuity近日获得了2020年的卓着传授教化奖(Tech & Learning Awards of Excellence),全球教育最具代表性之一的EdTech奖项(the EdTech Cool Tool Awards),美国“软件与信息财产协会”(SIIA)唯一焦点大年夜奖(the CODiE Awards),和手艺教育奖(the Tech Edvocate Awards)。

这些“颠末专家评估的”专业手艺奖项,使得Edgenuity成为在线和K-12教育更具影响力的公司。

AI阅卷师长教师,国内也有

事实上,AI改卷师长教师,并不是只有国外才有。

早在2017年,阿里就推出了AI批阅中文试卷的系统,产出了“全球第一份机械人批改的作文”。

据搜狐报道,在浙江外国语学院国际学院,阿里AI为来自俄罗斯、韩国等11位留学生批阅了中文试卷,“批阅一篇试卷的时候平居只需要40秒”。

切实其实比批阅高考作文的师长教师看得还快。

不外看起来,AI改作文的主要标准,是集中在“改正语法”上。

例如,在“请写一写你的欢愉爱好”的命题作文下,一逻辑学生提到本身的欢愉爱好是中文,并在作文中写道:“中文的难点并不是是字,而是像女朋侪一样善变。我是不会摒弃的,除非中国人也摒弃我才会摒弃。”

△ 图片源自搜狐

对这两句话,一名汉语系传授透露显露:“我教了14年的中文,不当真看还真没看出问题。但事实证实,这两句话都是病句,存在杂糅和反复的弊端。”

据悉,阿里开辟这套阅卷系统的主要目标,是教外国人学中文,所以在语法方面会有严苛的要求。

假如说阿里的阅卷系统照样个小局限的考试考试,科大年夜讯飞已将之利用到实际考试中了。

据体会,早在2016年,我国教育考试中央就和科大年夜讯飞成立告终合尝试室,配合睁开人工智妙手艺在阅卷、命题、考试评价申明等方面的研究。

而在2017年,湖北襄阳就已正式在中考评卷工作中引入了该机械评分系统作为评分辅助手段。

据体会,这个系统基于科大年夜讯飞自立常识产权的手写辨认、天然措辞理解、智能评测等人工智能焦点手艺设计研发,可以或许实现对除选择题之外的所有题型的空白题检测。

不但如此,还能改主不雅题,对语文作文、英语作文、英语翻译、文综类简答题、英语填空题题型进行较量争论机灵能评卷。

同时,也能针对语文作文与英语作文,有用地检测出考生剽窃范文的异常答卷,有用下降主不雅题人工评卷的工作量。

然则,却有微博网友发现了国内AI阅卷系统翻车的环境。

从图中来看,这个名为奇点学院的APP,在批改数学题的时刻,要求谜底只能与它的公式“完全一致”,其他步调即使是对的,也不给满分。

△ 图片源自微博 @安托利娅

哪怕是推导历程无误,谜底正确的环境下,10分的标题问题也只给了7.5分。

那末,你相信AI改试卷比人平易近教师靠谱吗?

参考链接:

https://www.theverge.com/2020/9/2/21419012/edgenuity-online-class-ai-grading-keyword-mashing-students-school-cheating-algorithm-glitch

https://twitter.com/DanaJSimmons/status/1300997133311508480

https://www.reddit.com/r/edgenuity/comments/gbmx2l/how_do_i_successfully_cheat_on_edgenuity_without/

https://finance./news/edgenuity-announces-recognitions-tech-learning-140000177.html

非特殊说明,本文由原创资讯网原创或收集发布。

转载请注明本文地址:http://www.68nw.com/kj/1238.html