量子比特报告 | 公众号QbitAI
我,一名科技编辑,最近和外国老板互发邮件,感觉通过六级后我的英语写作能力越来越差。
如何使用子句? 时态正确吗? 看着对面编辑锐利的目光,那一刻,我真想问问自己,为什么没有好好学习,一天天进步。
于是,我决定学习英语写作!
如果你想提高自己的技术,不自己写总是有点没有意义。
那么问题来了:我的文笔好不好? 谁帮我纠正一下?
其实从小学开始,学英语一直是个难题,小学、初中、四级六级、雅思托福……如何提高英语作文。
尤其是各种考试,都有严格的评分标准,但怎么能一直有经验丰富的阅卷老师在身边帮助进行有针对性的修改和提高呢?
网易有道的胖友听完我的烦恼后向我招手:你看我手机上这个红色的App。 它有一个新推出的人工智能,可以帮助你批改英语论文。
是的,如果AI真的能准确评分,甚至给出复习建议,像我这样的学生不就可以随时随地练习英语作文到成功了吗?
经过一番研究,我发现有不少产品具有英语作文人工智能批改功能:网易有道词典、微软iWriting(小影)、、Grammarly……
想到目前宅在家里的大人和孩子可能也有同样的烦恼,我决定亲自测试一下这些AI是否可靠。
哪家公司AI论文审稿比较好?
经过初步筛选,我挑选了几款免费好用的播放器参与评测,分别是:网易有道词典AI作文批改、微软爱写作、Grammarly免费版。
那么,话不多说,让我们直接进入游戏吧。
第一轮:手写识别
例如,中小学英语考试、大学英语四六级、研究生英语考试、雅思、托福考试,在实际考试时都需要在纸上书写,所以学生在练习时往往会选择手写。
写完一次之后,再打字就有点麻烦了。 如果我拍一张照片,AI就能自己识别出我写的东西,那就方便多了。
有道AI作文批改和微软iWriting均支持图像识别功能。 至于Grammarly……由于没有这个功能,这位玩家选择暂时退出游戏。
我尽力用非标准测试字体写了一篇文章来测试两位参赛者。
我们先来看看有道AI作文批改的表现:
识别的还是比较准确的,有修正的地方也没有出现误识别的情况。 需要手动修改的地方很少,基本上都是手写体太大时字母之间的空格,所以识别就变成了两个。 字。
我们来看看微软小影的结果:
由于我没有写标题,小影被迫承认第一段是标题。 如果忽略这一点,识别准确率也是很高的。 但标点符号的识别不如有道AI作文批改灵敏(上图中红色标注)。
还有一个小问题:如果你写的两个字间隔较宽,小影会识别出多余的空格。 如果不仔细检查,将会影响下一步评分的准确性。
另外,与只有网页版的微软iWriting网页版相比,手机上有道词典可以直接拍照进行识别,无需将照片传输到电脑上,更加方便。
第二轮:纠错能力
如果说OCR只是影响用户便利性的一个细节,那么AI批改论文的重点当然是能否准确捕捉到论文中的Bug。
有道AI作文批改、微软小影、Grammarly都具有识别文本中语法错误并给出修改建议的功能。
这一轮我们用一些单句来测试谁的调试能力更强。
例1:当女孩要离开时,她发现树上有一个老乞丐,眼神愤怒而冷漠。
存在时态错误和拼写错误。
有道发现4处错误:
具体判断为:①疑似用词不当,建议将“将离开”更正为“离开”; ② 怀疑动词时态错误,建议将“fount”更正为“found”; ③疑似名词误用,建议将“乞丐”修改为“乞丐”; ④介词“at”疑似多余,建议删除。
把问题发给微软小影,它也发现了这4个错误,并给出了单词替换建议。
具体判断为:①动词时态错误,将“将离开”改为“离开”; ②动词用法错误,将“fount”改为“found”; ③单词拼写错误,将“乞丐”改为“乞丐”; ④ 冗余,删去“at”; ⑤ 建议用“苦”、“硬”、“贱”代替“冷”。
最后看一下Grammarly的判断。
Grammarly的免费版本指出了一个单词的拼写错误,并建议我升级到付费版本。
同样,在“但是这种压力并没有阻止我想去参加我们学校的大活动”这句话中,有道和小影都指出了三个错误:
介词“to”改为“about”; 动词“attend”改为“attending”; “biggist”拼写错误,改为“biggest”。
Grammarly的免费版本仍然只指出了“biggist”的拼写错误。
看来,就免费体验而言,Grammarly的语法修改还是比较简单的。
最后额外加试题有道AI作文批改和微软小影。
例2:在一个寒冷的早晨,我看着一个女孩在外面给我买面包和牛奶。
对于AI来说,识别这句话的难点在于同一个物体涉及多个错误。 拼写错误“fiont”之后是错误使用介词“for”。
面对这个问题,有道成功识别出了“in the front of”整个单词,不仅指出了拼写错误,还发现了短语介词的错误。
微软小影的修改有点让人摸不着头脑。 难道他在这句话中感受到了主角的内心戏?
本轮比赛结束了,我们简单总结一下。
它也是免费的。 与中文世界的两位玩家相比,免费版的 Grammarly 有着很大的差距。
不过,Grammarly 有一个插件版本。 直接写邮件时,可以边写边改正错误。
但如果你想在人工智能的帮助下提高你的英语写作能力,免费版的 Grammarly 可能不是最好的选择。
有道AI作文批改和微软小影都比较符合国内英语学习路径,整体表现还不错。 然而,当错误复杂度增加时,有道的性能稍好一些。
第三轮:评分准确度
另一个重要的点是评分的准确性。
毕竟,考试有严格的评分标准。 能否按照标准给出准确的分数,对于广大需要参加考试的同学来说,仍然是一个非常重要的参考指标。
有道AI作文批改和微软iWriting均支持多个学习阶段的英语作文批改,涵盖小学、初中、高中、四六级、雅思托福和研究生英语。
至于Grammarly,作为一款“进口”应用,不太适合我国应试国家的风格。 它不具有评分功能,无法区分学术阶段和考试类型。
不过,使用 Grammarly,您还可以根据自己的情况进行一些个性化设置,包括 Audience、Formality 和 Domain。
问题仍然存在,免费版本的选项有限。
我在网上找到了一篇雅思范文,分数是7.5分。 人类老师对这篇文章的评价是词汇丰富、语法点丰富、论证全面。
那么AI会如何评价这篇文章呢?
我们先来看看有道AI作文批改的答卷。
有道给这篇文章打了8分,并对它的词汇、结构、语法、内容进行了评分。
点击查看评论,还可以看到AI阅卷官从单词、句子、章节入手对作文的整体评价,对一些更高级的词汇的推荐,以及好词的巩固。
...词汇比较丰富...文章比较流畅...词汇基础扎实。
这样的评论与人类教师的判断基本一致。
同一篇文章中,我们看看微软小鹰是怎么说的。
也给了8分。 更特别的是,小英会统计作文中使用的教学大纲词汇、逻辑连词和从句的数量。
与有道给出的整体评价报告不同,小影给出了四个评价指标:文章结构、句子关系、关联度、展开度。
需要注意的是,如果要引用文章内容的相关性指标,必须填写文章标题。 至于拓展的指标,我反复尝试过很多作文,从高考作文到雅思作文,都稳定在一星……
结束了这一轮的比赛,我们也做一下总结。
总体来说,有道和小影的评分结果根据不同考试类型与考试评分标准相符,具有参考价值。
在细节方面,有道会根据字数、词汇使用情况、句子逻辑和衔接等方面给出综合评价,而微软小影会给出逐点建议,主要关注文章结构和句子之间的关系。
不过,微软小影在测试过程中出现了一些小bug。
例如,6级作文满分为15分,但评分界面上的最高分是25分。
技术落后
看来有道词典用来批改论文的AI确实有两把刷子。