深入剖析!蓝思、 MAP、Star-test这3大热门测评体系大解析!

蓝思、MAP、Star-test 是教育领域 3 大热门测评体系。蓝思主要衡量学生阅读能力与文本难度,用数字区间直观呈现阅读水平,方便匹配读物 。MAP 是电脑自适应测试,覆盖 K-12 年级,从数学、阅读、语言使用等多学科动态评估学生学业进展,助力个性化教学。Star-test 同样自适应,专注阅读,能快速精准定位学生阅读能力,提供针对性提升建议,让学习规划更具科学性。


Lexile蓝思测试

蓝思指数其实包含两个指标:

  • 文本难度指数(Lexile Text Measure)

  • 阅读能力指数(Lexile Reader Measure)

最终,这两个指标通过一套评分算法结合在一起,在阅读者和阅读材料之间建立匹配关系。以美国中学生为例,学生普遍的阅读能力和教材要求的阅读能力之间的关系大致是这样的:

340e22cbd6371088d2820485fcc795e.png


蓝思指数可以说是目前国际上信度最高的阅读能力衡量指标了,国内家长们非常关注的托福、小托福考试中,都会以蓝思指数作为考生阅读能力的评估指标。

蓝思指数本身并非是一项测试,因为它只是一个框架体系,并没有用于测试用的题目。目前大家比较熟悉的,除了通过参加托福或者小托福考试后,在成绩单中明确看到以外,还可以通过一些第三方机构来进行测试。


MAP测试

蓝思Lexile指数更像一个工具,我们关注的是蓝思值可以带来的拓展作用。而如果要完整地定位孩子的水平,光一个蓝思值还是不够的,这就需要更为专业化的测试——比如,MAP测试。

MAP测试(Measures of Academic Progress)起源于美国,至今已经有40多年历史了。它致力于从Pre-K开始到大学入学前学生的学科能力测评。

13b6d0710909fddd245ab0d01013049.png

MAP测试是一种“自适应”的测试,什么是“自适应测试”呢?简单来讲就包含如下几个步骤:

  • 首先,MAP会根据美国教学大纲CCSS标准以及国际通用的AERO标准,将所有知识点进行分类、拆解、结构化。

  • 然后,MAP会基于项目反应理论和教育测量学设计一系列的题目,这些题目对应到之前细分下来的知识点,每一个知识点都会有非常多的题目,这些题目会被标上不同的难度系数。

  • 学生进行测试时,系统会通过学生答题的正确与否调整推送的题目。比如学生在某个知识点上连续答错,那么系统就会推相对容易的题目,直到学生能在这个难度的知识点上保持一个比较稳定的正确率。

这种测试可以通过动态调节,确定测试者的最终水平范围。并且可以精确地指出测试者在哪个知识点上有缺环,从而为老师和家长能对症下药提供依据。

不仅如此,MAP的测试题目会不停的进行更新换代,保证与大纲内容的高度统一,以及被测试者不会遇到完全相同的题目。

这里要说明一点,MAP不仅仅是英语阅读能力的测试,而是分成了四个部分:阅读、(语用)语法、数学、科学。所以说是一项综合能力的测试。

另外,在英语部分也能测试出学生的蓝思指数,同时,基于MAP自适应考试的特点,MAP提供的蓝思指数不受限于测试者所处的年级,不论学生英语阅读能力高于或者低于其年级水平,都能准确评估其蓝思指数。然而,蓝思指数只是MAP中的一小部分。

95586c8bee1bbc693456ac58515b704.png

之前说过,蓝思指数有它的局限性,因为它仅仅从阅读内容的物理层面(词频和句子长度)进行了量化。而MAP测试不同,除了用蓝思指数显示测试者的基本阅读能力以外,更加注重对于不同文体的阅读能力,包括故事体、文学体、非文学体等多种形式。对于文章前后关系、对应语境、知识背景等很多细节内容也有所考察。


MAP测试除了可以测出英语阅写综合能力,给出具体的强项和弱项点以外,更重要的一点是,它可以清晰的给出被测者在所有参加测试的人中的水平。


STAR-test测试

image.png


这份报告中,我们重点来看几个指标:

  • PR——Percentile rank,是指孩子目前的得分能够超过美国学生的百分比,例如,进行3年级的测评,结果是95,就代表这个测试成绩超过了95%的美国3年级学生。

  • GE——Grade equivalent,是指孩子目前的阅读水平相当于美国孩子几年级第几个月的阅读水平,也就是我们最常说的GE Level,例如6.3,就代表相当于美国学生6年级第3个月的阅读中位值。

  • Est. ORF——Estimated oral reading fluency,是指孩子目前每分钟能够流利阅读的文字量

  • ZPD——Zone of proximal development,是指适合孩子阅读书籍的分级范围。(这里使用的数字是STAR配套的AR分级指数,可以从www.ARBookFind.com中寻找资料)


从这三个指标中我们可以看出,STAR-test有以下几个特点:

  • 能够给出孩子在同年龄段孩子中的水平定位

  • 能够给出孩子在阅读文章时的流畅度

  • 能够辅助孩子进行分级阅读

这份报告和MAP测试的报告相比,界面上更加“亲民”一些,具体指标都以数值的方式体现,同时每一项指标都配备了相应的解释,不需要太多统计知识也能轻松读懂。同时机构也可以根据这份报告来针对性的开展分级阅读的后续训练。

备注:STAR-test所采用的是英国的AR分级指数,和蓝思指数一样,AR指数的作用也是用于帮助读者匹配适合的读物。读者去报告中给出的网址即可通过输入报告中的ZPD值来找到自己合适的读物。



测评系统本应是家长缓解教育焦虑的得力助手,如今众多机构设置测评环节,从本质而言是有益的。它能帮助家长更清晰地了解孩子的学习状况,从而做出更合理的教育决策。


然而,现实中部分测评存在严重问题。若一份测评主观性过强、标准模糊不清,非但无法减轻家长的焦虑,反而会像文章开头描述的那样,进一步加剧家长的担忧。因为不明确的测评结果让家长难以判断孩子的真实水平,也不知该如何助力孩子提升。


本文着重介绍的蓝思、MAP、Star - test 这三项测评备受欢迎,原因在于它们都依托大量客观数据,有着清晰明确的评价指标。这并非意味着只有采用这三项测试的机构才是优质机构,但家长在为孩子选择测评时,务必确保测评有明确标准,而非充斥着一些毫无实质意义、华而不实的图片展示。毕竟,只有准确客观的测评,才能为孩子的学习提供有效指引 。


免费获得新闻资讯

背景提升相关推荐