面向新时代 评价新人才 ——【专题论坛十】外语测评与教学发展

1

“外语测评与教学发展”专题论坛发言人合影

第三届全国高等学校外语教育改革与发展高端论坛于3月24日在北京开幕,论坛由15场主旨报告及12场专题论坛组成,其中“外语测评与教学发展”专题论坛围绕测评理论研究、测试任务设计和校本考试开发等方面进行了专项研讨。

“外语测评与教学发展”专题论坛分上下两场,分别由上海理工大学刘芹教授和浙江工业大学楼荷英教授主持,来自全国的十位语言测评领域知名学者到会发言,与到场的高校教师分享研究成果、交流经验心得、共探测评之道。


试探基于写作任务的多元评价和反馈智能系统的构建

2

清华大学 张文霞教授

张文霞教授首先对课程测试如何落实大学英语测试目标和大学外语教育目标提出了疑问,引导与会教师反思当前语言测试形式及其优化方式。在明确了单一评价手段的不足后,张教授以“促学评价”理论为基础,系统介绍了多元评价和反馈智能系统。该系统基于大学写作任务,以鼓励学生自我反思为导向,融合机器反馈、教师反馈和同伴反馈为一体,具有针对性、科学性、开放性和高效性的主要特点,为实现“以评促学”提供了新的解决方案。


构建促进深度学习的表现性评价

3

东北大学 赵雯教授

赵雯教授首先回顾了中国、美国、欧盟、OECD等国家或国际组织提出的核心素养框架,随后指出,面向21世纪的学生应该成为“能够主动适应数字化环境,具有开拓创新与积极行动的自我发展能力,能有效地使用信息,有数字化生存能力以及可持续学习能力”的人。因此,评价也应从“传统的对浅层知识和浅层理解进行评价”,向“基于互联网+的课堂嵌入式表现性评价”转变。赵雯教授展示了其研究团队构建的“基于任务的表现评价库”。作为智能学习助手,该平台对于促进深度学习、智慧学习具有重要意义。


2006-2017年我国外语测试

实证研究:回顾与展望

4

对外经济贸易大学 江进林副教授

针对当前我国外语测试研究存在的问题,即缺乏对近十年的研究进行梳理以及实证研究有待发展,江进林副教授通过内容分析法,对2006-2017年我国12种外语类主要期刊发表的外语测试实证研究论文进行了梳理,探究了国内外语测试实证研究的整体趋势、内容和特点。同时,江进林老师对我国外语测试实证研究提出相关建议,如关注中小学生、研究生等群体,拓展研究较少的领域,以及关注国际前沿研究并提高研究实用性。


验证性因子分析多组比较在语言测试构念效度检验中的运用

5

外交学院 许宏晨教授

许宏晨教授提出,验证性因子分析在检验测试构念效度上较探索性因子分析更具优势,但目前语言测试对验证性因子分析的使用集中在单一样本检验上,使用多个样本对同一个理论构念进行跨组比较还不多见。为此,许教授在这方面做了尝试。他提出两个研究问题:“英语学习态度”和“英语教学态度”两个维度构成的量表是否可以反映“英语态度”这个构念?如果可以反映这个构念,那么它在“性别”这个调节变量上是否有差异?研究分为“考察构念组成部分与数据的拟合程度”、“整体考察构念与数据的拟合程度”、“以‘性别’为分组变量考察构念与男生组和女生组数据的拟合程度”三个步骤。通过这一研究实例,证明了多组比较的验证性因子分析对构念验证检验更为妥当、可信。


基于CEFR的中国高校学生英语能力现状及其影响机制研究

6

天津理工大学 常海潮副教授

常海潮副教授围绕中国大学生英语能力现状及其影响机制的研究进行了发言。《国家中长期教育改革和发展规划纲要(2010—2020年)》、《大学英语教学要求》和《大学英语教学指南》都强调学生综合运用语言的能力,但目前很多高校仍以通过大学四六级为教学目标。针对这一现象,常海潮副教授对大学生英语能力现状以及大学生英语学习投入对英语能力的影响机制进行了研究。该项研究使用CEFR(欧洲语言共同参考框架)测量了我国3431名大学生的英语能力水平,并通过结构方程模型对其影响机制进行分析。根据研究结果,常海潮副教授指出,高校英语教师须优化课堂教学,提升学习动机,训练学习策略, 使高校学生英语能力充分提高、均衡发展。


融合思辨能力与跨文化交流能力的语言测试任务设计

7

北京外国语大学 杨莉芳副教授

杨莉芳副教授从新时代中国的人才需求入手,指出当前国家对高水平外语人才的要求已超出传统定义上的语言能力,还包括思辨能力与跨文化交流能力。因此,为了科学有效地选拔新时代国际人才,语言测量工具也应该从传统的以语言能力为单一构念,过渡到融合思辨能力、跨文化交流能力的复合型构念。据此,杨莉芳老师以北京外国语大学中国外语测评中心研发的“国际人才英语考试(高级)”口头沟通任务三“谈判决策”为例,从任务形式、任务内容和评分标准三个维度探讨上述能力如何在语言测试任务中得以实现,为新时代语言测试任务的设计提供了借鉴。


校本语言测试的开发与质量监控:以中国人民大学英语口语水平测试为例

8

中国人民大学 刘力讲师

刘力老师首先从内容、特点和目标三个方面介绍了中国人民大学英语口语能力标准(RUC-SOPE),该标准的研发参考CEFR(欧洲语言共同参考框架),对学生在口语表达、信息获取和文化传递等方面做出了要求。在该能力标准的基础上,中国人民大学研制了英语口语水平测试(RUC-TOPE)大纲,对测试形式、能力标准、评分标准和成绩报道进行了明确。以此校本考试为例,刘力老师从考试研发、评分标准建立、考试质量保证以及考试反拨作用几个方面,进行了详细阐述,为与会教师提供了参考范例。


一项校本英语水平测试的设计与开发研究

9

北京师范大学 林敦来副教授

林敦来副教授首先对校本测评的主要特征和理论依据进行分析,指出校本英语水平测试的开发契合《大学英语教学指南》对课程评价的要求,即“从传统的‘对课程结果的终结性评价’向‘促进课程发展的形成性评价’转变”。因此,各校在普遍根据实际情况和需要建立起满足学校个性化需求的大学英语教学模式的同时,应研发出与之配套的校本评价和测试。林敦来老师以北京师范大学一项校本英语水平测试——《综合英语阅读》评价体系为例,详细介绍了它的内容和质量监控体系,为同类校本测试的开发提供了参考。


基于校本考试的英语听力能力认知诊断分析

10

浙江大学 闵尚超副教授

闵尚超副教授的发言围绕校本考试结果如何与教学相结合。报告首先对认知诊断测试的研究现状做了说明,随后详细介绍了浙江大学英语水平考试(听力部分)及其相应研究,并建议通过认知诊断分析为每位考生建立起一个更细致深入的个人能力档案,把群体诊断报告和个体诊断报告相结合,从而更好地服务于学生自学与教师教学。报告最后指出了认知诊断测试所面临的问题,即认知诊断应用难度高,发展不平衡,粒度大小和反馈形式难确定,为今后的测试开发提出了新的挑战和研究方向。


英语写作测试评分研究现状和展望

11

北京交通大学 冯蕾副教授

英语写作测试的评分质量不仅影响考生的作文得分,更对教学具有反拨作用,然而,写作测试的评分结果常常受到质疑。在此背景下,冯蕾副教授对当前英语写作测试评分的研究进行了回顾和综述,包括对评分标准编制、评分结果、评分策略、评分模型、评分过程模式的研究等。基于研究综述,冯老师提出了在评分标准研究、评分行为、研究方法等几方面的研究展望,期冀为未来的相关研究提供启示。


近四个小时的专题论坛从测试任务设计、课堂评价方式、校本考试研发等多个维度对语言测试领域的现状和未来发展方向进行了探讨,引人深思。报告结束后,参会教师踊跃提问,就机器评分、通过测评对教学进行干预、测评与大数据相结合等问题与主讲人进行深入交流。我们相信,这次专题论坛所传递的理念、所交流的经验、所碰撞的火花一定会助力我国外语测评方式的优化,推动高校外语教学的发展。