ETS对需要展示学术或与工作相关目的的英语熟练程度的成人和较旧的青少年英语beplay网站网址学习者的全球评估进行支持历史悠久。我们对近beplay网站网址年来的年轻学习者评估的研究为新引进的评估提供了强大的研究基础,以全球范围内的小学和中学生 -beplay sports测试和托福大三®标准及综合测试。
我们在该beplay网站网址领域的研究具有以下目标:
- 有效性和公平框架-我们开展基础研究,目的是提供概念框架,指导开展公平beplay网站网址有效的评估实践。
- 测试设计框架和原则- 我们开发新的测试设计框架和理论上和实际应用的原则。
- 质量- 我们维持持续的研究计划,以支持和不断改进现有的测试计划。beplay网站网址作为这一关注质量的一部分,我们还通过了解语言开发,确定可能影响测试的因素,了解可能影响试验的因素,了解速度行为和改善考试评分的beplay网站网址实践。
- 创新- 我们寻求设计新的措施,特别是那些利用新方法和语言技术来支持英语学习和教学的措施。
beplay网站网址与ETS测试程序相关的研究
- 这Toefl IBT.®测试- 了解更多关于我们进行的研究,以支持学生使用beplay网站网址英语在全球大学级别使用英语的能力。
- 这趾®测试-了解更多关于我们进行的研究,以支持评估考生在beplay网站网址全球工作场所使用英语交流的能力。
基础研究beplay网站网址
除了出版物,我们的研究专业人员已授权直接支持beplay网站网址托福®和托业考试,我们的英语学习和评估研究计划出版或资助与国际背景下的基础研究相关的工作。beplay网站网址此类研究的主题包括有效性和公平beplay网站网址性框架;测试设计框架和原则;质量;和创新。以下是一些最近的出版物:
有效性和公平框架
阐明有效性论证
M. Kane(2012)
章节语言测试的Routledge手册,pp。34-47
编辑:G. Furecher&F. Davidson
出版商:Routledge.在本书章节中,作者讨论了基于参数的验证方法,并在语言测试的上下文中提供示例。查看引文记录
验证分数解释和用途
M. Kane(2012)
语言测试,卷。29,第1页,第3页。3-17在本文中,作者讨论了两步,基于参数的验证方法,涉及(1)指定测试分数的拟议用途和解释,(2)评估拟议的解释论证的合理性。查看引文记录
评估和使用自动评分的框架
D. Williamson,X.Xi,&J. Breyer(2012)
教育测量:问题与实践,卷。31,1,PP。2-13本文提供了一个用于评估和使用自动评分的框架,用于构造 - 响应任务。该框架需要评估自动评分以及在不断发展的技术的背景下实施和维护它的指导方针。查看引文记录
有效性和性能测试的自动评分
X. xi(2012)
章节语言测试的Routledge手册,第438-451页
编辑:G. Furecher&F. Davidson
出版商:Routledge.在本书章节中,作者讨论了在不断变化的理论和实践中使用基于绩效的语言测试的有效性考虑因素,在测试有效性中的实践中。查看引文记录
基于参数的有效方法是否有所作为?
C. A. Chapelle, M. K. Enright, J. Jamieson (2010)
教育测量:问题与实践,卷。29,1,PP。3-13本文评估了两种不同方法与凯恩(2006)和1999年的有效方法之间的差异Aera / APA / NCME教育和心理测试标准。查看引文记录
我们如何调查测试公平?
X. xi(2010)
语言测试,卷。27,第2页,第27页。147-170这篇文章提出了一种方法,将公平作为有效性的一个方面,并提供了一个说明,如何在有效性论证中建立和支持公平论点。查看引文记录
测试验证方法
X. xi(2008)
章节语言和教育百科全书,第7卷:语言测试和评估,第2版(177-196页)。
编辑:E. Shohamy&N. H. Hornberger
出版商:Springer.本章综合审查了有效性概念的演变,并提出了语言评估的当前验证方法。作者还讨论了语言评估有效性研究的进步如何在其他领域的进展中受益。beplay网站网址查看引文记录
我们需要什么,需要多少证据?验证自动评分系统的关键考虑
X. xi(2008)
章节致自适应呼叫:诊断语言评估的自然语言处理(第102-114页)
编辑:C. A. Chapelle,Y.-r.Chung,&J. Xu
出版商:爱荷华州立大学本文阐述了如何将基于参数的方法应用于被称为的自动评分系统的使用的验证SpeechRater®对于托福®在线演讲测试。查看引文记录
测试设计框架和原则
年轻英语学习者的语言能力:定义,配置和含义
L. Gu
语言测试,卷。32,第1页,第21-38页本研究审查了语言要求年轻学习者在英语被用作教学主题的指导工程的环境中面临的环境。查看引文记录
定义和运作务实职能构建:审查和建议
V.T. Laughlin,J. Wain,&J. Schmidgall(2015)
ETS研beplay网站网址究报告No. RR-15-06本文是较大的研究努力的第一步,可以为英语学习者开发互动语用学习工具。beplay网站网址该工具主要旨在支持在工作场所语言领域内的语用学。查看引文记录
语言测试中的循证设计
R. J. Mislevy&C. Yin(2012)
章节语言测试的Routledge手册,pp。208-222
编辑:G. Furecher&F. Davidson
出版商:Routledge.以依据为本的设计(ECD)是设计和交付评估的概念框架。本书章节讨论了ECD可以有效地使用语言测试的方式。查看引文记录
原型设计新项目类型
S. Nissan&M. Schedl(2012)
章节语言测试的Routledge手册,pp。281-294
编辑:G. Furecher&F. Davidson
出版商:Routledge.本书章节提供了原型设计的定义,考虑了原型群体的理想特征,并讨论了原型设计可以提供新评估的设计和开发的信息。查看引文记录
案件是全面,四技能评估英语水平
D. E. Powers(2010)
研发连接14号本文为衡量测试者的全面熟练全面熟练的英语方式,包括听力,阅读,写作和说话。查看引文记录
质量
在集成写入评估中使用多个文本:源文本用作分数的预测
L. Plakans&A. Gebril(2013)
第二语言写作,卷。22,3,第3页,第217-230页本研究调查了测试者如何在集成写入任务中使用源文本,以及如何在得分水平和任务主题上不同。调查结果支持解释综合任务分数作为学术写作的衡量标准。该研究由审beplay网站网址查员托福委员会资助。查看引文记录
第二语言经验的影响和强调对口语能力评级的影响:定性调查
P. Winke, & S. Gass (2013)
Tesol季刊,卷。47,4,第4页,第762-789页本文调查了评级对考试者的第一语言的知识是否影响了评级人员如何定位于评级口头言语的任务以及对评级熟悉对评级分配转让过程的影响。该研究由审beplay网站网址查员托福委员会资助。查看引文记录
评级口腔表现中的评级L2背景作为偏见的潜在偏差来源
P. Winke, S. Gass, & C. Myford (2013)
语言测试,卷。30,第2号PP。231-252本研究调查了是否令人瞩目的熟悉程度,定义为学习考试者的L1,导致Rater Bias。发现评估者的口音熟悉是潜在的偏见来源。该研究由审beplay网站网址查员托福委员会资助。查看引文记录
大学招生学术目的(EAP)英语考试
X. Xi,B. Bridgeman,&C. Wendler(2013)
在A. Kunnan(Ed),语言评估的陪伴。PP。318-337 Malden,Mass .: Wiley-Blackwell。本章描绘了历史,调查目前的发展,并讨论了学术目的中英语的未来趋势,用于招生到后期英语中等机构。查看引文记录
散文人类和机器评分的比较:性别,民族和国家的差异
B. Bridgeman,C.Trapani,&Y. Attali(2012)
在教育中的应用测量,卷。25,1,pp。27-40本研究比较了机器和人类评估者对某些性别,种族和国家群体产生的论文评分的差异。在大多数亚组中发现人和机器分数非常相似。查看引文记录
使用来自印度的评估者进行大规模说话的测试
X. Xi,&P. Mollaun(2011)
语言学习,卷。61,4,第4页,第1222-1255本研究调查了印度语言的英语和扬声器发言者演讲测试的评分。结果表明,印度评估者以及美国的评级,在评分印度和非印度考试时。查看引文记录
L1-English和L2写入发展反馈的有效性:META分析
D. Biber,T. Nekrasova,&B. Horn(2011)
ETS研beplay网站网址究报告号码RR-11-05本报告审查和综合了以前关于个人写作发展反馈有效性的研究。beplay网站网址该地区的研究中的META分析表明,反馈是有beplay网站网址益的写作发展。查看引文记录
口语英语语言学习者探究性的缩减措施和判断
O. Kang,D. Rubin,&L. Pickering(2010年)
现代语言杂志,卷。94,4,第4页,第554-566号本研究考察了几种重音发音的声学测量方法与母语听众对口语熟练程度的判断之间的关系。言语的超分割特征被发现是口头熟练程度和可理解性的有力预测因子。该研究由审beplay网站网址查员托福委员会资助。查看引文记录
在线图中的性能方面描述任务:受图表熟悉和不同任务特征的影响
X. xi(2010)
语言测试,卷。27,第1页,第73-100页本文介绍了一项研究,其在说话测试中系统地操纵了线图描述任务的特征,目的是减轻图表熟悉的影响,这是测试中的构建 - 无关差异的潜在来源。查看引文记录
逆向语言陈规定型观念:测量听众对言语评估的影响
O. Kang&D. Rubin(2009)
语言与社会心理学杂志,卷。28,4,第4页。441-456本文调查了称为逆向语言陈规定型观念的现象,其中扬声器的团体成员资格触发对该人的演讲的扭曲评估。该研究由审beplay网站网址查员托福委员会资助。查看引文记录
创新
两种评分方法对自动演讲评分系统的比较
X.Xi,D.Higgins,K. Zechner,&D. Williamson(2012)。
语言测试,卷。29,3,第3页。371-394本文比较了两种替代评分方法 - 多元回归和分类树 - 用于在实践环境中使用的自动演讲评分系统。查看引文记录
文章和介词误差校正系统的英语语言学习者的效用:反馈和评估
M. C. Chodorow,M.Gamon,&J. R. Tetreault(2010)
语言测试,卷。27,3,第3页,第419-436页本文介绍了两个系统,用于识别和纠正涉及英语文章和介词的书写错误。结果表明,两个系统都有助于纠正纠错。查看引文记录
语言学习者的自动语法错误检测
C. Leacock,M. Chodorow,M.Gamon,&J.Tetreault(2010)
人体语言技术的综合讲座,卷。3,1,pp。1-134该卷提供了已经开发的自动方法,以便在多种语言中识别和纠正不同类型的语法错误。提出了自动语法错误检测研究的新方向。beplay网站网址查看引文记录
自动评分和反馈系统:我们在哪里以及我们在哪里?
X. xi(2010)
语言测试,卷。27,3,第3页,第291-300页这方面是一项特别版语言测试这为自动评分和反馈系统提供了一种新方法和方法的集合。讨论了与自动评分和自动反馈研究相关的背景信息和问题。beplay网站网址查看引文记录
使用读取语音与语言 - 特定的发音难度,适应语音识别器的声学模型进行不同的熟练性非本机自发性语音
K. Zechner,D. Higgins,R.Ivless,Y.Futagi,S. Ohls,&G. Ivanov(2009)
在诉讼中的论文2009年间三脑终序:第10届国际演讲协会年会,卷。1-5,pp。612-615本文提出了一种对识别英语考核的候选人的识别自发性言论的声学模型适应性的方法。查看引文记录
在写作英语非母语扬声器写作中检测搭配错误的计算方法
Y.Futagi,P. Deane,M. Chodorow,&J.Tetreault(2008)
计算机辅助语言学习,卷。21,4,PP。353-367本文介绍了一种自动化工具的原型,用于检测英语学习者写作中的搭配错误。讨论了详细的错误分析以及系统的可能改进。查看引文记录