How a Test is born? TOEFL試題設(shè)計步驟
引言
當今的TOEFL iBT考試的設(shè)計采用的是2003年集體開發(fā)的"實證中心設(shè)計框架",該框架要求開發(fā)者對于試題的每一個考察點和考察能力均達成一致,該框架于2008年更新了考試的形式,架構(gòu),和內(nèi)容,一直延用至今。TOEFL題目的設(shè)計高度復(fù)雜,每一套試題需要6-18個月完成設(shè)計,每一套試題需要經(jīng)過嚴格的質(zhì)量控制,保證和其他試題在內(nèi)容和難度上等值。
STEP1 遴選開發(fā)者
TOEFL的考生來自全球,因此ETS在選擇試題開發(fā)者時不僅考察測試專家的英語教學能力,也考慮每一組開發(fā)者都具有多元的國際化背景。這個環(huán)節(jié)中,開發(fā)者候選人需要完成一個樣本,以供評選。
STEP2 試題開發(fā)
開發(fā)者遵循詳細的指導(dǎo)方針設(shè)計兩方面的內(nèi)容:
1)試題刺激:閱讀和聽力材料;
2)試題的問題部分。
試題設(shè)計基于以下原則:
1)試題清楚,連貫,難度適中,適用于全球文化。
2)不需要任何背景知識即可完成試題刺激部分和問題部分
3)遵循ETS公平指導(dǎo)方針
4)考試內(nèi)容包含足夠可測試內(nèi)容
STEP3 試題審閱
試題開發(fā)之后,將有4名以上測試專家審閱每一個試題刺激和相關(guān)問題,測試專家提出修改意見或者推翻開發(fā)的試題,只有為該試題刺激負責的4名以上專家都判定試題合格,才能投入使用。TOEFL的試題審閱主要包括3個階段:內(nèi)容審閱,公平審閱和編輯審閱,具體的審閱過程是:第*輪內(nèi)容審閱-第二輪內(nèi)容審閱-公平性審閱-編輯審閱-第三輪內(nèi)容審閱-編輯審閱-第四輪內(nèi)容審閱。每一個審閱者在進入下一階段之前需要同意上一階段的試題并簽字退出上一階段。
STEP3.1 內(nèi)容審閱
內(nèi)容審閱中,對于試題刺激文本,測試專家遵循以下2個原則:
1)測試中的語言使用清晰,不含復(fù)雜邏輯
2)測試內(nèi)容無須考生具備專業(yè)背景知識
內(nèi)容審閱中,對于單選/多選試題,測試專家遵循以下4個原則:
1)考查點適當
2)答案單一性
3)語言清晰簡明
4)干擾選項吸引力
內(nèi)容審閱中,對于口語和寫作試題,測試專家遵循以下2個原則:
1)語言無歧義,期待答案公平并可以判分
2)難度與其他試題可做比較
STEP3.2 公平審閱
ETS公平指導(dǎo)方針在2002年,2007年和2009年發(fā)布過3次。所謂公平,指的是測試的效度,核心原則是只有與測試建構(gòu)相關(guān)的因素才能影響考生的*,而測試的建構(gòu)就是測試中諸如知識,技巧和能力的考查點。公平審閱的主要目的是減少與測試的建構(gòu)或者說測試考差點無關(guān)的內(nèi)容可能對于考生帶來的影響。
STEP3.3 編輯審閱
所有試題最后需要符合"ETS Style",統(tǒng)一風格做最后檢查。
STEP4 試題整合
上一個階段測試專家給出了單個的試題刺激以及相關(guān)問題,這個階段需要對不同問題整合成為一套試題。組合的過程中,我們需要考慮一系列變量,包括問題類型,問題難度,話題選擇等等,以保證TOEFL iBT和PBT等其他形式之間*可以轉(zhuǎn)換,也保證不同場測試間的難度基本相同,這也有利于測試的正態(tài)分布。
STEP5 試題實驗
閱讀和聽力
在標準化考試中,坦率來說,并不是每一套試題都進行試題實驗,用于實驗的部分和正常的計分部分是一致的,考生無法識別,請注意,用于實驗的試題和用于正態(tài)分布(也就是我們常說的加試)的試題是完全不一樣的,我們的加試是為了使得多次考試之間的*能夠轉(zhuǎn)換,并不是測試未來的試題。用于實驗的試題如果設(shè)計者發(fā)現(xiàn)有缺陷將進行修改或者刪去。這對于試題開發(fā)者來說,也幫助他們更新對于什么是一個好試題的概念。
口語和寫作
口語和寫作每一個部分都包含一定量的實驗性試題,閱卷官進行打分,試題專家審核考生回答,決定題目是否能夠有效引出考生能力。
2023-10-06發(fā)布
2023-10-06發(fā)布
2023-10-06發(fā)布
2023-10-06發(fā)布
2023-10-05發(fā)布