語言測驗常用名詞 Testing Terminology 2015年8月更新

  • Ability/trait parameter – 能力值
  • Absence of bias – 無偏誤
  • Achievement test – 成就測驗
  • Alternate form reliability – 複本信度
  • Analytic scoring – 分項式評分
  • Anchor item – 定錨試題
  • ANOVA (analysis of variance) – 變異數分析
  • Aptitude test – 性向測驗
  • Assessment – 評量
  • Assessment as learning – 學習即評量
  • Assessment of learning – 對學習的評量
  • Assessment for learning – 促進學習的評量
  • Assessment literacy – 評量素養
  • Assessment Use Argument (AUA) – 評量使用論證
  • Assessor – 評分老師
  • Backwash effect – 回沖效應
  • Band – 等級
  • Benchmark – 比較基準/參照標準/基準評估程序
  • Calibration – 試題難易校準
  • Can-do statement – 能做敘述
  • Central tendency – 集中趨勢
  • Classical test theory – 古典測驗理論
  • Code of ethics – 道徳規範
  • Cognitive diagnostic test – 認知診斷測驗
  • Composite score – 總分
  • Computer-adaptive test – 電腦適性測驗
  • Computer-based test – 電腦化測驗
  • Concurrent validity – 同期效度
  • Confidence interval – 信賴區間
  • Construct validity – 構念效度
  • Content validity – 內容效度
  • Counterbalanced design – 對抗平衡設計
  • Correlation – 相關性
  • Correlation coefficient – 相關係數
  • Criterion-referenced test – 標準參照測驗,如「全民英檢」,各級明訂能力指標
  • Criterion-related validity – 效標關聯效度
  • Descriptive statistics – 描述統計
  • Descriptors – 能力說明
  • Diagnostic test – 診斷性測驗
  • Differential item functioning (DIF) – 差別試題功能
  • Difficulty – 難易度
  • Difficulty index – 難易度指數
  • Discrimination – 鑑別度
  • Discrimination index – 鑑別度指數
  • Distractors – 誘答選項
  • Equating – 等化
  • Equivalent forms – 平行試卷
  • Face validity – 表面效度
  • Facility – 題目難度
  • Factor – 變數
  • Factor analysis – 因素分析
  • Fairness – 公平性
  • Formative assessment – 形成式評量
  • General proficiency test – 一般能力測驗
  • Generalizability theory (GT) – 概化理論
  • High-stakes test – 正式測驗
  • Holistic scoring – 整體式評分
  • Inferential statistics – 推論統計
  • Integrated test – 整合型測驗
  • Intelligence test – 智力測驗
  • Interlocutor – 面談主試者
  • Internal consistency – 內部一致性
  • Inter-rater reliability – 評分者之間信度
  • Intra-rater agreement – 評分者本身信度
  • Impact – 後效
  • Item – 試題
  • Item analysis – 試題分析
  • Item bank (pool) – 題庫
  • Item-response theory (IRT) – 試題反應理論
  • Latent trait – 潛在特質
  • Learning-oriented assessment – 學習導向的評量
  • Level of significance – 顯著水準 (一般定於 p =.05)
  • Marking scheme – 評分參考(文件)
  • Mean score – 平均數
  • Median – 中數
  • Mode – 眾數
  • Negatively skewed – 負偏態 (非常態分佈,考生表現較預期佳)
  • Norm-referenced test – 常模參照測驗,如托福測驗
  • Normal distribution – 常態分佈
  • Null hypothesis – (虛無假設)
  • Parameter – 參數
  • Peer-assessment – 同儕互評
  • Percentile – 百分位數
  • Percentile rank – 百分等級
  • Performance conditions – 作答條件(如作答時間、準備時間等)
  • Placement test – 編班測驗
  • Point-biserial correlation – 點二系列相關 (適用於試題為二分變相的試題分析)
  • Population – 母群體
  • Portfolio – 學習歷程檔案
  • Positively skewed – 正偏態 (非常態分佈,考生表現較預期差)
  • Practicality – 實用性
  • Predictive validity – 預測效度
  • Pretest – 預試
  • Qualitative research – 質性研究
  • Quantitative research – 量化研究
  • Probability – 概率/機率
  • Random sampling – 隨機取樣
  • Rating scale – 評份量表(尺)
  • Raw score – 粗分
  • Reliability – 信度
  • Regression – 迴歸
  • Rubrics – 作答說明
  • Sample – 樣本
  • Self-assessment – 自我評量
  • Score range – 分數範圍
  • Scoring formula – 計分公式
  • Significant difference – 顯著差異
  • Significance level – 顯著水準
  • Specifications – 測驗內容
  • Split-halves reliability – 折半信度 (一般稱Cronbach's α 係數)
  • Stakeholder – 利害關係人
  • Standard score – 標準分數
  • Standardisation – 標準化
  • Standardized test – 標準化測驗
  • Standard deviation (SD) – 標準差
  • Standard error of measurement – 測量標準誤
  • Stem – 題幹
  • Stratified sampling – 分層取樣
  • Subscore – 分項分數
  • Summative assessment – 總結式評量
  • t-test – t檢定
  • Teaching to the test – 應試教學
  • Test development – 測驗發展
  • Test-retest reliability – 重測信度
  • Test security – 測驗安全性
  • Test-taker – 考生
  • Test (score) user – 測驗採用者
  • Testing of statistical hypothesis – 統計假設檢定
  • True score – 真分數
  • Validity – 效度
  • Variable – 變數
  • Variance – 方差/變異數
  • Washback effect – 回衝效應
  • Z score – 標準分數 (z分數)