Planning Assessment for ESP Programs／規畫ESP 課程的評量

◎作者：王星威∕ ETS 臺灣區總代理忠欣公司顧問 ◎譯者：游雅如

©Resources for Teaching English for Specific Purposes

介紹

多注意力被放在研發「高風險型」的特定用途ESP測驗（Specific Purposes ESP test），例如航空英語、健康∕ 醫療英語、法學英語以及觀光英語，特定用途的語言測驗對於測驗研發者很重要，而特定用途測驗的開發理論可以當成語言教師在建立「低風險型」教室測驗的一個參照。然而，由於經費與效度的問題，ESP 課程中「高風險型」特定用途語言測驗的使用仍然不可行，因此，想要評鑑自身課程成功性及學生表現的機構，不是得製作內部的ESP 測驗，就是轉而使用一般的語言能力測驗。

此章節研發了一個詳細的模式以說明如何在現有的特定用途ESP 課程限制底下有效地為ESP課程安排評量方式，第一部分將陳述，ESP 測驗落在一個非常一般至非常特定的範圍之間，也因此ESP 測驗理應包含一般的能力測驗、特定用途的ESP 測驗和表現評鑑（非傳統的評量方式）。這一章也會概述今日在ESP 課程中最常用的測驗，接著會探討特定用途語言測驗的複雜度以及由此複雜度衍生的限制。第二部分將列出需求、課程目標和評量之間的關係；而藉由需求分析來定義測驗目的與時機點，則可以奠定一個成功策劃評量的方式的基礎。

在最後一部分中，在一個ESP課程中最妥善安排的測驗，將基於它們和課程目的、時機點與課程目標的相容性而決定；當面臨課程預算限制時，也會額外考量前測、後測的花費。

ESP 測驗的定義和前景

一般用途、特定用途以及

傳統的專業英文測驗

當很多從業者聽到「ESP 測驗」這個詞的時候，他們會想到很特定的測驗，例如那些為健康和醫療英語、國際航空英語或導遊英語所設計的測驗。直覺上，很多人由於「特定用途」（specific purpose）這個共用詞，而相信ESP 測驗等同於「特定用途」語言測驗。可能令人更困惑的是Douglas（2000）常常使用「ESP測驗」這個詞來直接稱呼「特定用途」語言測驗。

然而，要記住的是，在ESP 中包含了非常一般至非常特定的範圍，而且任一個考試都可能落在這範圍內的任一點上（Douglas,2000; Dudley-Evans & St John, 1998），因此「ESP 測驗」這個詞應該被當成一個涵蓋了三種不同類型測驗的概括性術語來使用：

ESP 測驗三種類型

由於花費與效度的問題，非常特殊的「高風險型」測驗很少被用在ESP 課程中，今日市場上少數被用在特定用途ESP 測驗中的考試包括了被用來測試學術英語（EAP）的美國研究生入學考試（GRE）以及被用來檢測商業經濟學英文（EBE）的研究生管理科學入學考試（GMAT），也有用來測試八個不同學科領域內容知識（如數學和生物）的GRE 學科考試，這些GRE 學科考試內容比起GRE 考試本身更特殊，然而也有例外，比如說在職業英語（EOP）課程中，取得職業證照與證書比較有可能是一個學生最終的目標，此類例子可以在台灣一些幫助學生準備護理或國際人力資源管理證照考試的課程中看到。一般能力的ESP 測驗與特定用途ESP 測驗（右表）分別顯示目前在ESP課程中用以測試一般能力與特定用途最常見的考試為何。

表一: 一般能力的ESP測驗

表二: 特定用途ESP測驗

特定用途語言評量的複雜度

本質上來說，與授課、課程設計和評量相關的問題，特定用途課程會比對於一般能力課程而言來得更複雜，因為從業者必須要應付好幾個「副語言（Sublanguages）」，例如：商業語言、科技語言和人文學科語言，因而使得要概述一個能適用所有學科及學生參與的專業活動之評分方案變得複雜（Gálová, 2007）。

根據 Douglas（2000），有三個特質能區分特定用途語言測驗和其他類型的考試，這三個特質是：

● 語言使用隨情境變化

● 特定用途的語言很精確

● 特定用途的語言會與特定用途的背景知識交互作用

有趣的是，正是這些特質讓在「高風險型」情境中開發與實施特定用途的語言測驗變得不可行，一

個原因是因為特定用途的語言測驗牽涉到特定學術、專業或職業領域中使用的技術性語言（術語），其有各自的詞彙、語義、句法、甚至語音的特性（Douglas, 2000），因此當測驗的可用市場變小時，開發測驗的花費就增加了。

關於特定用途語言和特定用途背景知識的交互作用，「無關構念變異」（Construct irrelevant variance）的問題需要被解決，在一般目的性測驗中，特定用途的背景知識通常被看成是導致測量錯誤的混淆變數（Confounding Variable），需要盡量被減少，在開發高風險型測驗的情況中就被稱為是無關構念變異。因此，當受試者確定擁有特定背景知識的時候，推論他們的特定用途語言能力最為恰當（Douglas, 2000)，舉例來說，一個擁有未知背景知識和未知語言能力的學生答錯了一題英語的醫學問題，因為錯誤可能來自於缺乏語言知識或缺乏醫學領域知識，不可能評鑑說他的英語能力就是錯誤原因，然而，若受試者是位合格醫生，那也許可以推論說他本身缺乏語言知識是最可能造成錯誤的理由。從以上論述可看出特定用途語言測驗的特性讓它們花費較高、也更難研發用於高風險型情境，因此很少可靠或合成本效益的特定用途ESP 測驗被研發出來，而在ESP課程中使用特定用途的語言考試是不可行的。然而，特定用途的語言測驗仍然能以授課者或出版公司研發的「低風險型」成就測驗形式而被使用，這是因為考試前的課堂教學內容降低了無關構念變異的可能性，這樣的測驗能被用來判斷學生是否有達成學習目標，下面部分會更進一步討論這個概念。

需求分析課程目標及測驗

需求、課程目標與評量的排列關係

如ESP 課程的排列關係（圖二）所示，需求、課程目標和評量之間的排列關係組合構成了成功的ESP 課程的基礎，Dudley-Evans 和St John（1998）陳述說「假設測驗內容與需求分析和課程設計不相符合的話，它們背後的所有努力都可能被抵消掉」（頁124）。評量的選擇和策劃應該以需求和課程目標來決定，但實際上，評量對於辨認與詳述需求及課程目標的過程也有影響，在檢視評量的策畫之前，先詳細地考量這些關係是很重要的。

市場需求、學習者需求

與全英語課程（EMI)的角色

此書的第二部分已經討論過學習者需求，包括了像專題導向學習和真實教材任務設計的概念，而且，整體來看ESP課程的市場，ESP 的存在是要滿足市場需要，這對課程設計的決策也是很重要的。

在非英語系國家的情境中，由於缺乏英語能力而沒有管道參與國際活動的人需要一個直接有效的解決方案，因此產生ESP 課程的需求，（圖三）明確闡述了ESP 課程的出現，此情況假定了以下幾點：

● ESP 課程是為了以英語為第二語言的英文講者而存在。

● ESP 課程堅持一個強烈的語言重點。

● ESP 課程並非設計來教導專業內容。

上列的第三點常被許多老師誤解，因為他們把全英語授課（EMI）當成專業英語（ESP）的同義詞。在職業英語課堂中，EMI 常被用來幫助學生以第二語言或外語表達已知的概念。另一方面來說，在學術英語課堂中，EMI 常被用來訓練學生把英語當成媒介來獲取資訊，以幫助自身為未來高等教育做準備，雖然以特定內容為重點對於培養移動這些能力是必要的，但ESP 課程的主要重點並非學習專業內容。

而且Genesee（1994）表示一個堅固的母語（L1）基礎其實會改善第二語言的能力，而母語（L1）逐漸被認為是獲取內容的最佳媒介，這可以在台灣的大學中觀察出來：為了效率，大部分學生一有可能就使用母語（中文）教科書，而相關的英文只有當溝通需求出現、或母語教課書買不到時才會被提及。

課程目標

ESP 課程目標由需求分析來決定，這在此書第一部分已詳細描述過。簡言之，任何課程的目標應該是了解學習者的程度（Present Situation Analysis，PSA；背景分析）、學習者需要達到的程度（Target SituationAnalysis，TSA；目標情境分析）及如何以有效方式讓他們達到這個目標，從這個意思來說，課程目標以三個要素來決定：

● 學習者需求和市場需求：基於所需的語言能力、領域知識和技巧，代表著學習者的最終目標（TSA）。

● 起始程度與能力：基於他們目前的語言能力、背景知識和技巧，代表著一個學習者的起始點（PSA）。

● 課程計畫：即代表著授課者、設備、教材、評量工具與整體預算間的協調。

需求分析提供了研發有效ESP課程的架構，排列出了學習者需求、課程目標與評量之間的關係；需求分析也可以被用來當成安排評量的起始點，因為它顯露了時機點和評量目的相關的重要概念。（圖四）是一套ESP 課程的模式。

評量

對課程管理而言，評量的重要性是有據可查的。課程評估者與∕或課程管理者能夠根據正確反映學生目前學習程度的評量結果來做決定（Chappuis, Commodore, & Stiggins, 2010）。一般來說，評量要達到兩個目的：（1）滿足受試者的訊息需求;（2）為能讓學生達到最佳化學習，用來收集學生的學習證據來影響教學決策。當學習進行時，需要得知學生已學到與未學到的知識，這有助於做出幫助學生進步的教學決策（Stiggins, Arter, Chappuis, & Chappuis, 2006）。根據Brown與Knight（1994），評量被用來當成診斷工具以顯示學生前進發展的意願、協助單元的選擇、幫助評分與程度區分、促進學習、提供回饋、滿足學生期望、給予補救錯誤機會，以及提供表現指標給學生、授課者和機構三方做為參考。

關於ESP 課程，Dudley-Evans與St John（1998）陳述說「一個好測驗可以讓老師以增進學習過程的方式來教導學生所需知識」（頁124），接著又說「有些機構想要把評量用作為背景分析（PSA）的一部分，以助設計課程及分類學習者」（頁210）以及「編班、檢視進步、或者測試能力」（頁213）。有趣的是，當企業界語言能力標準（包括分數與分數說明）已經存在大部分的教育和專業機構中時，評量仍被用來定義市場和學習者需求。使用現有的標準來決定學習者需求與課程目標可以省去課程研發者的寶貴時間和努力。

有鑑於評量在一個語言課程中所扮演的廣泛角色，此章節剩餘部分將專門探討ESP 課程對於評量的挑選與安排。

安排專業英文課程的評量

有兩個主要因素影響了ESP 課程的評量安排，即是評量的時機點與目的。評量的時機點被視為與課程長度相關，而且通常包含前測（編班∕ 診斷考試）、課堂考試（例如期中考）與後測（期末考），這些不應與個別單位的前、中或後測混淆。考試的目的可以被歸類為下列五種不同的類型：

● 定義需求

● 判斷學習者的起始能力

● 目標建構

● 動機、回饋與調整

● 表現評鑑（學生、授課者和課程）

一旦了解評量的時機點和目的，課程設計者就該決定最適當的評量方式以達成理想目標，選擇的面向有很多，像是：

● 選擇學術英語測驗，或是職業英語測驗

● 選擇特定用途考試、一般目的考試，或是表現評鑑（非傳統式考試）

● 選擇能力測驗，或是成就測驗

● 選擇常模參照考試，或是標準參照考試

● 選擇接受性考試，或者是應用性考試

一個專業英文課程評量規劃的例子

此部分根據作者擔任測驗顧問和提供各式測驗解決方案給遍及全臺教育機構的經驗，提出一個大學ESP 課程的評量架構。這些經驗包含（1）連續五年提供國立成功大學成鷹計畫的前∕ 後測；（2）與國立台灣科技大學合作、討論一年級普通英語課程前∕ 後測；（3）與弘光科技大學的暑期密集英語課程合作前∕ 後測；（4）連續三年與技術及職業教育司安排的科大暑期密集專業英文課程進行合作；以及（5）與在美國執行密集英語課程的課程經理進行深度討論的經驗。

定義學習者需求

要定義學習者需求，首要的問題是了解「當學生畢業時，他們將需要用到的語言、技巧和知識是哪些」，此問題的答案決定了學習的基本方向。關於評量，可參考企業與學術界的能力標準，舉例來說，像多益（TOEIC）、托福（TOEFL）和雅思（IELTS）的評量工具都被廣泛用來篩選應徵者、給予立即可得的客觀測量、並提供了企業與學術界實際能力要求的清楚形象。評量工具也提供了分數論述，描述了受試者在不同分數層級所具有的操作能力，這些論述是根據目標環境中真實語言使用情形而研製的，因此可被當成決定所需技巧與能力時的參照，有助於課程目標的設計。而且，分數論述藉著將所需技巧簡化為基本要素而使它們更具體，這樣能更容易應付課堂教學。（圖五）概述了決定學習者需求的因素。舉例來說，假設現在有個ESP 課程是設計給計畫畢業後留在台灣的本國工程學生，這課程明顯是以職業為目的的（EOP），而目的為職場工程英語，根據亞洲大型雇主說出的工作敘述來分析，工程師的所需能力被判定在多益（TOEIC）550-750 分之間（http: //www.104.com.tw/），而以英文執行的主要工作職務有研究、電子郵件往來、解釋產品步驟與電話會議的溝通，那麼課程設計者可以參考多益（TOEIC）的分數論述來決定每個特定多益分數層級包含的一般能力為何。

而且，大部分職業英語情境中的常用閱讀字彙落在7,000 個普通單字範圍內，還要再加額外1,000個職業領域的字，以上資訊有助於建立學習者需求和課程目標。

如果同樣一群工程學生打算報名英語系國家的研究所，課程需求就會是針對學術目的的（EAP），而目的就是學術工程英語。基於對國際研究所的分析，所需能力可以被判定為托福網路測驗（TOEFL iBT）80-100 分或雅思（IELTS）5.5-7.0 級分之間，而主要操作能力是學術閱讀，這需要20,000 個單字（http: //www.ets.org/）、記筆記、小組討論、做簡報、研究工作和報告撰寫的能力。

用前測決定學習者起始能力

如前述，前測可用來決定一個學習者的起始能力，這對課程策劃和透過初始診斷性檢測以了解學生能力來說是重要的。透過評量，學生的知識斷層或能力斷層被探測了出來，而老師可以用測量的結果來更了解學生的程度並做出與分組、教材挑選、活動等等相關的決策，決定起始能力的一般理由包含：

● 入學要求

● 課程目標設定

● 老師∕教材挑選

● 將學生分組

● 測量進步程度

當挑選前測時，了解能達到諸多前測目的的最恰當評量形式是什麼，以及哪些考試最具備這些特質都是重要的事。以下列出一個對前測有利的不同特質之簡短分析。

能力測驗：（Proficiency tests）

當決定起始能力是主要的測驗目標時，應該選能力測驗做為前測；而在此階段，課程內容仍未被介紹。能力測驗被設計來測量受試者的語言能力，不論他們受過多少該語言的訓練。能力測驗的內容是根據廣泛情境下的多種主題中，用來達成溝通任務所需的語言能力而設計的，以便辨識出學習者是否十分精通該語言。

常模參照考試：（Norm-referenced tests）

當前測實施必須以同一份考試來區分許多學生時，應該選常模考試做為前測；而且，常模考試通常被用在語言性向、語言能力和語言分班等目的（Brown, 2003）。

常模考試評估了受試者彼此的能力與表現，以區分高成就和低成就者，且∕ 或有助於判斷一位受試者在特定族群中的程度所在，常模考試的例子包括多益（TOEIC）和托福（TOEFL），這些考試並沒有事先決定好的課程，考試的主題也會依照制訂考試的人員而改變。

接受性考試：（receptive tests）

當應用性能力測驗的花費總是因為評鑑所需的龐大人力費用而高於接受性考試時，前測應該優先考慮接受性考試而非應用性考試。接受性考試通常由機器評分，而應用性考試必須由訓練良好的真人評分者來評鑑。然而，在花費不構成問題的情況下，有助於決策的資訊總是越多越好。在這種例子中，四種技巧（應用性和接受性）的考試對於決策來說提供了更詳盡和可靠的基礎。

總結：

總而言之，（1）能力測驗、（2）常模參照考試、以及（3）接受性考試這些測驗最適合用作ESP 的前測，使用這些評量方式能以最符合成本效益、只使用單一考試的方式準確測出一大群學生的起始能力。對於花費不成問題的課程來說，接受性考試可以被四種技巧的考試所取代。

使用前測結果來建構目標

一旦選好前測並施測後，考試結果能用來幫助決定與課程策劃和設計相關的課程目標。第五章註1 已詳盡論述了課程設計，也因此本部分只會介紹與評量直接相關的目標建構面向。一旦獲知前測的結果，學生的起始能力可用來與目標情境分析（TSA）做比較，而課程管理者也可以開始構思更實際的課程目標。

接受性和基礎的應用性技巧相對於進階的應用性技巧：

大部分的企業機構和研究所課程都重視應用性技巧（productive skills）勝過於中學和大學教育常當成重點的接受性技巧（receptive skills），因此，起始能力高的學習者需要盡可能常接觸更進階的應用性技巧，例如學術討論和做簡報，然而，如果前測分數透露一組學生的單字量研究不足、閱讀與聽力技巧低落，試圖向他們介紹進階的應用性能力可能會導致不良結果，或甚至造成學習者心理創傷，因此，起始能力低的學習者應該轉而接觸接受性和基礎的應用性技巧。

一般能力相對於內容導向教學：

決策者也應決定如何在班級內平衡語言與內容導向教學（content-based instruction）。如果前測結果顯示學生程度非常低，他們可能沒有能力應付大量的內容導向教學，此時將焦點放在一般的語言能力可能較適當，在這些班級中，極近似全英語（EMI）的專業英文課程根本行不通。相反地，對程度很好的學生來說，教導文法或基礎聽力技巧的語言導向課程不太可能滿足學習者需求，加重內容可以提高對學生的挑戰，同時也幫助他們應付在離開課程後可能面臨的目標語言情境。

能力導向的課程目標與教學：

當檢視接受性∕基礎應用性技巧相對於進階性技巧的比重均衡時，將構思ESP 課程目標想成是在能力導向範圍裡（proficiencybased）移動變化是有幫助的。語言導向和能力導向教學也是同樣情況，一組學生的程度越高，就要越重視進階的應用性技巧和內容導向教學。

從這個意思來說，低程度班級中教導的內容和技巧可能就像接受性考試中所測的內容和技巧，例如托福紙筆測驗（TOEFLITP）、多益英語測驗（TOEIC L&R）、以及劍橋博思職場英語聽力∕ 閱讀檢測（BULATS L&R），相反地，高程度班級教授的內容和技巧可能正是以下所需：認證、證照考試和研究生管理科學入學考試（GMAT）、美國研究生入學考試（GRE）、以及GRE 學科考試之類的測驗。

高程度班級也可能將焦點放在類似托福網路測驗（TOEFL iBT）或雅思（IELTS）當中口說與寫作部分可見的進階應用性技巧。總而言之，（圖六）顯示了ESP 的連續範圍。

使用後測的表現評鑑

一旦決定課程目標，課程設計者可以開始挑選後測，用以當成評鑑通過與否的一套標準的評量方式。挑選適當的後測是很重要的，如前所述，「假設測驗內容與需求分析和課程設計不相符合的話，它們背後的所有努力都可能被抵消掉」（Dudley-Evans & St John, 1998, 頁124），的確，後測會影響教學內容和學習內容，所以後測重點應與課程目標和課堂學習互相配合，因此，挑選後測最重要的因素是預算限制和與課程目標的配合。

後測的預算限制：

預算限制是大部分ESP 課程的一個現實面，所以重要的是要考量接受性考試（receptive tests）所具的花費優勢，如上所述，應用性能力測驗（productive proficiency tests）的整體費用比自動評分的接受性考試高了許多，為了舉例說明這點，（表三）列出一些熱門的標準能力測驗於 2014 年3 月1 日在台灣的價格。

正如所看見的，假定一個ESP課程有200 名學生，使用接受性考試會花掉課程224,000 至300,000 元台幣、應用性考試則會花600,000 至648,000 元台幣，而一個測試四種技巧的測驗會花上1,000,000 元台幣左右，由於花費差異很大，大部分的語言課程會使用接受性能力測驗，例如托福紙筆測驗（TOEFL ITP）、多益英語測驗（TOEIC L&R）、或劍橋博思職場英語聽力∕ 閱讀檢測（BULATS L&R）當成前測，而幾乎沒有課程會使用應用性考試當成內部的評量工具。

後測配合課程目標：

考慮到前一個部分提及的能力導向課程目標與教學概念，課程通常會有與接受性和基礎應用性技巧∕進階應用性技巧和能力∕內容導向教學相關的以下目的（圖七），而圖八則顯示了能力程度和語言課程考試類型間的關係。

在課程中測試低程度學習者：

如果學生的起始能力低，像托福紙筆測驗（TOEFL ITP）、多益英語測驗（TOEIC L&R）和劍橋博思職場英語聽力∕ 閱讀檢測（BULATS L&R）的接受性一般能力測驗可能很恰當，前測和後測使用相同的評量工具使得前後測分數能直接比較，這對學生、授課者和課程評鑑來說都是優勢。

如果費用是個問題，課程管理者也可以使用接受性成就測驗當作後測以判斷分數是否通過。因此，低程度學習者參加的課程可以在前後測都使用接受性能力測驗，估計的花費如下（最高估計）

學術英語：

只有前測：224,000 元

前測＋後測：448,000 元

職業英語：

只有前測：224,000 元

前測＋後測：448,000 元

在課程中測試中等程度學習者：

中階能力課程應該開始將重點放在更進階的應用性技巧和內容導向教學，對這些課程來說，一般能力∕ 內容導向教學以及接受性∕ 應用性技巧的平衡應該由課程設計者和授課者決定，這會影響後測的挑選。而依課堂重點而定，應用性能力測驗、接受性成就測驗和應用性成就測驗都可以被用來當成這個程度層級的後測。應用性能力測驗可能包含托福網路測驗（TOEFL iBT）、雅思（IELTS）、

多益英語口說與寫作測驗（TOEIC S&W）以及劍橋博思職場英語口說∕ 寫作檢測（BULATS S&W），而成就測驗可以是內部研發的，或是跟出版社購買，因此，一個學術英語∕ 職業英語課

程的評量花費如下所示（最高估計）：

學術英語：

只有前測：224,000 元

前測＋後測：1,244,000 元

職業英語：

只有前測：300,000 元

前測＋後測：948,000 元

在課程中測試高程度學習者：

如果一個班級在前測得很高分，課程可能會決定應該要重視培養基於真實內容和情境的應用性技巧，因此，選擇應用性內容導向的成就測驗當成最後的後測會比較恰當。如上所述，這些考試可以是內部研發或是向出版社買來的，如果找不到或無法開發適當的測驗，像研究生管理科學入學考試（GMAT）、美國研究生入學考試（GRE）、GRE 學科考試、托福網路測驗（TOEFL iBT）和雅思（IELTS）之類的考試可以用以取代，因此，一個學術英語∕ 職業英語課程的評量花費如下所示（最高估計）：

學術英語：

只有前測：224,000 元

前測＋後測：1,244,000 元

職業英語：

只有前測：300,000 元

前測＋後測：948,000 元

使用課堂內評量的動機、回饋和調整

課堂內考試應該在課程進行期間施行，這些應包含促進學習的評量以及目前的學習評量這兩者基

本要素。促進學習的評量是一個持續不斷的過程，且學生被鼓勵要積極參與設定學習目標，以及要與老師合作以評鑑進步幅度與空間。簡言之，促進學習的評量藉著培養學生對於達成學習目標的意識，像是要達成目標需要加強什麼、以及該如何加強等等，透過培養這些意識來提升學生的學習（Stiggins et al., 2006）。目前的學習評量通常含有通過∕ 不通過的分數，也用來確保學生已達成某些標準或是課程目標。本質上來說，目前的學習評量等同於針對學生、教師和管理者的表現評鑑（Stiggins et al., 2006）。有鑑於大部分課程的花費考量，課堂內考試應該由內部研發或是連同課堂教材一起向出版商購買。內部考試應該配合課程目標和課堂教學，也應考量到後測的形式以確保學生擁有最終評鑑所需的內容知識和技巧。簡而言之，課堂內考試應該用來確定學生是否達到課程標準（以通過與不通過的分數判斷）、或用來協助給予動機、顯示學習進步、修改課程設計、與幫助學生適應課程標準。下列討論了最適當的課堂內考試形式：

成就測驗

課堂內考試應該採用章節導向、部份導向或表現導向成就測驗（achievement tests）的形式，一來比起能力測驗還要便宜，二來還能給予授課者依照學生程度和表現來調整課程內容的彈性。成就測驗是使用特定的教科書或課程來評量受試者是否具有所需的、課程中教導的特殊內容和語言要素知識，這樣就能夠同步測試特定用途的內容知識和語言能力。

常模參照考試

常模參照考試評量的是受試者理解課綱的能力，依照測驗在學習過程當中被實施的時間點，也能將之作為診斷、進步、和成就等用途（Brown & Hood, 2002）。在這些考試中，課綱和相對應的考試在課程之初就設定好了，在每堂課尾聲，標準參照考試可以被用來判斷受試者的理解程度，並且有助於分配一個通過∕不通過的成績。常模參照考試不依賴複雜的統計模式來比較學生或組別，因此對於教授們進行內部研發會比較實用。

表現評鑑（非傳統式評量）

現存很多非傳統式評量的形式，這些對於課堂內測驗很實用，第十章註2 詳細討論了其中一些非傳統形式評量，故此章節不再贅述。

總結

總而言之，（1）成就測驗、（2）標準參照考試、以及（3）表現評鑑（非傳統式考試）這類的考試最適合當成ESP 的課堂內測驗，使用這些評量形式能以符合成本效益的方式測量課堂中教導的特定用途的內容知識和語言能力。此外，當採用這些評量形式時，內部研發對老師和教授來說就是個切實的目標。

結論

「ESP 測驗」這個詞引起了一些混淆，因為很多人相信它單單是指特殊用途的測驗，事實上，ESP測驗有三種：（1）一般能力、（2）特殊用途、以及（3）非傳統ESP 考試。此章節探討了ESP測驗的前景、概述了現存的考試以及它們於一般能力測驗和特殊用途測驗中的用途，接著也探討了，「高風險型」特殊用途語言測驗為何不適用於ESP 課程的原因，其中包括複雜度、花費、市場規模以及可信度，最後呈現出一套在ESP 課程中將測驗排序的步驟。希望能透過這個安排評量的模式，讓課程開發者和授課者更容易在配合學習者需求與課程目標的同時，幫ESP 課程挑選並安排評量。

註1：指陳秋蘭教授所著之Needs analysis and ESP curriculum design，為該論文集之第五章，本文則為第九章

註2：指高實玫教授所著之Performance assessment: A collaborative process to facilitate learning in the ESP classroom

參考資料

Brown, J. D. (2003). Creating a complete language-testing program. In C. A. Coombe & N. J. Hubley (Eds.), Assessment practices (pp. 9-23). Alexandria, VA: Paul Gibbs.

Brown, K., & Hood, S. (2002). Academic encounters: Life in society: Reading, study skills, and writing . Cambridge, UK: Cambridge university press.

Brown, S., & Knight, P. (1994). Assessing learners in higher education. Cheltenham, UK: Park Place Press.

Chappuis, S., Commodore, C., & Stiggins, R. J. (2010). Assessment balance and quality: An action guide

for school leaders (3rd ed.). Boston, MA: Pearson Education, Inc

Douglas, D. (2000). Assessing languages for specific purposes. Cambridge, UK: Cambridge University Press.

Dudley-Evans, T., & St John, M. J. (1998). Development in English for specific purposes: A multidisciplinary approach. Cambridge, UK: Cambridge University Press.

Gálová D. (2007). Languages for specific purposes: Searching for common solutions. Newcastle, UK: Cambridge Scholars Publishing.

Genesee, F. (1994). Integrating language and content: Lessons from immersion (Educational Practice

Reports No. 11). National Center for Research on Cultural Diversity and Second Language Leaning. Washington, DC: Center for Applied Linguistics.

Stiggins, R., Arter, J., Chappuis, J., & Chappuis, S. (2006). Classroom assessment for student learning:

Doing it right- Using it well. Princeton, NJ: Educational Testing

English Career

Planning Assessment for ESP Programs／規畫ESP 課程的評量

發燒話題

熱門文章

活動快訊