آزمون هاي چند گزينه اي

تحقيق كلاسي درس روانشناسي پرورشي - استاد حجت الاسلام دكتر سقاي بي ريا -     آبان ۱۳۹۰

اشاره:

متن حاضر ترجمه‌ي صفحات 709 تا 712 از كتاب دائرة المعارف روان‌شناسي پرورشي[1] مي‌باشد. در اين مقاله كه عنوان آن آزمون‌هاي چندگزينه‌اي[2] مي‌باشد، نويسندگان[3] قصد دارند تا به فوائد و شيوه‌هاي صحيح طرح كردن و آزمون گرفتن با استفاده از اين اسلوب آموزشي- ارزيابي اشاره كنند.

آزمون­های چندگزینه­ای

شاید آزمون­های چندگزینه­ای پرطرفدارترین قالب آزمون­گیری در آموزش و پرورش و جاهای دیگر باشند، و مطمئنّاً دانشجویان از پرسش­های چندگانه آگاهی­هاییدارند.

آزمون‌هاي چندگزینه­ای نوعاً با مسأله­ای آغاز می­شوند که این مسأله یا مشکل،به عنوان یک جمله­ یا سؤال ناتمام بیان شده است (که معمولاً با عنوان ریشه یا تنه[4] معروف است) که به دنبال آن جایگزین­هایی برای انتخاب شدن آمده­اند (که به آن­ها گزینه­ها[5] گفته می­شود).

مطمئنّاً شیوه­ی آزمون­گیری چندگزینه­ای، به­طور وسیعی در بخش عظیمی از کاربردهای آموزشی و پرورشی و روان­شناسی و عرصه­های فراتر از این موارد محبوب و مورد استفاده است. روان­شناسان پرورشی در به­کار بستن شیوه­ی آزمون چندگزینه­ای به منظور پژوهش، آموزش، سنجش- ارزیابی، پیش­بینی- گزینش-طبقه­بندی- تعیین شغل، دادن مجوّزها و دیگر اهداف پیشقدم شده­اند. علاوه بر این، روان­شناسان پرورشی در انجام تحقیق و توسعه و رشد شیوه­ی آزمون چندگزینه­ای به اموری منتهی شده­اند که خلاصه­ی کوتاه آن به شرح زیر می­باشد. این مطلب اشاره به این موارد دارد که:چرا و چگونه کسی ممکن است قالب چندگزینه­ای را به­کار بندد، چه چيزهايي مي‌تواند اهداف عمومی گسترش دهندگان آزمون (که شامل آموزگاران هم می­شود) باشد، و چند رهنمود مؤثّر جهت طرّاحي اين آزمون‌ها (به­ویژه موارد چندگزینه­ای).

چرا از آزمون چندگزینه­ای استفاده می­شود؟

تعداد زیادی از فرهیختگان، مانند توماس هالادینا[6] و استیوِن داونینگ[7]، شماری از نقاط قوّت شیوه­ی آزمون چندگزینه­ای را برشمرده­اند. ذکر چند نمونه از این موارد بسیار خوب می­باشد: حمایتاز اعتبار محتوای[8] آزمون، پایایی نمرات می­تواند بالا باشد،اين آزمون‌ها به­راحتی می­توانند پیش­آزمون، امتیازبندی، استعمال و مورد استفاده­ی مجدّد شوند، امتیازدهی عینی و با سرعت بالا ممکن می­گردد، تشخیص نمرات فرعی سهل­الحصول است، آزمون انطباقی با چنین قالبی به خوبی می­تواند انجام شود، بیشتر مضامین با چنین شیوه­ای می­توانند آزمون شوند، مانند بسیاری از گونه­های سطح عالی تفکّر، ولو این­که بسیاری از طرّاحان این آزمون­ها خود را به گزینه­های پیش­پا افتاده و دانش سطح معمولی محدود می­کنند و در نهايت اين‌كه این آزمون شیوه­ای انعطاف­پذیر می­باشد و حدس­زدن جواب­ها به­ندرت به صورت یک مشکل بروز می­کند. اگر یکی از آزمون­دهندگان با یکی از گزینه­ها مشکل داشته باشد، گزینه­ها و شانس­های دیگر در انتظار او خواهند بود.

استفاده­های رسمی و غیررسمی

کاربردهای آزمون­های چندگزینه­ای

آزمون­های چندگزینه­ای نوعاً به عنوان گزینه­ای برای فراهم­آوردن ارزیابی­های تلخیصی بزرگ استفاده می­شوند، مانند این­که آیا فرد مورد نظر فلان دوره را گذرانده است یا این­که پروانه­ی حرفه­ایِ شغل خود را کسب کرده است یا نه. امّا در عین حال،همچنین موارد آموزشی و اطّلاع­رسانی وجود دارد که در آن قالب‌هاي گوناگون آزمون چندگزینه­ای موارد زیر را به همراه می­آورد: می­تواند باعث ترغیب دانش­آموز در مشارکت شود، بازخوردهای اصلاحی را برای آموزگار و دانش­آموزان فراهم می­آورد، توجّه افراد را بر یک عنوان متمرکز می­کند، باعث آسایش از صدای یکنواخت آموزگار می­شود، باعث پیش­نما و آمادگی برای امتحان می­شود و حتّی می­تواند موجب اندکی خنده و شادی بین افراد شود (مثلاً بعد از تصحیح امتحان افراد با خود می­خندند که چرا فلان گزینه را که صحیح بوده است انتخاب نکرده­اند و گزینه­ی اشتباه را انتخاب کرده­اند).

برخی اهداف ایجادکنندگان این آزمون

آزمون­های چندگزینه­ای می­بایست در مورد چیزهایی سؤال کنند که همسان با موضوعات پرورشی یا کاربردهای طرّاحی شده برای آزمون باشند، و این سؤالات باید شفّاف باشند. یک راهبرد سنجش ملّی قدیمی روشن ساخت که آن­چه اهمیّت دارد مهم و واضح بودن موارداست و این کفایت می­کند از این­که در روزنامه تبلیغ شود. راجر بوثروید[9] نتیجه گرفت که آزمون‌دهندگان می­بایست هم به صورت صحیح پاسخ­گوی دلایل صحیح باشند و هم، اگر پاسخگویی صحیح نبود، باید این کار را به خاطر دلایل صحیح انجام دهند. نظر او برای به حدّاقل رساندن دشواری­های نامربوط همسان با نظریّه­ی لی جی. کرونبچ[10] می­باشد. شاید بتوان گفت موارد گوناكون چنين تست‌هايينزديك‌ترين چيز به ادبيات شفاهيما می­باشند و سزاوار است تا این آزمون­ها بر اساس سؤالاتی اساسی که به صورتی واضح طرّاحی شده­اند، مبتنی گردند.

رهنمودهایی برای بهترين انتخاب، بازبيني و طرّاحي آزمون‌ها

برای ایجاد آزمون‌هاي چندگزینه­ای سه راه وجود دارد: انتخاب آزمون­های موجود، تجدید نظر در آزمون‌هاي موجود و نوشتن آزمون­های جدید. مربّیان پرورشی می­بایست شیوه­های آزمون­گیری خود را ارزیابی نمایند تا مطمئن شوند که آزمون‌هابا موضوعات پرورشی همبستگی دارند، چراکه ممکن است اثبات گردد که برخی از این شیوه­ها غامض هستند. به عنوان مثال دیوید فریزبی[11] و دیگران دریافتند که آزمون­هایی که همراه ضمیمه­ای از کتاب درسی هستند احتمالاً شامل این موارد می­باشند:

1-    گزینه­های کم­مایه و سطح پایین، که صرفاً بر اساس برداشتن بخشی از متن مبتنی هستند،

2-    پوشش ناتمام،   3-گزینه­های نامربوط،

4-    آزمودن مقدار کمی از کاربرد، درک مطلب و تفکّر انتقادی و        5- گزینه­های اشتباه.

این بدان خاطر است که، ایجاد یک آزمون توسّط اختصاص دادن و انتخاب آزمون‌هايي که متن کتاب را در ضمن خود دارد احتمالاً منجر به تهیّه­ی نمونه­ی ضعیف و ناقص از آزمون­هایی خواهد شد که با موضوعات دوره­ی تحصیلی در ارتباط بوده­اند، این مطلب به همراه مقدار زیادی از آزمون­های کم­مایه، نامربوط و سطح پایین خواهد بود؛ و همراه با مقدار کمی از گزینه­های سطح عالی تفکّر؛ و جاخالی­های فراوانی از پوشش خواهد بود. اضافه بر این، چنین آزمون­هایی ممکن است حاوی خطاهایی در نوشتن آزمون­ها، مخصوصاً خطاهای نگارشي که در آن­ها آزمون­دهنده در نهایت هم منجر به پاسخ دادن صحیح به گزینه­ها به واسطه­ی دلایل غلط می­شود و هم منجر به پاسخ دادن به صورت غلط با دلایل ناصحیح می­گردد، همان­گونه که بارها توسّط بوثروید تذکّر داده شد و در گزینه­ی 5 در ذیل این مطلب برجسته خواهد شد.

راهنماهای زیادی برای کیفیّت انتخاب، تجدیدنظر و نگارش آزمون‌هاي چندگزینه­ای وجود دارد، حتّی رابرت ابل[12] زمان آن­را تا 50 سال پیش تاریخ­گذاری کرده است. تازه­ترین طبقه­بندی که توسّط هالادینا[13]، داونینگ[14] و میشل رودریگز[15]ایجاد گردیده است، و مبتنی بر پژوهش و آگاهی و نصیحت نویسنده­ی کتاب درسی می­باشد، با تلخیص و تصرّف و گهگاهی برجسته­سازی در پاراگراف­های زیر می­آید.

ü    مورد اوّل در خصوص انتخاب محتواي آزمون‌ها مي‌باشد. مبناي آزمون‌ها بر محتوا و فعّاليت و رفتارهاي ذهني در جدول خصوصيّات سابقاً ارائه شد. آزمون مهم مي‌باشد و نبايد محتوايي كم‌مايه و سطح پايين داشته باشد.

از چیزهای تازه برای آزمون سطح عالی یادگیری استفاده کنید.از مضامین بیش از حد ثابت و بیش از حد عمومی اجتناب کنید. از سؤالات انحرافی اجتناب کنید و لغات را تا حدّ ممکن ساده و آسان استفاده نمایید. یکی از گزینه­های برانگیزاننده­ی تفکّر و جدید در زیر می­آید:

1.      شما در یک قایق هستید و در یک تالاب بسیار کوچک قرار دارید. شما چهار عدد سنگ بزرگ را از داخل قایق در آب پرتاب می­کنید. با فرض اندازه‌گيري دقيق، آب داخل تالاب:

الف) بالا خواهد آمد     ب) پايين خواهد رفت   ج) هيچ تغييري نخواهد كرد

راه حل: پاسخ صحيح گزينه‌ي ب مي‌باشد. زماني‌كه سنگ‌ها داخل قايق هستند، قايق آب را به ميزان وزن سنگ‌ها جابه‌جا مي‌كند. زماني‌كه سنگ‌ها داخل آب هستند، سنگ‌ها حجم خود را درون آب جابه‌جا مي‌كنند. كدام مورد حجم زيادتري دارد: صد پوند آب يا صد پوند سنگ؟ بنابراين سنگ‌ها زماني‌كه در قايق هستند حجم بيشتري از آب را جابه‌جا مي‌كنند نسبت به زماني‌كه در آب هستند.

ü     مورد بعد زماني است كه قالب بندي آزمون‌ها و حقّ انتخاب‌ها را به صورت صحيحي مرتّب مي‌نمايد. از گزينه‌هاي چندگانه، انتخاب‌هاي جانشيني، صحيح-غلط، صحيح-غلط‌هاي چندگانه، گزينه‌هاي متناظر و تطبيقي و بافت وابسته‌ي چندگزينه‌اي استفاده نماييد، امّا از انتخاب‌هاي چندگزينه‌اي پيچيده (نوع كِي) كه برخي از انتخاب‌ها تركيب و آميزه‌اي از انتخاب‌هاي ديگر مي‌باشد، پرهيز نماييد.

گزينه‌هاي نوع كِي، درپي خود موردي را دارند كه سعي مي‌كند مطلب را بهبود بخشد.(دستورالعمل سه‌گانه و آزمون‌هاي وابسته)

2.      كداميك از هنرپيشه‌هاي طنز كه در زير به آن‌ها اشاره مي‌شود، اگر باشد، به خاطر حملات لفظي نسبت به ديگران مشهور است؟

الف) بيل كازبي[16]         ب) دان ريكلس[17]        ج) رد اسكلتون[18]         د) الف و ب    ه‍) الف و ج

و) ب و ج       ز) الف، ب و ج          ح) هيچكدام

2-4. براي هريك از هنرپيشه‌هاي طنز زير، نشان بدهيد كه آيا او به خاطر حملات لفظي‌اش از ديگران برجسته‌تر است.

اگر پاسخ شما مثبت است از الف و اگر منفي است از ب استفاده نماييد.

2. بيل كازبي     3. دان ريكلس  4. رد اسكلتون

ü     در خصوص سبك، ويرايش و اصلاح. از قواعد دستور زباني صحيح استفاده نماييد. حدّاقل رساني مقدار مطالعه‌ي آزمون‌دهنده بايد مدّنظر قرار گيرد.

مورد بعدي در خصوص نوشتن ريشه يا تنه مي‌باشد (جملات ناتمام يا سؤالاتي كه مشخّص كننده‌ي مسأله مي‌باشند و آزمون براي حلّ آن مسأله طرّاحي گرديده است)، اين مورد عبارت است از نقطه‌نظر و ايده‌ي مركزي موردي كه مدّنظر مي‌باشد. از اطناب بيش از حد اجتناب نماييد. از استفاده‌ي كلمات مكرّر و پي‌درپي اجتناب كرده و آن‌ها را از تنه انتقال دهيد. لغات موجود در تنه را به صورت مثبت استفاده نماييد، امّا اگر استفاده از عبارات منفي ضروري مي‌باشد، لغت منفي را با حروف درشت يا به صورت برجسته مشخّص نماييد. براي توضيح بيشتر به اين مثال توجّه نماييد:

5. صحّت و اعتبار نمي‌باشد: الف) مربوط به پايايي.   ب) مرتبط با استفاده كنندگان از تست.

ج) مترادف با پايايي، استواري، هم‌ارزي يا هماهنگي دروني.

د) مورد بحث زماني‌كه قلمرو و حيطه مرجع مي‌باشد. ه‍) مهم.

اين گزينه، دارای ضعف می­باشد زیرا تا حدودي شبيه به چيزي است كه در ميان مجموعه‌اي يافت شده است كه ضميمه‌ي يك متن سنجش و اندازه‌گيري مي‌باشد. چنين تنه‌اي مشكلي كه توسّط گزينه مخاطب قرار گرفته است را به صورت دقيق مشخّص نمي‌كند، در حالي‌كه اگربه صورت دقيق مشخّص مي‌نمود به نويسنده‌ي آزمون و آزمون دهنده كمك مي‌كرد؛ چراكه اين سؤال در بردارنده‌ي لغتي منفي مي‌باشد درحالي‌كه اين لغت منفي نه برجسته شده است و نه با حروف درشت نوشته شده است.

ü     مورد ديگر زمان نوشتن گزينه‌هاي تست مي‌باشد. اين بخش را تا آن‌جا كه مي‌توانيد از گزينه‌هاي مؤثّر فراوان استفاده نماييد، امّا بسنده كردن به سه گزينه احتمالاً كفايت مي‌كند.به گونه‌اي طرّاحي نماييد كه مطمئن باشيد فقط يك گزينه صحيح يا بهترين گزينه است. ترتيب گزينه‌ها منطقاً به صورت اعداد يا حروف الفبايي مي‌باشد. گزينه‌ها را از نظر محتوا و قواعد دستوري زبان به صورت همگن و شبيه انتخاب نماييد. مقدار طولاني بودن جملات در گزينه‌ها را تقريباً اندازه‌ي هم قرار دهيد. از گزينه‌ي "هيچكدام" با دقّت استفاده نماييد. از گزينه‌ي "همه‌ي موارد مذكور" اجتناب نماييد. از دادن سرنخ‌هايي مانند ضمائر و صفات معيّن (مثل همواره، قطعاً)،گزينه‌هايي كه به تنه سرنخ مي‌دهند، بي‌ثباتي دستوري و گزينه‌هايي كه باعث لورفتن گزينه‌ي صحيح مي‌شوند، اجتناب كنيد. (بي‌اعتنايي به اين رهنودها در گزينه‌ي 5 در بالا ذكر شد: حدّاقل يكي از گزينه‌ها نامعقول است، بنابراين تعداد گزينه‌ها حدس زده مي‌شود؛ گزينه‌ها طبق حروف الفبا نيستند؛ بنابراين گزينه‌ي صحيح ج مي‌باشد؛ گزينه‌ها از لحاظ محتوايي و دستوري همگن و متجانس نيستند؛ بهترين جواب طولاني‌ترين جمله است و حاوي لغت مترادف است و دو تا از گزينه‌ها داراي مفهومي واحد مي‌باشند، بنابراين جواب احتمالاً يا گزينه‌ي الف است و يا گزينه‌ي ب.) دو رهنمود ديگر: براي نوشتن گزينه‌ي غلط از خطاهاي معمول استفاده نماييد (مانند: جايگزين‌هاي اشتباه؛ جايگزيني كه صحيح يا بهترين گزينه نمي‌باشد.)

وارد كردن قدري شوخي در آزمون به شرطي‌كه سازگار با شرايط معلّم يا موقعيّت در نظر گرفته مي‌شود. در اين‌جا يك مورد را كه كمي شوخي در آن به كار رفته است را ملاحظه مي‌نماييد:

6. دستور عمل: گزينه‌اي را كه در آن غلط دستور زباني به‌كار رفته است را مشخّص نماييد:

الف) عينك جديد داور به نظر مي‌رسيد        ب) تا زماني‌كه او خبر داد به كمك او بپرداز

ج) عقابي كه با توپ بيس‌بال پرواز كرد       د) هيچ خطايي نيست

آزمون‌هاي چندگزينه‌اي كه با دقّت طراحي شده باشد، مي‌تواند نيرومندي زيادي داشته باشد. از اين گذشته همان‌طور كه هالادينا گفت،دارد تلاش مي‌شود تا سيستم مكانيزه‌ي نوشتن چنين آزمون‌هايي ايجاد شود، تا دانش شناختي براي يكپارچه‌سازي نظريّه‌ي اعتبار و براي تحليل عملكرد گزينه‌هاي خطا به كارگرفته شود. شايد سؤال اساسي كه براي همه‌ي ما مطرح استتوسّط برخي عنوان‌هايي كه هجونويسان به‌كار مي‌برند، به بهترين نحو و بدين‌سان تبيين شده باشد: "من هنوز همه‌ي پاسخ‌ها را نمي‌دانم امّادارم سعي مي‌كنم تا سؤالات صحيح را بپرسم."

رابرت اف. مك موريس[19] و زايوان تان[20]



[1]. Encyclopedia of Educational Psychology

[2]. Multiple-Choice Tests

[3]. Robert F. McMorris and Xiaoyuan Tan

[4].stem

[5]. options

[6]. Thomas Haladyna

[7]. Steven Downing

[8].content-valid

[9]. Roger Boothroyd

[10]. Lee J. Cronbach

[11]. David Frisbie

[12]. Robert Ebel

[13]. Haladyna

[14]. Downing

[15].Michael Rodriquez

[16]. Bill Cosby

[17]. Don Rickles

[18]. Red Skelton

[19]. Robert F. McMorris

[20]. Xiaoyuan Tan

این هم متن اصلی مقاله

MULTIPLE-CHOICE TESTS

Multiple-choice tests have perhaps the most popular testing format in education and elsewhere, and students are certainly aware of multiple-choice items.

Multiple-choice test items begin with the problem typically expressed as an incomplete statement or question (also known as the stem) followed by alternatives from which to select (the options).

Certainly, multiple-choice testing is immensely popular in a huge variety of applications in education,

psychology, and beyond. Educational psychologists have pioneered in applying multiple-choice testing for research, instruction, assessment/evaluation, prediction/ selection/classification/placement, certification/ licensure, and for other purposes. Furthermore, educational psychologists have led in conducting research about and development of multiple-choice testing, a short summary of which follows. This entry considers why and how one might use the multiple-choice form, general goals for test developers (including teachers), and more specific item-writing guidelines (especially for multiple-choice items).

Why Use Multiple-Choice Tests?

A multitude of scholars, including Thomas Haladyna and Steven Downing, have indicated a number of strengths of multiple-choice testing. Sampling of content can be excellent, supporting content-valid test interpretations. Reliability of scores can be high. Items can be easily pretested, scored, used, and reused.

Objective, high-speed scoring is possible. Diagnostic subscores are easily obtained. Adaptive testing can be done well with this format. Most content can be tested with this format, including many types of higher-level thinking, even though many writers limit themselves to pedestrian, knowledge-level items. It is a flexible format, and guessing is seldoma problem. If a test-taker is troubled by an item, another item, and opportunity, awaits.

Formal and Informal

Uses of Multiple-Choice Tests

Multiple-choice tests are the typical choice to provide

big summative evaluations such as whether someone

passes a course or earns a professional license. Yet

there are also instructional or informal times when

a multiple-choice format can encourage student participation,

provide corrective feedback to the instructor

and students, focus everyone’s attention on a topic,

give a break from the instructor’s droning, preview

and prepare for a test, and even allow a microbit of

humor.

A Few Goals for Test Developers

Multiple-choice tests should ask important questions

consistent with educational objectives or with the projected

uses for the test, and ask them clearly. An early

National Assessment guideline essentially stated that

an item be important and clear enough to be published

in the newspaper. Roger Boothroyd concluded that

test-takers should either answer correctly for the right

reason(s) or, if answering incorrectly, do so for the right

reason(s). He is consistent with Lee J. Cronbach’s

counsel to minimize irrelevant difficulties. Test items

are perhaps ourmost closely read literature and deserve

to be based on vital questions that are cleanly stated.

Guidelines for Selecting,

Revising, and Writing Good Items

There are three ways to develop test items: selecting

existing items, revising existing items, and writing

new ones. Educators should evaluate their testing

method to be sure that the test items correlate with

educational objectives, as some of these methods may

prove to be problematic. For example, David Frisbie

and others found that tests accompanying textbooks

are likely to include

1. Trivial items, even based merely on phrases lifted

from the text,

2. Incomplete coverage,

3. Irrelevant items,

4. Little testing of application, understanding, and

critical thinking, and

5. Item faults.

That is, developing a test by appropriating items

from a test accompanying the textbook would likely

provide a poor sample of items relative to the objectives

of the course, with many trivial, irrelevant, lowlevel

items; few items testing higher-level thinking;

and big gaps in coverage. Additionally, items may

contain errors in item writing, especially item-writing

faults that either lead a test-taker to answer correctly

for the wrong reason or answer incorrectly for the

wrong reason, as cautioned against by Boothroyd and

illustrated in Item 5 below.

There are many guides for selecting, revising, and

writing quality multiple-choice items, even Robert

Ebel’s dating back more than 50 years. A more recent

taxonomy developed by Haladyna, Downing, and

Michael Rodriquez, based on research and textbook

authors’ advice, is excerpted, modified, and occasionally

illustrated in the following paragraphs.

When selecting item content, base items on content

and mental behavior represented in the table of specifications.

Test important and not trivial content. Use

novelty to test higher-level learning. Avoid overly

specific and overly general content. Avoid trick questions,

and keep vocabulary sufficiently simple. A

thought-provoking and novel item follows:

1. You are in a boat in a very small pond. You throw

four big stones overboard into the water. Assuming precise

measurements, the water level in the pond will

A. rise

B. fall

C. stay the same

Solution: The key is B. When the stones are in the

boat, the boat displaces water equal to the weight of

the stones. When the stones are in the water, the stones

displace their volume in water. Which has more volume,

100 lbs. of water or 100 lbs. of stones? So the

710 Multiple-Choice Tests

stones in the boat displace more water than when they

are in the water.

When formatting, arrange options vertically. Use

multiple-choice, alternate-choice, true-false, multiple

true-false, matching, and context-dependent multiplechoice,

but avoid complex multiple-choice (Type K),

where some choices are combinations of other choices.

A Type K item followed by an improvement (three

brief, independent items):

2. Which of the following comedians, if any, is/

are noted for verbal attacks on others?

A. Bill Cosby

B. Don Rickles

C. Red Skelton

D. A & B

E. A & C

F. B & C

G. A, B, & C

H. None of the above.

2–4. For each of the following comedians, indicate

whether he is noted for verbal attacks on others.

Use A if yes, B if no.

2. Bill Cosby

3. Don Rickles

4. Red Skelton

Concerning style, edit and proof. Use correct grammar.

Minimize the amount of reading test-takers must do.

When writing the stem (the incomplete statement

or question specifying the problem to be solved),

include the item’s central idea. Avoid extra verbiage.

Move repeated words to the stem. Word the stem positively,

but if negative phrasing is necessary, capitalize

or bold the negative word. To illustrate,

5. Validity is not

A. related to reliability.

B. an appropriate concern for test users.

C. synonymous with reliability, stability, equivalence,

or internal consistency.

D. involved when domain referencing.

E. important.

This item, somewhat similar to one found in a set

of items accompanying a measurement text, starts

off poorly. The stem does not specify the problem

addressed by the item, which would have helped

direct the item writer and the test-taker; it contains

a negative, and the negative is not bolded or in caps.

When writing choices, develop as many effective

choices as you can, but three is likely fine. Ensure that

only one choice is correct or best. Order choices logically,

numerically, or alphabetically. Keep choices

homogeneous in content and grammar. Make choice

lengths about equal. Use ‘‘none of the above’’ carefully.

Eschew ‘‘all of the above.’’ Avoid clues such as

specific determiners (e.g., always, absolutely), choices

clued by the stem, grammatical inconsistencies, and

pairs or triplets of options that clue the correct choice.

(Inattention to some of these guidelines is illustrated in

Item 5 above: At least one choice is implausible, so the

number of options could be trimmed; choices are not

alphabetized, so the key is C; choices are not homogeneous

in content or grammar; the best answer is the

longest and contains the word synonymous; and two

options contain the same concept, so the key is likely

A or C.) Two other guidelines: Use typical errors to

write distractors (i.e., the wrong alternatives; the alternatives

that are not the correct or best alternative).

Incorporate humor if compatible with the teacher and

situation. Here is an item with a bit of humor:

6. Directions: Select the letter corresponding to

the line containing any grammatical error.

A. the umpire’s new glasses seemed to

B. be helping him until he called

C. a eagle that flew by a foul ball

D. (no mistakes)

Multiple-choice tests, carefully crafted, can have

many strengths. Furthermore, as Haladyna discussed,

attempts are being made to automate item writing, to

apply cognitive science, to integrate validity theory,

and to analyze distractor performance. Perhaps the

challenge for all of us is best expressed by various

cartoonists’ captions, such as, ‘‘I don’t yet have all

the answers, but I am beginning to ask the right

questions.’’

Robert F. McMorris and Xiaoyuan Tan

See also Aptitude Tests; Bloom’s Taxonomy of Educational

Objectives; Certification; Criterion-Referenced Testing;

Multiple-Choice Tests 711

High-Stakes Testing; Measurement; Norm-Referenced

Tests; Standardized Tests; Testing

Further Readings

Berk, R. A. (2002). Humor as an instructional defibrillator:

Evidence-based techniques in teaching and assessment.

Sterling, VA: Stylus.

Carter, K. (1986). Test-wiseness for teachers and students.

Educational Measurement: Issues and Practice, 5(4), 20–23.

Ebel, R. L. (1951). Writing the test item. In E. F. Lindquist

(Ed.), Educational measurement (pp. 185–249).

Washington, DC: American Council on Education.

Frisbie, D. A., Miranda, D. U., & Baker, K. K. (1993). An

evaluation of elementary textbook tests as classroom

assessment tools. Applied Measurement in Education,

6(1), 21–36.

Haladyna, T. M. (2004). Developing and validating multiplechoice

test items. Mahwah, NJ: Lawrence Erlbaum.

Haladyna, T. M., & Downing, S. M. (1989). A taxonomy of

multiple-choice item-writing rules. Applied Measurement

in Education, 2, 37–50.

Haladyna, T. M., Downing, S. M., & Rodriguez, M. C.

(2002). A review of multiple-choice item-writing

guidelines for classroom assessment. Applied

Measurement in Education, 15(3), 309–334.

McMorris, R. F.,&Boothroyd, R. A. (1993).Tests that teachers

build: An analysis of classroomtests in science and

mathematics. AppliedMeasurement in Education, 6, 321–342.

 


مطالب مشابه :


انواع استدلال و زاويه

( -28 گزينه ي ( 2 دو به دو بر هم عمود باشند، آن گاه يكي از دو حالت زير ممكن است رخ دهد:




درس نهم دو غزل / سعدي شيرازي

درس نهم دو غزل / سعدي شيرازي 117- در همه ي گزينه ها به جز گزينه صنعت ادبي تشبيه ديده مي شود.




مهارت تست زنی

اگر در تستي مطمئن شديد، دو گزينه اشتباه بوده و بخواهيد گزينه ي درست را به از دو گزينه ي




نمونه تست فصل 6-7-8 سال سوم تجربی

جواب گزينه 2 . 2-تيغه ي مياني سلول هاي گياهي جواب گزينه 3 دو حالت 22 يا 24 مي تواند باشد كه در




ادبیات2

8ـ در همه‌ي گزينه‌ها به جز گزينه‌ي . . . . . . دو آرايه‌ي تشبيه و استعاره وجود دارد. 1)




ادبیات تخصصی

جمله ي دو جزئي :( نهاد + فعل ناگذر ) 1- كدام گزينه جمله ي چهار جزئي دو مفعولي است ؟ 1)




سوالات ادبيات فارسي تستی با پاسخ نامه

بقيه ي گزينه ها آثار ديگر ويکتور گزينه «3» هر دو بيت به ناپايداري و بي وفايي دنيا و پايان




آزمون هاي چند گزينه اي

از گزينهي واحد مي‌باشند، بنابراين جواب احتمالاً يا گزينهي الف است و يا گزينهي ب.) دو




برچسب :