آزمون استاندارد

٢٦ آذر ١٣٩٨

آزمون‌های استاندارد[1] معمولاً اصطلاح «آزمون استاندارد» را با آزمون‌هایی اشتباه می‌گیرند که از اقلام چندگزینه‌ای و پاسخ‌نامه‌ای که ماشین آن را می‌خواند، استفاده می‌کنند. برعکس، اگر هر جنبه‌ای از یک آزمون -شکل، روال کار یا اجرا- برای همۀ آزمون‌دهندگان استاندارد شده باشد، می‌تواند آن‌را آزمونی استاندارد تلقی کرد؛ بنابراین، آزمون‌هایی که دستورالعمل‌ها یا پاسخ‌های کتبی و شفاهی دارند، ممکن است استاندارد باشند. البته آزمون‌های فیزیکی، مانند آن‌هایی که به‌وسیلۀ مهندسان گرفته می‌شود نیز، ممکن است استاندارد شوند، اما تمرکز بیشتر بر سنجش ویژگی‌های ذهنی پنهان (یعنی نامشهود) است.

هم پیمایش‌ها و هم آزمون‌ها، ویژگی‌های ذهنی را می‌سنجند. «پیمایش‌ها» معمولاً نگرش‌ها یا آراء را می‌سنجند، حال آنکه «آزمون‌ها» معمولاً مهارت‌ها یا استعدادها را. بااین‌حال، آزمون‌ها به سان پیمایش‌ها، از «اقلام» (مانند پرسش‌ها و رهنمودها) تشکیل شده‌اند.

آموزگاران و روان‌شناسان، بیش از سایر گروه‌ها، از آزمون‌های ذهنی استاندارد بهره می‌گیرند. آموزگاران، دستاورد تحصیلی (یعنی تسلط بر دانش یا مهارت‌ها) را اندازه می‌گیرند، مشکلات یادگیری یا استعداد را تشخیص می‌دهند و نامزدهای برنامه‌های تحصیلی بالاتر را برمی‌گزینند. روان‌شناسان باورها، نگرش‌ها و ترجیحات را می‌سنجند، مشکلات یا نقاط قوت روان‌شناختی را تشخیص می‌دهند و نامزدهای استخدام را برمی‌گزینند.

آزمون‌های استاندارد خوب، معمولاً «اتکاپذیرند» -یعنی نتایج آن‌ها در هر زمان و اوضاع و احوال و در مورد همۀ آزمون‌دهندگان، مشروط به اینکه ویژگی‌های یکسانی داشته باشند، منسجم است- و «روایی» دارند -همان ویژگی‌هایی را می‌سنجند که قصد سنجش آن‌ها را داریم. یک آزمون کارآمد، زمانی که برای «گزینش» (مانند پذیرش دانشگاه و استخدام) به‌کار رود، «اعتبار پیش‌بین» بالایی -همبستگی نیرومند میان نمره‌های آزمون و عملکرد آینده- دارد یا «کارایی تخصیصی»[2] -همبستگی بالا میان نمره‌های آزمون و عملکرد گروه، به‌ مثابة یک کل، آنگاه که افراد جدا در ساختاری خاص از روابط سامان می‌یابند.

زمانی که آزمون‌ها نتایج یا خطرهایی دارند، ممکن است اثرات جنبی سودمندی پدید آورند. پژوهش‌های متعدد نشان می‌دهند که دانش‌آموزان و نامزدها، زمانی که با آزمون‌های خطیر مواجه می‌شوند، بیشتر مطالعه می‌کنند و مطالعاتشان را جدی‌تر می‌گیرند (و بدین ترتیب، بیشتر یاد می‌گیرند). افزون‌براین، زمانی که آزمون‌دهندگان، تمایل دارند عملکرد خوبی داشته باشند و آموزگاران مشتاق‌اند که به آن‌ها کمک کنند، دانش‌آموزان هم‌وغم خود را صرف تسلط بر دانش یا مهارت‌هایی می‌کنند که به گمان‌شان در آزمون سنجیده می‌شود. این مسئله تأثیر غیرمستقیم، اما معمولاً سودمندی بر افزایش کارایی می‌گذارد؛ بدین شکل که محتوای برنامه‌های آموزشی یا تعلیمی را با استاندادها، ملاک‌ها و اهداف همساز می‌سازد.

آزمون‌های آموزشی

در بیشتر نقاط جهان، آزمون‌های آموزشی، مبتنی بر استانداردها و برنامه‌های درسی مشترک هستند. آموزگاران، تعلیمات‌شان و دانش‌آموزان، مطالعاتشان را با این آزمون‌ها همساز می‌کنند. اغلب این آزمون‌ها، نتایجی دارند و معمولاً در نقطۀ ورود و/یا خروج سطوح تحصیلی قرار می‌گیرند. بیشتر کشورها هم آزمون اتمام مقطع دبیرستان و ورود به دانشگاه و نیز یا آزمون اتمام مقطع راهنمایی یا آزمون ورود به مقطع دبیرستان می‌گیرند.

بااین‌حال، در ایالات متحده که در آن مدیریت آموزش چندپاره‌تر است، اجرا و تحمیل استانداردها و برنامه‌های درسی مشترک دشوار است. بسیاری از ایالت‌ها و نواحی آموزشی امریکا، به‌جای آزمون‌های استانداردمحور (آزمون‌های «معیارمند»)، از ناشران آزمون‌های بازرگانی، آزمون‌های «میانگین‌مند» خریداری می‌کنند. «میانگین‌ها» از طریق آزمون‌های میدانی و نمونه‌گیری از دانش‌آموزان، در سطح ملی، ساخته می‌شود و بر برنامۀ درسی که خود ناشران تهیه می‌کنند، مبتنی است. در غیاب آزمون‌های استانداردمحور، از آزمون‌های استعداد برای تصمیمات مهمی مانند نام‌نویسی دانش‌آموزان در برنامه‌های ویژه، ابقا آن‌ها در پایه‌های تحصیلی، دادن کمک‌هزینۀ تحصیلی یا قبول‌کردن آن‌ها در مدارس یا دانشگاه‌های منتخب استفاده می‌شود.

بااین‌حال، دادگاه‌ها از آن زمان اعلام کرده‌اند که تحمیل نتایج منفی، مانند ابقاء در پایه یا رد دیپلم، به دانش‌آموزانی که در آزمون‌هایی که مبتنی بر برنامه‌های درسی ساختگی نه برنامه‌های درسی واقعی هستند، نامنصفانه است. این اصل از آن زمان در «استانداردهای آزمون روان‌شناختی و آموزشی» -مقررات غیررسمی که بر کاربردهای حقوقی آزمون‌های استاندارد در ایالات متحده سایه افکنده است- آمده است. درنتیجه، تقریباً همۀ آزمون‌های ارتقای پایۀ تحصیلی و فارغ‌التحصیلی، استانداردمحورند، نه میانگین‌محور و آزمون‌های دستاوردند، نه آزمون‌های استعداد.

توسعۀ آزمون

آزمون‌های استاندارد، از رهگذر فرایندی توان‌فرسا و زمان‌بر که مبتنی بر نظریۀ آزمون کلاسیک یا نظریه پاسخ به اقلام هستند، تحول می‌یابند. در نظریۀ «آزمون کلاسیک»، هر آزمون، به‌صورت سفارشی طراحی می‌شود و به جمعیتی خاص مربوط است. نخست، فرد مسئول، چارچوب یا نمایی کلی از محتوای آزمون ترسیم می‌کند، سپس آن‌را براساس بازبینی‌های متخصصان یا باتجربه‌ها، اعتبار می‌بخشد. در گام بعد، اقلام آزمون را می‌نویسد و آن‌ها از طریق نمونۀ معرفی از آزمون‌دهندگان در میدان می‌آزمایند، کاری که بدون مواجه‌ساختن آن جمعیت با محتوای آزمون، ممکن است دشوار باشد.

توسعۀ آزمون براساس نظریه «پرسش به اقلام» (آر.آی.تی)، نیازمند جمعیت‌های بزرگی از آزمون‌دهندگان است تا آماری معتبر از آزمون‌ها پدید آید؛ اما این آمارها، به هیچ انتخاب خاصی از میان نمونه‌های پاسخ‌دهنده وابسته نیست. به‌علاوه، نمرات پاسخ‌دهندگان، به هیچ انتخاب خاصی از میان اقلام آزمون وابسته نیست.

آزمون «انطباقی رایانه‌ای» (سی.ای.تی)، وجود و محبوبیت روزافزونش را به نظریه آر.آی.تی مدیون است. در سی.ای.تی به آزمون‌دهندگان، اقلامی می‌دهند که سطح دشواریشان را بر عملکرد آزمون‌شوندگان در اقلام پیشین تعیین می‌کند. پاسخ‌های صحیح، به اقلام دشوارتر می‌انجامند. آن‌هایی که به همه اقلام پاسخ صحیح دهند، با نادیده گرفتن نیاز به پاسخ به اقلام کمتر دشوار، آزمون را زودهنگام به پایان می‌رسانند.

و نیز ببینید: استانداردهای تحصیلی؛ آزمون مهارت‌های مقدماتی؛ آموزش و عملکرد تحصیلی؛ آموزش و کودکان نیازمند به خدمات خاص؛ پژوهش ارزیابنده؛ آزمون آی‌کیو؛ آزمون توانمندی حداقلی

بیشتر بخوانید

American Educational Research Association, American Psychological Association, and National Council on Measurement in Education. 1999. Standards for Educational and Psychological Testing. Washington, DC: American Educational Research Association, American Psychological Association, and National Council on Measurement in Education

American Psychological Association. 2005. “Finding Information about Psychological Tests.” Retrieved January 4, 2008 (http://www.apa.org/science/faqfindtests. html)

Association of American Publishers. 2006. “Standardized Assessment: A Primer.” Washington, DC: Association of American Publishers. Retrieved January 4, 2008 (http://www.publishers.org/school/pdf/Testing%20Primer %20Revised.pdf)

Downing, Steven M. and Thomas M. Haladyna. 2006. Handbook of Test Development. Mahwah, NJ: Erlbaum

Hambleton, Ronald K., Hariharan Swaminathan, and H. Jane Rogers. 1991. Fundamentals of Item Response Theory. Newbury Park, CA: Sage

International Test Commission. 2006. “Guidelines on Adapting Tests, on Test Use, and on Computer-Based and Internet-Delivered Testing.” Retrieved January 4, 2008 (http://www.intestcom.org/itc_projects.htm)

National Organization for Competency Assurance. 2005. “The NOCA Guide to Understanding Credentialing Concepts.” Washington, DC: National Organization for Competency Assurance. Retrieved January 4, 2008 (http://www.danb.org/PDFs/NOCAguide2005.pdf)

Phelps, Richard P. 2003. Kill the Messenger. New Brunswick, NJ: Transaction

———, ed. 2005. Defending Standardized Testing. Mahwah, NJ: Erlbaum

———. 2005. “The Source of Lake Wobegon.” Third Education Group Review 1:2. Retrieved January 4, 2008 (http://www.thirdeducationgroup.org/Review/Articles/v1n 2.htm)

———, ed. 2007. The Anti-Testing Fallacies. Washington, DC: American Psychological Association

[1] standardized testing

[2] allocative efficiency

برچسب ها

مطالب مرتبط

٠٦ ارديبهشت ١٣٩٩

پژوهشگاه فرهنگ، هنر و ارتباطات

آزمون استاندارد

رزومه دکتر زهرا عبدالله

روان‌پریش‌ها

روان‌آزار

رفاه

خلأ دانش ارتباطات بحران؛ چالشی مهم در نظام رسانه‌ای کشور

کتاب «سواد رسانه‌ای؛ کلیدهایی برای تفسیر پیام‌های رسانه‌ای» منتشر شد

نشست تخصصی «شهرت و موسیقی» برگزار می‌شود

کتاب «سیاست‌های پوشاک در دوره قاجار و پهلوی اول» نقد می‌شود

دین و رسانه، از رسانه ملی تا مسائل رسانه‌های اجتماعی در ایران

آموزش علوم‌اجتماعی در مدارس و مسئله شهروندی

پژواک یک نامه

نقد کتاب «مسئله و ناخودآگاه متن در گفتمان پژوهشی ادبیات پایداری»