آزمون استاندارد
آزمونهای استاندارد[1] معمولاً اصطلاح «آزمون استاندارد» را با آزمونهایی اشتباه میگیرند که از اقلام چندگزینهای و پاسخنامهای که ماشین آن را میخواند، استفاده میکنند. برعکس، اگر هر جنبهای از یک آزمون -شکل، روال کار یا اجرا- برای همۀ آزموندهندگان استاندارد شده باشد، میتواند آنرا آزمونی استاندارد تلقی کرد؛ بنابراین، آزمونهایی که دستورالعملها یا پاسخهای کتبی و شفاهی دارند، ممکن است استاندارد باشند. البته آزمونهای فیزیکی، مانند آنهایی که بهوسیلۀ مهندسان گرفته میشود نیز، ممکن است استاندارد شوند، اما تمرکز بیشتر بر سنجش ویژگیهای ذهنی پنهان (یعنی نامشهود) است.
هم پیمایشها و هم آزمونها، ویژگیهای ذهنی را میسنجند. «پیمایشها» معمولاً نگرشها یا آراء را میسنجند، حال آنکه «آزمونها» معمولاً مهارتها یا استعدادها را. بااینحال، آزمونها به سان پیمایشها، از «اقلام» (مانند پرسشها و رهنمودها) تشکیل شدهاند.
آموزگاران و روانشناسان، بیش از سایر گروهها، از آزمونهای ذهنی استاندارد بهره میگیرند. آموزگاران، دستاورد تحصیلی (یعنی تسلط بر دانش یا مهارتها) را اندازه میگیرند، مشکلات یادگیری یا استعداد را تشخیص میدهند و نامزدهای برنامههای تحصیلی بالاتر را برمیگزینند. روانشناسان باورها، نگرشها و ترجیحات را میسنجند، مشکلات یا نقاط قوت روانشناختی را تشخیص میدهند و نامزدهای استخدام را برمیگزینند.
آزمونهای استاندارد خوب، معمولاً «اتکاپذیرند» -یعنی نتایج آنها در هر زمان و اوضاع و احوال و در مورد همۀ آزموندهندگان، مشروط به اینکه ویژگیهای یکسانی داشته باشند، منسجم است- و «روایی» دارند -همان ویژگیهایی را میسنجند که قصد سنجش آنها را داریم. یک آزمون کارآمد، زمانی که برای «گزینش» (مانند پذیرش دانشگاه و استخدام) بهکار رود، «اعتبار پیشبین» بالایی -همبستگی نیرومند میان نمرههای آزمون و عملکرد آینده- دارد یا «کارایی تخصیصی»[2] -همبستگی بالا میان نمرههای آزمون و عملکرد گروه، به مثابة یک کل، آنگاه که افراد جدا در ساختاری خاص از روابط سامان مییابند.
زمانی که آزمونها نتایج یا خطرهایی دارند، ممکن است اثرات جنبی سودمندی پدید آورند. پژوهشهای متعدد نشان میدهند که دانشآموزان و نامزدها، زمانی که با آزمونهای خطیر مواجه میشوند، بیشتر مطالعه میکنند و مطالعاتشان را جدیتر میگیرند (و بدین ترتیب، بیشتر یاد میگیرند). افزونبراین، زمانی که آزموندهندگان، تمایل دارند عملکرد خوبی داشته باشند و آموزگاران مشتاقاند که به آنها کمک کنند، دانشآموزان هموغم خود را صرف تسلط بر دانش یا مهارتهایی میکنند که به گمانشان در آزمون سنجیده میشود. این مسئله تأثیر غیرمستقیم، اما معمولاً سودمندی بر افزایش کارایی میگذارد؛ بدین شکل که محتوای برنامههای آموزشی یا تعلیمی را با استاندادها، ملاکها و اهداف همساز میسازد.
آزمونهای آموزشی
در بیشتر نقاط جهان، آزمونهای آموزشی، مبتنی بر استانداردها و برنامههای درسی مشترک هستند. آموزگاران، تعلیماتشان و دانشآموزان، مطالعاتشان را با این آزمونها همساز میکنند. اغلب این آزمونها، نتایجی دارند و معمولاً در نقطۀ ورود و/یا خروج سطوح تحصیلی قرار میگیرند. بیشتر کشورها هم آزمون اتمام مقطع دبیرستان و ورود به دانشگاه و نیز یا آزمون اتمام مقطع راهنمایی یا آزمون ورود به مقطع دبیرستان میگیرند.
بااینحال، در ایالات متحده که در آن مدیریت آموزش چندپارهتر است، اجرا و تحمیل استانداردها و برنامههای درسی مشترک دشوار است. بسیاری از ایالتها و نواحی آموزشی امریکا، بهجای آزمونهای استانداردمحور (آزمونهای «معیارمند»)، از ناشران آزمونهای بازرگانی، آزمونهای «میانگینمند» خریداری میکنند. «میانگینها» از طریق آزمونهای میدانی و نمونهگیری از دانشآموزان، در سطح ملی، ساخته میشود و بر برنامۀ درسی که خود ناشران تهیه میکنند، مبتنی است. در غیاب آزمونهای استانداردمحور، از آزمونهای استعداد برای تصمیمات مهمی مانند نامنویسی دانشآموزان در برنامههای ویژه، ابقا آنها در پایههای تحصیلی، دادن کمکهزینۀ تحصیلی یا قبولکردن آنها در مدارس یا دانشگاههای منتخب استفاده میشود.
بااینحال، دادگاهها از آن زمان اعلام کردهاند که تحمیل نتایج منفی، مانند ابقاء در پایه یا رد دیپلم، به دانشآموزانی که در آزمونهایی که مبتنی بر برنامههای درسی ساختگی نه برنامههای درسی واقعی هستند، نامنصفانه است. این اصل از آن زمان در «استانداردهای آزمون روانشناختی و آموزشی» -مقررات غیررسمی که بر کاربردهای حقوقی آزمونهای استاندارد در ایالات متحده سایه افکنده است- آمده است. درنتیجه، تقریباً همۀ آزمونهای ارتقای پایۀ تحصیلی و فارغالتحصیلی، استانداردمحورند، نه میانگینمحور و آزمونهای دستاوردند، نه آزمونهای استعداد.
توسعۀ آزمون
آزمونهای استاندارد، از رهگذر فرایندی توانفرسا و زمانبر که مبتنی بر نظریۀ آزمون کلاسیک یا نظریه پاسخ به اقلام هستند، تحول مییابند. در نظریۀ «آزمون کلاسیک»، هر آزمون، بهصورت سفارشی طراحی میشود و به جمعیتی خاص مربوط است. نخست، فرد مسئول، چارچوب یا نمایی کلی از محتوای آزمون ترسیم میکند، سپس آنرا براساس بازبینیهای متخصصان یا باتجربهها، اعتبار میبخشد. در گام بعد، اقلام آزمون را مینویسد و آنها از طریق نمونۀ معرفی از آزموندهندگان در میدان میآزمایند، کاری که بدون مواجهساختن آن جمعیت با محتوای آزمون، ممکن است دشوار باشد.
توسعۀ آزمون براساس نظریه «پرسش به اقلام» (آر.آی.تی)، نیازمند جمعیتهای بزرگی از آزموندهندگان است تا آماری معتبر از آزمونها پدید آید؛ اما این آمارها، به هیچ انتخاب خاصی از میان نمونههای پاسخدهنده وابسته نیست. بهعلاوه، نمرات پاسخدهندگان، به هیچ انتخاب خاصی از میان اقلام آزمون وابسته نیست.
آزمون «انطباقی رایانهای» (سی.ای.تی)، وجود و محبوبیت روزافزونش را به نظریه آر.آی.تی مدیون است. در سی.ای.تی به آزموندهندگان، اقلامی میدهند که سطح دشواریشان را بر عملکرد آزمونشوندگان در اقلام پیشین تعیین میکند. پاسخهای صحیح، به اقلام دشوارتر میانجامند. آنهایی که به همه اقلام پاسخ صحیح دهند، با نادیده گرفتن نیاز به پاسخ به اقلام کمتر دشوار، آزمون را زودهنگام به پایان میرسانند.
و نیز ببینید: استانداردهای تحصیلی؛ آزمون مهارتهای مقدماتی؛ آموزش و عملکرد تحصیلی؛ آموزش و کودکان نیازمند به خدمات خاص؛ پژوهش ارزیابنده؛ آزمون آیکیو؛ آزمون توانمندی حداقلی
بیشتر بخوانید
American Educational Research Association, American Psychological Association, and National Council on Measurement in Education. 1999. Standards for Educational and Psychological Testing. Washington, DC: American Educational Research Association, American Psychological Association, and National Council on Measurement in Education
American Psychological Association. 2005. “Finding Information about Psychological Tests.” Retrieved January 4, 2008 (http://www.apa.org/science/faqfindtests. html)
Association of American Publishers. 2006. “Standardized Assessment: A Primer.” Washington, DC: Association of American Publishers. Retrieved January 4, 2008 (http://www.publishers.org/school/pdf/Testing%20Primer %20Revised.pdf)
Downing, Steven M. and Thomas M. Haladyna. 2006. Handbook of Test Development. Mahwah, NJ: Erlbaum
Hambleton, Ronald K., Hariharan Swaminathan, and H. Jane Rogers. 1991. Fundamentals of Item Response Theory. Newbury Park, CA: Sage
International Test Commission. 2006. “Guidelines on Adapting Tests, on Test Use, and on Computer-Based and Internet-Delivered Testing.” Retrieved January 4, 2008 (http://www.intestcom.org/itc_projects.htm)
National Organization for Competency Assurance. 2005. “The NOCA Guide to Understanding Credentialing Concepts.” Washington, DC: National Organization for Competency Assurance. Retrieved January 4, 2008 (http://www.danb.org/PDFs/NOCAguide2005.pdf)
Phelps, Richard P. 2003. Kill the Messenger. New Brunswick, NJ: Transaction
———, ed. 2005. Defending Standardized Testing. Mahwah, NJ: Erlbaum
———. 2005. “The Source of Lake Wobegon.” Third Education Group Review 1:2. Retrieved January 4, 2008 (http://www.thirdeducationgroup.org/Review/Articles/v1n 2.htm)
———, ed. 2007. The Anti-Testing Fallacies. Washington, DC: American Psychological Association
[1] standardized testing
[2] allocative efficiency