(۲-۴)
(۲-۵)
: پاسخ سؤال میباشد، زمانی که سؤال صحیح پاسخ دادهمیشود و زمانی که پاسخ سؤال غلط میباشد
: تابع چگالی احتمال نرمال استاندارد
: تابع چگالی تجمعی نرمال استاندارد
و
(۲-۶)
که در معادله (۲-۶)، و به صورت زیر تعریف میشوند:
نمرهدهی آزمون سنجش انطباقی به روش اوون، تنها یک پاسخ را در یک زمان درنظرمیگیرد. همه اطلاعات قبلی در پارامترهای توزیع پیشین وارد میشود و بعد از هر سؤال تغییر میکنند. به دلیل اطلاعات پیشین اضافهشده، در شیوه های بیزین این مزیت وجود دارد که نسبت به MLE خطاهای استاندارد کوچکتری در تعداد یکسانی از سؤالات اجراشده دارند. با این وجود، استفاده از یک پیشین نادرست، باعث میشود که برای بهبود برآورد، به تعداد سؤالات بیشتری نیاز داشتهباشیم، و بازگشت به سمت میانگین در برآورد توانایی رخدهد. با این وجود، کاربرد روش بیزین اوون برای برآورد توانایی پایانی، به دلیل وابستگی به ترتیب ارائه سؤالات توصیه نمیشود (پارشال، اسپری، کالن و دیوی، ۲۰۰۲).
شیوه بیشینهی درست نمایی
برآورد بیشینهی درست نمایی توانایی از طریق جستجوی مقدار بیشینهی تابع درست نمایی تعیین میشود. از این شیوه برآورد، زمانی که پارامترهای سؤال معلوم باشند، به کار میرود. در این روش فرض بر این است که یک آزمودنی با الگوی پاسخ که به طور تصادفی انتخاب میشود، به مجموعهای n سؤالی پاسخ میدهد. اگر پاسخ صحیح به سؤال باشد و پاسخ غلط به سؤال باشد. بر اساس مفروضهی استقلال موضعی، احتمال مشترک مشاهده الگوی پاسخ برای این آزمودنی برابر است با؛ حاصلضرب احتمالهای مشاهده شده پاسخهای او. معادلهی (۲-۷) این حاصل را نشان میدهد:
(۲-۷)
با در نظر گرفتن و ، تابع درست نمایی میتواند به صورت معادلهی (۲-۸) نوشته شود:
(۲-۸)
حال اگر الگوی پاسخ مشخص باشد، یعنی باشد، دیگر کاربرد احتمال مناسب نخواهد بود، لذا در این شرایط معادلهی احتمال مشترک را تابع درست نمایی مینامیم و آن را با معادلهی (۲-۹) نشان میدهیم:
(۲-۹)
از آنجا که تابع درست نمایی حاصلضرب کمیتهایی است که بین صفر و یک قرار دارد، بنابرین، حاصلضرب مقدار فوق بسیار کوچک میشود، مقیاس سازی بهتری از آن این است که از تبدیل لگاریتمی استفاده شود. معادلهی (۲-۱۰) این تبدیل لگاریتمی را نشان میدهد:
(۲-۱۰)
حال مقدار که تابع درست نمایی یا لگاریتم تابع درست نمایی یک آزمودنی را بیشینه سازد، به عنوان برآورد بیشینهی درست نمایی برای آن آزمودنی تعیین میشود (همبلتون، سوامیناتان و راجرز، ۱۹۹۱). برآورد بیشینهی درست نمایی برای آزمونهای کوتاه با ثبات نیست و تا زمانیکه آزمودنی در الگوی پاسخ خود پاسخ صحیح یا غلط نداشته باشد مقدار نامحدود به دست میآید. MLE مقدار اریب نسبتاً کمی دارد. ولی یکی از مشکلات آن این است که گاهی اوقات چندین نقطه بیشینه خواهد داشت. این روش به محاسبات طولانیتری نسبت به روشهای بیزین نیاز دارد (پارشال، اسپری، کالن و دیوی، ۲۰۰۲).
مواجهه سؤال[۱۲۲]
در کل، اغلب روشهای انتخاب سؤال، برخی از سؤالات را بیشتر از سؤالات دیگر، به دلیل، صفات برتر اندازهگیری یا ویژگیهای مطلوب سؤال ترجیح میدهند. در نتیجه، برخی از سؤالات بیشتر از حد مجاز برای آزمودنیها اجرا میشوند. این امر ممکن است باعث فاش شدن سؤال شود، که روایی نمرات آزمون را از بین میبرد (وایس و کینگسبری[۱۲۳]، ۲۰۰۰). به عبارت دیگر، برخی از سؤالات نیز کمتر مورد استفاده قرار میگیرند که این امر هم باعث اتلاف سرمایه ها میشود. بنابرین، انتخاب راهبردی برای کنترل مواجهه سؤالات برای آزمودنیها، بخش جداییناپذیر طراحی آزمون است (داویس و داد[۱۲۴]، ۲۰۰۳).
یکی از اولین روشهایی که برای برخورد با مسائل کنترل مواجهه ایجاد شده است، روش ۵-۴-۳-۲-۱ ( هتر و سیمپسون، ۱۹۹۷؛ مکبرید و مارتین[۱۲۵]، ۱۹۸۳) که در CAT-ASVAB به کار رفت، میباشد. کینگسبری و زارا[۱۲۶] (۱۹۸۹)، و تامسون[۱۲۷] (۱۹۹۸) روشهای متفاوت تصادفی را برای کاهش نرخ مواجهه کلی طراحی کردند. روشهای چرخشی خزانهی سؤال (وای[۱۲۸]، ۱۹۹۸، وای و استفان[۱۲۹] و اندرسون[۱۳۰]، ۱۹۹۸، آریل، ولدکمپ و وندرلیندن، ۲۰۰۴ ) و CAST (لانچ و نانگستر[۱۳۱]، ۱۹۹۸)، به منظور توزیع سؤالات در تستهای متفاوت از طریق یک قیاس ایجاد شدند تا دردسترس بودن انتخاب سؤالات را کاهش دهند. با این وجود، در صنعت CAT، روش کنترل مواجهه سؤال مبتنی بر روش سیمپسون و هتر، (۱۹۸۵) به طور وسیعتری به کار میرود.
روش کنترل مواجهه سیمپسون-هتر
روش کنترل مواجهه سیمپسون – هتر (S-H) یکی از رایجترین شیوه های انتخاب مشروط سؤال است. در این روش به هر سؤال یک مقدار پارامتر کنترل مواجهه اختصاص داده میشود، که بر اساس فراوانی انتخاب سؤال که در یک شبیهسازی چرخشی CAT تعیین میشود، استوار است. به سؤالاتی با فراوانیهای اجرای زیاد، پارامترهای کنترل مواجهه کوچکتری اختصاص دادهمیشود، که دامنه آن از ۰ تا ۱ میباشد. در طول اجرای آزمون، پارامتر کنترل مواجهه سؤال انتخاب شده با عدد یکنواخت تصادفی که دامنه آن نیز بین ۰ تا ۱ است، مقایسه میشود. اگر پارامتر کنترل مواجهه بزرگتر از عدد تصادفی باشد، سؤال اجرا میشود، و اگر کوچکتر باشد، سؤال به خزانهی سؤال بازگردانده میشود. به همین صورت، فرایند یکسانی برای بهترین سؤال بعدی صورت میگیرد. پارامتر کنترل مواجهه مشابه آستانه[۱۳۲] میباشد. با کنترل آستانهی روش (S-H) اجرای سؤالاتی که به طورفراوانی در CAT استفاده میشوند، محدود میشود و نرخ بیشینهی مواجهه سؤال برای سؤالاتی که اغلب کمتر مورد استفاده قرار میگیرند را تضمین میکند. معمولاً پارامترهای کنترل مواجهه در روش (S-H) به وسیله مجموعهای از شبیهسازیهای چرخشی اجراهای واقعی CAT تنظیم میشود. به عبارت دیگر، این پارامتر، نسبت نرخ مواجهه هدف برای احتمال انتخاب سؤال در آزمون میباشد. این شیوه به صورت زیر عمل میکند:
فرض کنید که انتخاب سؤال را برای یک آزمودنی که به طور تصادفی نمونهگیری شده را نشان میدهد، همچنین فرض کنید که اجرای آن سؤال را نشان میدهد. نرخ مواجهه سؤال میتواند به صورت تفسیر شود، یعنی احتمال اجرای سؤال برای آزمودنی که به طور تصادفی نمونهگیری شده است. روش (S-H) سؤالاتی را که اجرا شده از سؤالاتی که انتخاب میشود، از طریق رابطه احتمال جدا میکند و را از طریق کنترل یعنی نسبت انتخابهایی که به اجرا منجر میشود، کنترل میکند. برای هر نرخ مواجهه معین ؛ ، میتواند از طریق تعیین به دست آید. اگر معلوم باشد، یا بتواند تقریب زده شود، این روش میتواند به آسانی از طریق ایجاد یک متغیر تصادفی یکنواخت اجرا شود.