- 相關推薦
基于聯(lián)結主義的連續(xù)記分IRT模型的項目參數(shù)和被試能力估計
1 問題的提出與經(jīng)典測驗理論相比,項目反應理論(簡稱IRT)由于具有參數(shù)不變性、能進行計算機化自適應測驗等優(yōu)點而受到歡迎[1,2],但是也存在著不少問題,首先是目前比較成熟的、得到廣泛應用的IRT軟件,如BILOG、MicroCAT等,主要是運用極大似然法或貝葉斯方法進行項目參數(shù)和被試能力估計[3],一般都只能處理二值記分的項目,也有少數(shù)軟件可以處理等級記分的項目,例如MULTILOG,但對于連續(xù)記分的項目還缺少估計方法和工具;其次是在運用BILOG、MicroCAT和MULTILOG等軟件時往往需要數(shù)百人的大樣本,而對于小樣本則缺少有效的估計方法,因此需要另尋途徑來解決這些問題。
2 聯(lián)結主義理論中的級連相關模型
聯(lián)結主義理論(或稱人工神經(jīng)網(wǎng)絡)是近年來得到廣泛關注的認知心理學理論[4,5,6],它一方面可以用來模擬人的認知活動,探討人類的信息加工機制[7],另一方面可以作為一種工具來分析系統(tǒng)的輸入和輸出之間的關系,特別是當系統(tǒng)的輸入和輸出之間難以用顯性的數(shù)學方程表示時,聯(lián)結主義模型就可以通過其本身的學習功能,在用一組已知的輸入和輸出數(shù)據(jù)對它進行訓練以后,就可以在一定程度上掌握了該系統(tǒng)內(nèi)部的輸入和輸出之間的關系,即建立了某種模型。如果我們再給這個經(jīng)過訓練的網(wǎng)絡模型以新的輸入,那么它就可以給出相應的輸出值。因此,人們可以利用聯(lián)結主義模型的這種性質(zhì)來進行預測和參數(shù)估計等活動[8]。
聯(lián)結主義模型通常由一個輸入層、一個輸出層和若干個隱含層組成,每一層中含有若干個結點,一個模型中所含的隱含層數(shù)目和各層所含結點數(shù)目,是由具體問題的性質(zhì)和復雜程度來確定的。各個結點之間的聯(lián)結具有一定的權重,它的大小反映了相鄰兩個結點之間相互影響的程度,在模型被訓練的過程中,各結點間的權重得到了調(diào)整。
聯(lián)結主義模型通常可以分為靜態(tài)型和動態(tài)型兩種,靜態(tài)型模型的拓撲結構是實驗者在一開始的時候就設計好的,它的訓練過程就是調(diào)節(jié)各結點之間的權重。動態(tài)型模型的拓撲結構是在訓練過程中不斷變化的,它能夠隨著訓練的進行,自動地加入新的隱含結點,同時也調(diào)整各結點間的聯(lián)結權重,這樣就可以更快地減少訓練誤差。
級連相關模型是動態(tài)型聯(lián)結主義模型中的一種[9],它的計算精度較高,運算速度較快。在開始訓練時,該模型只有輸入層和輸出層,處于最小拓撲結構。隨著訓練過程的進行,它能夠根據(jù)需要自動地逐個加入隱含結點。該模型的訓練分為輸出和輸入兩個階段交替進行,首先是輸出階段,在這一階段,模型對聯(lián)結隱含結點和輸出結點間的各權重進行調(diào)整,直到誤差不再減少為止;然后轉(zhuǎn)至輸入階段,在這一階段,模型對于聯(lián)結輸入結點和候選隱含結點間的各個權重進行調(diào)整,并從中選出其輸出變量和網(wǎng)絡的誤差變量間相關為最大的候選隱含結點,把它裝入網(wǎng)絡,這樣使得每次裝入的新隱含結點都能最大程度地影響誤差的變化。然后再轉(zhuǎn)至輸出階段,這個過程不斷重復,直到達到預定的訓練精度。在本研究中,由于無法事先確定模型的拓撲結構,以及為了較快地對模型進行訓練和達到較好的訓練和測試效果,采用了級連相關模型作為研究的工具。
3 連續(xù)記分IRT模型
連續(xù)記分IRT模型是二值記分IRT模型的擴展,即它的記分不是按照二值邏輯的全對或全錯的方式來進行,而是根據(jù)被試答對項目的程度來進行記分,如果全對該題目就得滿分。由于各題目的滿分值不一樣,有的是3分、5分、6分或更高的分數(shù),為了統(tǒng)一起見,可以對它們進行歸一化處理,全部轉(zhuǎn)化為0至1的值。這樣就可以和下面的三參數(shù)邏輯斯諦模型中的P(θ)相一致。Samejima[10]、Muller[11]和Mullenbergh[12]等都對連續(xù)記分IRT模型進行過研究,它和二值記分模型一樣,可以用正態(tài)卵形模型和邏輯斯諦模型表示。對于常用的三參數(shù)邏輯斯諦模型,它的表示式為:
P(θ)=c[,i]+(1-c[,i])exp[1.7a[,i](θ-b[,i])]/{1+e
[1] [2] [3] [4] [5]
【基于聯(lián)結主義的連續(xù)記分IRT模型的項目參數(shù)和被試能力估計】相關文章:
基于聯(lián)結主義的連續(xù)記分IRT模型的項目參數(shù)和被試能力估計04-29
項目反應理論多級記分模型參數(shù)估計的實現(xiàn)04-27
GPCM模型項目參數(shù)估計程序的開發(fā)與研究04-26
基于遺傳算法的非線性系統(tǒng)模型參數(shù)估計05-01
基于抗差估計的概率積分法的預計參數(shù)模型研究04-28
評聯(lián)結主義網(wǎng)絡模型對經(jīng)典皮亞杰任務的模擬04-27