效度
A+醫(yī)學(xué)百科 >> 效度 |
效度(Validity)即有效性,它是指測(cè)量工具或手段能夠準(zhǔn)確測(cè)出所需測(cè)量的事物的程度。效度是指所測(cè)量到的結(jié)果反映所想要考察內(nèi)容的程度,測(cè)量結(jié)果與要考察的內(nèi)容越吻合,則效度越高;反之,則效度越低。效度分為三種類型:內(nèi)容效度、準(zhǔn)則效度和結(jié)構(gòu)效度。
目錄 |
簡(jiǎn)介
效度是測(cè)量的有效性程度,即測(cè)量工具確能測(cè)出其所要測(cè)量特質(zhì)的程度。效度是科學(xué)的測(cè)量工具所必須具
備的最重要的條件。在社會(huì)測(cè)量中,對(duì)作為測(cè)量工具的問卷或量表的效度要求較高。鑒別效度須明確測(cè)量的目的與范圍,考慮所要測(cè)量的內(nèi)容并分析其性質(zhì)與特征,檢查測(cè)量的內(nèi)容是否與測(cè)量的目的相符,進(jìn)而判斷測(cè)量結(jié)果是否反映了所要測(cè)量的特質(zhì)的程度。
鑒定程序
從內(nèi)容效度﹐到準(zhǔn)則效度﹐再到構(gòu)念效度﹐可視為一種累進(jìn)﹐即構(gòu)念效度需要比準(zhǔn)則效度更多的信息﹐準(zhǔn)則效度需要比內(nèi)容效度更多的信息。
效度比信度有更高的要求﹐信度是效度的必要條件﹐沒有信度的測(cè)量工具就談不上具有效度﹐但信度高的測(cè)量工具未必具有高的效度。
測(cè)試維度
1)表面效度(face validity)。指測(cè)試應(yīng)達(dá)到的卷面標(biāo)準(zhǔn),即一套測(cè)試題從表面看來是否是合適的。例如,若一次閱讀理解力的測(cè)試包括許多受試者沒有學(xué)過的方言詞匯,則可認(rèn)為這次測(cè)試缺乏表面效度。表面效度是測(cè)試出受試者正常水平的一種保證因素。
2)內(nèi)容效度(content validity)。指一套測(cè)試題是否測(cè)試了應(yīng)該測(cè)試的內(nèi)容或者說所測(cè)試的內(nèi)容是否反映了測(cè)試的要求,即測(cè)試的代表性和覆蓋面的程度。例如,如果某一套發(fā)音技能測(cè)試題僅僅考查發(fā)音所必須具備的某些技能,如只考單一音素的發(fā)音,而不考查重讀、語(yǔ)調(diào)或音素在詞語(yǔ)中的發(fā)音,那么,該測(cè)試的內(nèi)容效度就很低。
3)編制效度(construct validity)。指一套測(cè)試題的諸項(xiàng)目對(duì)編制該測(cè)試所依據(jù)的理論的各個(gè)基本方面的反映程度。例如,以結(jié)構(gòu)主義語(yǔ)言理論為基礎(chǔ),認(rèn)為系統(tǒng)的語(yǔ)言習(xí)慣是通過句型而獲得的,那么,強(qiáng)調(diào)詞匯和語(yǔ)法環(huán)境的測(cè)試題目就失去了編制效度。
4)經(jīng)驗(yàn)效度(empirical validity)。經(jīng)驗(yàn)效度是一種衡量測(cè)試有效性的量度,通過把一次測(cè)試與一個(gè)或多個(gè)標(biāo)準(zhǔn)尺度相對(duì)照而得出。經(jīng)驗(yàn)效度可分為兩種:一是共時(shí)效度(concurrent validity),即將一次測(cè)試的結(jié)果同另一次時(shí)間相近的有效測(cè)試的結(jié)果相比較,或同教師的鑒定相比較而得出的系數(shù);二是預(yù)測(cè)效度(predictive validity),即將一次測(cè)試的結(jié)果同后來的語(yǔ)言能力相比較,或是同教師后來對(duì)學(xué)生的鑒定相比較而得出的系數(shù)。
一般來說,對(duì)某次測(cè)試的效度進(jìn)行檢驗(yàn)時(shí),除了要根據(jù)教學(xué)大綱的要求和觀念有效性的理論對(duì)試卷的內(nèi)容進(jìn)行考查以外,還須采用計(jì)算相關(guān)系數(shù)的定量方法,即計(jì)算出本次試卷與另一份已被確定能正確反映受試者水平的試卷之間的相關(guān)系數(shù)。系數(shù)高則有效性大。課堂測(cè)試的效度應(yīng)在0.4-0.7之間,規(guī)模較大的測(cè)試其效度應(yīng)在0.7以上?! ?/p>
效度分析
效度分析有多種方法,其測(cè)量結(jié)果反映效度的不同方面。常用于調(diào)查問卷效度分析的方法主要有以下幾種。
單項(xiàng)與總和相關(guān)效度分析
表面效度(Face Validity)。也稱為內(nèi)容效度或邏輯效度,指的是測(cè)量的內(nèi)容與測(cè)量目標(biāo)之間是否適合,也可以說是指測(cè)量所選擇的項(xiàng)目是否“看起來”符合測(cè)量的目的和要求。主要依據(jù)調(diào)查設(shè)計(jì)人員的主觀判斷。
這種方法用于測(cè)量量表的內(nèi)容效度。內(nèi)容效度又稱表面效度或邏輯效度,它是指所設(shè)計(jì)的題項(xiàng)能否代表所要測(cè)量的內(nèi)容或主題。對(duì)內(nèi)容效度常采用邏輯分析與統(tǒng)計(jì)分析相結(jié)合的方法進(jìn)行評(píng)價(jià)。邏輯分析一般由研究者或?qū)<以u(píng)判所選題項(xiàng)是否“看上去”符合測(cè)量的目的和要求。統(tǒng)計(jì)分析主要采用單項(xiàng)與總和相關(guān)分析法獲得評(píng)價(jià)結(jié)果,即計(jì)算每個(gè)題項(xiàng)得分與題項(xiàng)總分的相關(guān)系數(shù),根據(jù)相關(guān)是否顯著判斷是否有效。若量表中有反意題項(xiàng),應(yīng)將其逆向處理后再計(jì)算總分。
準(zhǔn)則效度分析
準(zhǔn)則效度(Criterion Validity)。又稱為效標(biāo)效度或預(yù)測(cè)效度。準(zhǔn)則效度是指量表所得到的數(shù)據(jù)和其他被選擇的變量(準(zhǔn)則變量)的值相比是否有意義。根據(jù)時(shí)間跨度的不同,準(zhǔn)則效度可分為同時(shí)效度和預(yù)測(cè)效度。準(zhǔn)則效度分析是根據(jù)已經(jīng)得到確定的某種理論,選擇一種指標(biāo)或測(cè)量工具作為準(zhǔn)則(效標(biāo)),分析問卷題項(xiàng)與準(zhǔn)則的聯(lián)系,若二者相關(guān)顯著,或者問卷題項(xiàng)對(duì)準(zhǔn)則的不同取值、特性表現(xiàn)出顯著差異,則為有效的題項(xiàng)。評(píng)價(jià)準(zhǔn)則效度的方法是相關(guān)分析或差異顯著性檢驗(yàn)。在調(diào)查問卷的效度分析中,選擇一個(gè)合適的準(zhǔn)則往往十分困難,使這種方法的應(yīng)用受到一定限制?! ?/p>
結(jié)構(gòu)效度分析
建構(gòu)效度(Construct Validity)。是指測(cè)量結(jié)果體現(xiàn)出來的某種結(jié)構(gòu)與測(cè)值之間的對(duì)應(yīng)程度。結(jié)構(gòu)效度分析所采用的方法是因子分析。最關(guān)心的問題是:量表實(shí)際測(cè)量的是哪些特征?在評(píng)價(jià)建構(gòu)效度時(shí),調(diào)研人員要試圖解釋“量表為什么有效”這一理論問題以及考慮從這一理論問題中能得出什么推論。建構(gòu)效度包括同質(zhì)效度、異質(zhì)效度和語(yǔ)意邏輯效度。有的學(xué)者認(rèn)為,效度分析最理想的方法是利用因子分析測(cè)量量表或整個(gè)問卷的結(jié)構(gòu)效度。因子分析的主要功能是從量表全部變量(題項(xiàng))中提取一些公因子,各公因子分別與某一群特定變量高度關(guān)聯(lián),這些公因子即代表了量表的基本結(jié)構(gòu)。通過因子分析可以考察問卷是否能夠測(cè)量出研究者設(shè)計(jì)問卷時(shí)假設(shè)的某種結(jié)構(gòu)。在因子分析的結(jié)果中,用于評(píng)價(jià)結(jié)構(gòu)效度的主要指標(biāo)有累積貢獻(xiàn)率、共同度和因子負(fù)荷。累積貢獻(xiàn)率反映公因子對(duì)量表或問卷的累積有效程度,共同度反映由公因子解釋原變量的有效程度,因子負(fù)荷反映原變量與某個(gè)公因子的相關(guān)程度?! ?/p>
內(nèi)部效度
內(nèi)部效度的概念
研究的內(nèi)部效度是指在研究的自變量與因變量之間存在一定關(guān)系的明確程度。如果自變量和因變量之間關(guān)系并不會(huì)由于其它變量的存在受到影響,從而變得模糊不清或復(fù)雜化,那么這項(xiàng)研究就具有內(nèi)部效度。它所涉及的問題是:
(1)所研究的兩個(gè)或多個(gè)變量之間是否存在一定的關(guān)系?
(2)是否確實(shí)是自變量的變化引起了因變量的變化?
研究設(shè)計(jì)要對(duì)可能涉及的各種變量進(jìn)行有效的控制與消除,使與研究目標(biāo)無關(guān)的變量對(duì)研究結(jié)果的影響很小或沒有影響,,因而,研究變量之間(如自變量與因變量之間)的關(guān)系是確定的和真實(shí)的,意味著一項(xiàng)研究的內(nèi)部效度高。
影響內(nèi)部效度的因素
影響內(nèi)部效度的因素比較多,歸納起來,主要有歷史、研究被試、研究手段方法和程序、統(tǒng)計(jì)回歸效應(yīng)四方面因素。
內(nèi)部效度的條件
研究的內(nèi)部效度不會(huì)自動(dòng)形成。內(nèi)部效度的獲得,主要是通過研究設(shè)計(jì),認(rèn)真細(xì)致地選擇變量,切實(shí)控制好各種變量,保證研究變量之間的確定關(guān)系,消除與研究目標(biāo)無關(guān)的變量對(duì)研究結(jié)果的影響。上述4種方面的因素,都是在研究中應(yīng)特別注意控制的,最有效的途徑是采用隨機(jī)化程序。對(duì)于教育科學(xué)研究的各種具體情況(例如不同的研究活動(dòng)),影響內(nèi)部效度的因素種類、數(shù)量、作用大小會(huì)有一定的差別,應(yīng)該根據(jù)具體情況加以分析、預(yù)估、識(shí)別、并采取適當(dāng)措施予以控制或消除,以提高研究的內(nèi)部效度?! ?/p>
外部效度
外部效度簡(jiǎn)介
研究的外部效度是指研究結(jié)果能夠一般化和普遍適用到樣本來自的總體和到其它的總體中的程度,即研究結(jié)果和變量條件、時(shí)間和背景的代表性和普遍適用性。外部效度可以細(xì)分為總體效度和生態(tài)效度兩類。
總體效度指研究結(jié)果能夠適應(yīng)于研究樣本來自的總體的程度與能力,或說對(duì)總體的普遍意義。要使研究結(jié)果適用于總體,就必須從總體中隨機(jī)選取樣本,使樣本對(duì)總體具有代表性。如果研究所選樣本有偏差或數(shù)量太小,不足以代表總體,其結(jié)果就難以對(duì)總體特征進(jìn)行概括。
生態(tài)效度是指研究結(jié)果可以被概括化和適應(yīng)于其它研究條件和情景的程度和能力。要使研究結(jié)果能夠適用于其它研究條件和情景(例如,自變量與因變量、研究程序、研究背景、研究時(shí)間和研究者等方面的不同),就必須特別設(shè)計(jì)研究條件與情景,保證對(duì)其它條件、情景有代表性。
一般認(rèn)為,內(nèi)部效度是外部效度的必要條件,但不是充分條件。內(nèi)部效度低的研究結(jié)果就談不上對(duì)其它情景的普遍意義;可是內(nèi)部效度高的研究,其結(jié)果卻不一定能夠一般化到其它總體和背景中去。教育科學(xué)研究的重要意義是要發(fā)現(xiàn)教育活動(dòng)的普遍規(guī)律,指導(dǎo)教育工作的開展。因此,提高研究結(jié)果的外部效度十分重要。一項(xiàng)研究的內(nèi)部效度再高,如果其結(jié)果僅適應(yīng)于特定的范圍,特定的測(cè)量工具、特定研究程序和特定的研究條件等,那么,從獲取一般知識(shí)和揭示普遍規(guī)律的角度來看,其價(jià)值、意義不大。因此,研究的外部效度與內(nèi)部效度在重要性上毫不遜色?! ?/p>
影響外部效度的因素
影響外部效度的因素主要有4個(gè)面:研究被試方面、變量的定義和測(cè)試方面、研究手段和程序方面、實(shí)驗(yàn)者方面?! ?/p>
外部效度的條件
上述4方面因素,有時(shí)單獨(dú)存在,有時(shí)同時(shí)存在若干方面的影響。要提高研究的外部效度,必須注意在研究中消除和控制上述各種影響因素。外部效度的要求是研究能夠符合客觀情況,適用于更大的總體。其中,關(guān)鍵的一環(huán)就是做好取樣工作。取樣工作不但包括被試的取樣,而且也包括有代表性的研究背景(工作場(chǎng)所、學(xué)校、家庭、實(shí)驗(yàn)室)、研究工具、研究程序和時(shí)間等的選擇。取樣的背景與實(shí)際情景越接近,研究結(jié)果的可用性、適用性、推廣性就越強(qiáng)。一般來說,隨機(jī)取樣,提高模擬現(xiàn)實(shí)情景的程度,采用多種相關(guān)的研究方法,變化研究條件尋求具有普遍意義的結(jié)論,是獲得外部效度、提高研究結(jié)果可應(yīng)用性的重要條件?! ?/p>
統(tǒng)計(jì)結(jié)論效度
統(tǒng)計(jì)結(jié)論效度簡(jiǎn)介
統(tǒng)計(jì)結(jié)論效度是關(guān)于研究的數(shù)據(jù)分析處理程序的效度檢驗(yàn),或者說,它是檢驗(yàn)研究結(jié)果的數(shù)據(jù)分析程序與方法的有效性的指標(biāo)。統(tǒng)計(jì)結(jié)論效度的基本問題是研究誤差、變異來源與如何適當(dāng)?shù)剡\(yùn)用統(tǒng)計(jì)顯著性檢驗(yàn),它不涉及系統(tǒng)性偏差的來源問題,而是研究誤差變異情況和如何適當(dāng)運(yùn)用統(tǒng)計(jì)顯著性檢驗(yàn)的問題。例如,采用小樣本的研究數(shù)據(jù)時(shí),由于樣本成份與測(cè)量數(shù)據(jù)都波動(dòng)比較大,穩(wěn)定性差,如果依賴統(tǒng)計(jì)顯著性水平做出推論是不可靠的。在這種情況下,應(yīng)該運(yùn)用功效分析(power analysis),看看一定的樣本范圍、變異程度和α水平上能夠檢驗(yàn)出多大的效應(yīng)。這就是統(tǒng)計(jì)結(jié)論效度所考慮的問題。
影響統(tǒng)計(jì)效度的因素
影響統(tǒng)計(jì)效度的因素主要有方面:統(tǒng)計(jì)功效低、違反統(tǒng)計(jì)方法的使用條件、測(cè)量信度低。
統(tǒng)計(jì)結(jié)論效度的條件
研究的統(tǒng)計(jì)結(jié)論效度主要取決于兩個(gè)方面的條件:一是數(shù)據(jù)的質(zhì)量,數(shù)據(jù)分析程序的效度是以數(shù)據(jù)的質(zhì)量作為基礎(chǔ)的,數(shù)據(jù)質(zhì)量差的研究是談不上統(tǒng)計(jì)結(jié)論效度的;二是統(tǒng)計(jì)檢驗(yàn)方法,數(shù)據(jù)分析中所采用的各種統(tǒng)計(jì)方法,都有其明確的統(tǒng)計(jì)檢驗(yàn)條件的要求,一項(xiàng)研究中統(tǒng)計(jì)檢驗(yàn)條件不明確或者被違反,就會(huì)顯著降低統(tǒng)計(jì)結(jié)論效度?! ?/p>
構(gòu)思效度
構(gòu)思效度簡(jiǎn)介
研究的構(gòu)思效度是指理論構(gòu)思或假設(shè)的合理性、科學(xué)性,及其轉(zhuǎn)換為研究目標(biāo)的恰當(dāng)程度和可操作性。它涉及建立研究方案和測(cè)量指標(biāo)的理論構(gòu)思(或觀察指標(biāo)的理論設(shè)想)及其操作化等方面的問題,即理論構(gòu)思及其轉(zhuǎn)換的有效性。為了使研究具有較高的構(gòu)思效度,研究的理論構(gòu)思首先要結(jié)構(gòu)嚴(yán)謹(jǐn)、層次分明,形成某種“構(gòu)思網(wǎng)絡(luò)”,其次對(duì)研究?jī)?nèi)容做出嚴(yán)格的抽象與操作性定義(如針對(duì)研究構(gòu)思的特點(diǎn),給予明確的操作定義)?! ?/p>
影響構(gòu)思效度的因素
影響構(gòu)思效度的因素主要有3方面:研究構(gòu)思方面、研究手段和程序方面、實(shí)驗(yàn)者的主觀期望和被試者對(duì)研究的猜測(cè)?! ?/p>
構(gòu)思效度的條件
使研究具有較高的構(gòu)思效度,應(yīng)該滿足以下4個(gè)條件:
(1)理論構(gòu)思要結(jié)構(gòu)嚴(yán)謹(jǐn)、符合邏輯、層次分明,形成某種“構(gòu)思網(wǎng)絡(luò)”。例如,將兒童的自我意識(shí)發(fā)展分為自我認(rèn)識(shí)、自我體驗(yàn)和自我控制三方面,而自我認(rèn)識(shí)進(jìn)一步細(xì)分為對(duì)生理自我的認(rèn)識(shí)、對(duì)心理自我的認(rèn)識(shí)和對(duì)社會(huì)自我的認(rèn)識(shí)。這樣的理論構(gòu)思,就比較嚴(yán)謹(jǐn)、完整,有層次,并且形成一種“網(wǎng)絡(luò)”,便于理解和研究。
(2)清晰、準(zhǔn)確的界定研究的環(huán)境條件和變量。例如,“小學(xué)五年級(jí)學(xué)生發(fā)散思維問題研究”這樣一個(gè)課題,對(duì)研究被試的年齡段,生理智力發(fā)展,學(xué)習(xí)、生活、社會(huì)環(huán)境等需要明確界定范圍,用文字和語(yǔ)言兩種形式完整、準(zhǔn)確地表述研究變量。
(3)對(duì)研究變量做出準(zhǔn)確、嚴(yán)格的操作定義,并選擇對(duì)應(yīng)、客觀的觀測(cè)指標(biāo)。
(4)避免采用單一方法或單一指標(biāo)去代表或分析多維的、多層次的、多側(cè)面的事物和活動(dòng),盡可能采用多種方法、多種指標(biāo),從不同角度分析研究相同的理論構(gòu)思。
教育科學(xué)研究常常包含著復(fù)雜的、多維度的理論構(gòu)思,如何提高研究的構(gòu)思效度是進(jìn)行研究設(shè)計(jì)時(shí)需要加以特別重視的問題,也是提高教育科學(xué)研究水平的重要內(nèi)容。
關(guān)于“效度”的留言: | 訂閱討論RSS |
目前暫無留言 | |
添加留言 |