欧美一级免费欧美精品,91久久精品午夜一区二区,国产精品亚洲综合网站,国产中文在线观看

列聯(lián)表

跳轉(zhuǎn)到: 導(dǎo)航, 搜索

列聯(lián)表是觀測數(shù)據(jù)按兩個或更多屬性(定性變量)分類時所列出的頻數(shù)表

列聯(lián)表分析

一般,若總體中的個體可按兩個屬性A與B分類,A有r個等級A1,A2,…,Ar,B有c個等級B1,B2,…,Bc,從總體中抽取大小為n的樣本,設(shè)其中有nij個個體的屬性屬于等級Ai和Bj,nij稱為 頻數(shù),將r×c個nij排列為一個r行c列的二維列聯(lián)表,簡稱r×c表。若所考慮的屬性多于兩個,也可按類似的方式作出列聯(lián)表,稱為多維列聯(lián)表。  

分析

列聯(lián)表又稱交互分類表,所謂交互分類,是指同時一句兩個變量的值,將所研究的個案分類。交互分

列聯(lián)表分析圖

類的目的是將兩變量分組,然后比較各組的分布狀況,以徐找變量間的關(guān)系。

觀測數(shù)據(jù)按兩個或更多屬性(定性變量)分類時所列出的頻數(shù)表。例如,對隨機抽取的1000人按性別(男或女)及色覺(正?;?a href="/w/%E8%89%B2%E7%9B%B2" title="色盲">色盲)兩個屬性分類,得到二行二列的列聯(lián)表(表1),又稱2×2表或四格表。

一般,若總體中的個體可按兩個屬性AB分類,Ar個等級A1,A2,…,Ar;B有с個等級B1,B2,…,Bc,從總體中抽取大小為n的樣本設(shè)其中有nij個屬于等級Ai和Bjnij稱為頻數(shù),將r×с個nij(i=1,2,…,r;j=1,2,…,с)排列為一個r行с列的二維列聯(lián)表(表2),簡稱r×с表。若所考慮的屬性多于兩個,也可按類似的方式作出列聯(lián)表,稱為多維列聯(lián)表。由于屬性或定性變量的取值是離散的,因此多維列聯(lián)表分析屬于離散多元分析的范疇,列聯(lián)表分析在應(yīng)用統(tǒng)計,特別在醫(yī)學(xué)、生物學(xué)社會科學(xué)中,有重要的應(yīng)用。

列聯(lián)表

列聯(lián)表分析的基本問題是,判明所考察的各屬性之間有無關(guān)聯(lián),即是否獨立。如在前例中,問題是:一個人是否色盲與其性別是否有關(guān)?在 r×с表中,若以pi.、p.jpij分別表示總體中的個體屬于等級Ai,屬于等級Bj和同時屬于Ai、Bj的概率(pi., p.j稱邊緣概率,pij稱格概率),“A、B兩屬性無關(guān)聯(lián)”的假設(shè)可以表述為H0:pij=pi.p.j,(i=1,2,…,r;j=1,2,…,с),未知參數(shù) pij、pi.、p.j的最大似然估計(見點估計)分別為分別為行和及列和(統(tǒng)稱邊緣和);

樣本大小。根據(jù)K.皮爾森(1904)的擬合優(yōu)度檢驗似然比檢驗(見假設(shè)檢驗),當(dāng)h0成立,且一切 pi.>0和p.j>0時,統(tǒng)計量

的漸近分布是自由度為 (r-1)(с-1) 的ⅹ分布,式中Eij=ni.n.j/n 稱為期望頻數(shù)。當(dāng)n足夠大,且表中各格的Eij都不太小時,可以據(jù)此對h0作檢驗:若ⅹ值足夠大,就拒絕假設(shè)h0,即認為AB有關(guān)聯(lián)。在前面的色覺問題中,曾按此檢驗,判定出性別與色覺之間存在某種關(guān)聯(lián)。

若樣本大小n不很大,則上述基于漸近分布的方法就不適用。對此,在四格表情形,R.A.費希爾(1935)提出了一種適用于所有 n的精確檢驗法。其思想是在固定各邊緣和的條件下,根據(jù)超幾何分布(見概率分布),可以計算觀測頻數(shù)出現(xiàn)任意一種特定排列的條件概率。把實際出現(xiàn)的觀測頻數(shù)排列,以及比它呈現(xiàn)更多關(guān)聯(lián)跡象的所有可能排列的條件概率都算出來并相加,若所得結(jié)果小于給定的顯著性水平,則判定所

列聯(lián)表

考慮的兩個屬性存在關(guān)聯(lián),從而拒絕h0。

在判定變量之間存在關(guān)聯(lián)性后,可用多種定量指標(biāo)來刻畫其關(guān)聯(lián)程度。例如,對一般的r×с表,可用列聯(lián)系數(shù)表示之。

對一般的r×с表,特別是在多維表分析中,若無關(guān)聯(lián)性(即獨立性)的假設(shè)被拒絕,則通常還需要檢驗進一步的假設(shè)。例如對三維表,可能需要考慮一個變量是否與另外兩個變量獨立。對這類局部獨立性的檢驗仍可用大樣本的ⅹ檢驗法。但是在多維情形,變量之間的關(guān)聯(lián)性可能相當(dāng)復(fù)雜。許多假設(shè),直接用格概率表示是不方便的。一種處理方法是仿照線性統(tǒng)計模型,將格概率(或期望頻數(shù))的對數(shù)表示成各變量的主效應(yīng)及各階交互效應(yīng)等未知參數(shù)的線性形式。這種模型稱為對數(shù)線性模型,在此模型下,變量獨立性的假設(shè)等價于交互效應(yīng)等于零的假設(shè)。此外,還可以利用對數(shù)線性模型,根據(jù)實際觀測頻數(shù),對各種具體模型進行擬合,并對各未知參數(shù)進行估計。估計的方法一般采用最大似然方法。由于這一類似然方程的解常無顯式表示,通常需用迭代法求解,計算工作量很大。因此,多維列聯(lián)表分析只在近代高速電子計算機的使用日益普及的情況下,才得到較為充分的發(fā)展,逐漸達到可以實際應(yīng)用的程度。

關(guān)于“列聯(lián)表”的留言: Feed-icon.png 訂閱討論RSS

目前暫無留言

添加留言

更多醫(yī)學(xué)百科條目

個人工具
名字空間
動作
導(dǎo)航
推薦工具
功能菜單
工具箱