平行組設(shè)計(jì)是醫(yī)療器械臨床試驗(yàn)中常用的一種試驗(yàn)設(shè)計(jì)類型,本章將對平行組設(shè)計(jì)定性資料的統(tǒng)計(jì)描述、及有關(guān)的假設(shè)檢驗(yàn)方法進(jìn)行介紹。主要終點(diǎn)變量可能為二值變量,多值有序變量等定性變量,對于這類資料的統(tǒng)計(jì)分析包括統(tǒng)計(jì)描述、參數(shù)估計(jì)和假設(shè)檢驗(yàn)。
一、描述性統(tǒng)計(jì)
(一)集中趨勢的描述
為了用簡捷的方式表達(dá)一組性質(zhì)相同的許多定量資料的平均水平,常用的方法就是求其平均值。它說明一組觀察值的集中趨勢、中心位置或平均水平。通常我們計(jì)算的總和除以例數(shù)得到的是算術(shù)平均值,除此之外,還有幾何平均僮、調(diào)和平均值、中位數(shù)和眾數(shù)。由十一組 性質(zhì)相同的定量數(shù)據(jù)的表現(xiàn)不同(在統(tǒng)計(jì)學(xué)上稱為“分布”),因此我們需要選用不同的平均指標(biāo)來表達(dá)它們。
1.算術(shù)平均值的定叉與計(jì)算算術(shù)平均值:n個(gè)性質(zhì)相同的定址數(shù)據(jù)之和除以n所得的結(jié)果叫做算術(shù)平均值。算術(shù)平均值見式(7- 1)。
式(7-1)中的χi為第i個(gè)觀測值,n為樣本大?。ɑ驑颖竞考慈繑?shù)據(jù)的個(gè)數(shù)),∑為求和符號,求和范圍為i=1到i=n。利用頻數(shù)分布表計(jì)算算術(shù)平均值見式(7-2)
式( 7-2)中,k為頻數(shù)分布表的組數(shù),n為樣本大小,χj為第,組數(shù)據(jù)的組中值,fj為第j組的頻數(shù)算術(shù)平均值適用于一組性質(zhì)相同的、單峰的、且近似服從別稱分布的。如圖7- l。
2.幾何平均值的定義與計(jì)算幾何平均值:對n個(gè)性質(zhì)相同的定齄數(shù)據(jù)分別取對數(shù)變換后,按算術(shù)平均值計(jì)算,然后再求其反對數(shù)所得的結(jié)果,叫做幾何平均值。 利用全部原始數(shù)據(jù)計(jì)算幾何平均值見式(7-3)。
利用頻數(shù)分布表計(jì)算幾何平均值見式(7-4)。
式(7-3)中,“lg”代表取常用對數(shù),“lg-1”代表取常用對數(shù)的反對數(shù),也可用自然列數(shù)“In”代替;
式( 7-4)中,k為頻數(shù)分布表的組數(shù),n為樣本大小,χj為第J組數(shù)據(jù)的組中值,fj為第j組的頻數(shù)
幾何平均值適用于一組性質(zhì)相同的、單峰的、且服從正偏態(tài)分布的(好是服從對數(shù)正態(tài) 分布的,即數(shù)據(jù)取對數(shù)變換后服從正態(tài)分布)定量資料,如圖7- 2所示。
3.調(diào)和平均值的定義與計(jì)算調(diào)和平均值:對n個(gè)性質(zhì)相同的定量數(shù)據(jù)分別取倒數(shù)變換后,按算術(shù)平均值計(jì)算,然后再求其倒數(shù)所得的結(jié)果,叫做調(diào)和平均值。 利用全部原始數(shù)據(jù)計(jì)算調(diào)和平均值見式(7-5)。
式(7-5)中1/χi就是求χi的倒數(shù)。利用頻數(shù)分布表計(jì)算調(diào)和平均值見式(7-6)
式(7-6)中,k為頻數(shù)分布表的組數(shù),n為樣本大小,xj為第j組數(shù)據(jù)的組中值,fj為第j組的頻數(shù)調(diào)和平均值可應(yīng)用于表達(dá)一組性質(zhì)相同的呈極嚴(yán)重正偏態(tài)分布(即高峰出現(xiàn)在全部數(shù)據(jù)取值范圍的中心點(diǎn)左邊)的定量資料的平均水平。對于小樣本資料,調(diào)和平均值常用于求類似 “速度”數(shù)據(jù)的平均水平。
4.中位數(shù)的定義與計(jì)算 中位數(shù):n個(gè)性質(zhì)相同的定量數(shù)據(jù)按由小到大順序排列后,居中的數(shù)據(jù)就叫做這組數(shù)據(jù)的中位數(shù)。 利用全部原始數(shù)據(jù)計(jì)算中位數(shù)的公式見式(7-7)。
式(7-7)中的n/2,n/2+1、(n+l)/2為數(shù)據(jù)由小到大排列后的位次 利用頻數(shù)分布表計(jì)算中位數(shù)的公式見式(7-8)。
式(7-8)中的Lm,im,fm分別代表中位數(shù)所在組的下限、組距、頻數(shù),n為總頻數(shù),C為中位數(shù)所在組之前的所有組(不含中位數(shù)所在組)內(nèi)的頻數(shù)之和中位數(shù)可以應(yīng)用于任何定量資料,通常用于不適合用幾何平均值和調(diào)和平均值的偏態(tài)資料中,尤其適用于包含不完全信息的資料中。例如臨床上隨訪資料經(jīng)常包含一些中途失訪患
者的某些數(shù)據(jù);有時(shí)因受儀器和試劑的靈敏度的限制,指標(biāo)的含量過低時(shí)無法準(zhǔn)確測得,只知 道一組數(shù)中有幾個(gè)數(shù)低于某數(shù)值。
5.眾教的定義與計(jì)算眾數(shù):n個(gè)性質(zhì)相同的定量數(shù)據(jù)中出現(xiàn)次數(shù)多的那個(gè)數(shù),就叫做 這組數(shù)據(jù)的眾數(shù)。 由眾數(shù)的定義可知,只需找出一組原始數(shù)據(jù)中重復(fù)出現(xiàn)次數(shù)多的那個(gè)數(shù)據(jù),它就是這組定量資料的眾數(shù);若是頻數(shù)分布表資料,頻數(shù)大的那一組的組中值就是這組定量資料的眾數(shù)。
若定量資料是以原始數(shù)據(jù)形式呈現(xiàn)的,則眾數(shù)可應(yīng)用于包含兩個(gè)或多個(gè)相同數(shù)據(jù)的定量資料中;若定量資料是用頻數(shù)分布表形式呈現(xiàn)的,則只要各組中的頻數(shù)不全是l,就可以應(yīng)用眾數(shù)。在醫(yī)學(xué)上,眾數(shù)常用來表示某病或某次食物中毒的潛伏期,在實(shí)際的醫(yī)療器械臨床研究 中,該指標(biāo)運(yùn)用的較少。
(二)離散趨勢的描述
僅用平均指標(biāo)來描述一組定量資料的全貌是不完善的,因?yàn)槠骄笜?biāo)僅能反映一組定量 資料的平均水平,而無法反映其離散程度(即各觀測值偏離平均值的程度)的大小。例如,F(xiàn)'面 的兩組數(shù)的算術(shù)平均值是完全相等的,但它們的離散程度卻相差很大。
上面這麗組數(shù)據(jù)的算術(shù)平均值雖然都是27,但組數(shù)據(jù)彼此之間離開平均值27的距離都比較小,而第二組數(shù)據(jù)彼此之間離開平均值27的距離都比較大。度量一組定世資料中的 每一個(gè)離開其算術(shù)平均值的離散程度大小的常用的變異指標(biāo)叫做標(biāo)準(zhǔn)差(就是上面用S表 示的數(shù))。除了標(biāo)準(zhǔn)差外,還有方差、標(biāo)準(zhǔn)誤、變異系數(shù)、四分位數(shù)間距、極差等。
1.極差一組性質(zhì)相同的定量數(shù)據(jù)中大值與小值之差,叫做極差。公式見式(7-9)。
極差計(jì)算反應(yīng)的數(shù)據(jù)離散趨勢的信息量較少,因而較少使用。
2.方差一組性質(zhì)相同的定量數(shù)據(jù)中的每一個(gè)與其樣本算術(shù)平均值的差量的平方和除 以數(shù)據(jù)個(gè)數(shù)與1的差量,所得的結(jié)果叫做樣本方差。用原始數(shù)據(jù)計(jì)算見式(7-10),用頻數(shù)分布表計(jì)算見式(7-11)。
式(7-10)和(7-11)中,k為頻數(shù)分布表的組數(shù),n為樣本大小,xj為第j組數(shù)據(jù)的組中值,fj為第j組的頻數(shù)
一組性質(zhì)相同的定量數(shù)據(jù)巾的每一個(gè)與其總體算術(shù)平均值的差量的平方和除以數(shù)據(jù)個(gè) 數(shù),所得的結(jié)果叫做總體方差。用原始數(shù)據(jù)計(jì)算見式(7-12).用頻數(shù)分布表計(jì)算見式(7-13)。
式(7-12)和(7-13)中,k為頻數(shù)分市表的組數(shù),N為樣本大小,xj為第j組數(shù)據(jù)的組中值,
fj為第j組的頻數(shù),μ為總體算術(shù)平均值
3.標(biāo)準(zhǔn)差方差的算術(shù)平方根叫做標(biāo)準(zhǔn)差,可分為樣本方差和總體方差,分別見式(714)和式(7-15)。
式(7-14)中S2的汁算見式(7-10)和式(7-11);式(7-15)中σ2的計(jì)算見式(7-12)和式(7—13)
在可以計(jì)算標(biāo)準(zhǔn)差和方差的資料中,為了反映資料的離散度大小時(shí),通常只用標(biāo)準(zhǔn)差,而 不用方差,僅在對定量資料作統(tǒng)計(jì)分析(如方差分析)時(shí)要用到方差(稱作均方)。
4.變異系數(shù) 標(biāo)準(zhǔn)差與算術(shù)平均值之比值(通常以百分散形式給出),叫做變異系數(shù), 記作CV。其計(jì)算公式見式(7-16)。
標(biāo)準(zhǔn)差與變異系數(shù)的用法比較:當(dāng)比較兩組或多組定量資料的離散度大小時(shí),在下面兩種 情形下不適合使用標(biāo)準(zhǔn)差,而必須使用變異系數(shù)。
情形一,當(dāng)各組定世資料的單位(或叫量綱)不同時(shí)。
情形二,當(dāng)各組定量資料的算術(shù)平均值相差懸殊時(shí)。
5.標(biāo)準(zhǔn)誤 為了明確地給出標(biāo)準(zhǔn)誤的定義,需要知道兩個(gè)重要的名詞。它們分別是“統(tǒng)計(jì)量”和“參數(shù)”。
參數(shù):反映總體中數(shù)據(jù)舒布特征的囂,稱為參數(shù)。如總體平均值μ、總體標(biāo)準(zhǔn)差σ等。
統(tǒng)計(jì)量:由樣本數(shù)據(jù)確定的,不含任何未知參數(shù)的統(tǒng)計(jì)指標(biāo),叫做統(tǒng)計(jì)量。如樣本平均值 x.樣本標(biāo)準(zhǔn)差S,樣本率,樣本變異系數(shù)等。
標(biāo)準(zhǔn)誤:統(tǒng)計(jì)址的標(biāo)準(zhǔn)差,叫做標(biāo)準(zhǔn)誤。樣本平均值的標(biāo)準(zhǔn)誤記作S,,樣本率的標(biāo)準(zhǔn)誤記作S。,變異系數(shù)的標(biāo)準(zhǔn)議記作Scv。它們的計(jì)算公式分別見式(7-17)擎式(7-20)。
式(7-18)是在大樣本(n至少要>30,好>100)條件F樣本標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)洪,兒中σ為總體標(biāo) 準(zhǔn)差
標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的用法比較:標(biāo)準(zhǔn)差適合用米反映一組陸質(zhì)相川的定艟數(shù)據(jù)離外其算術(shù) 平均值的波動(dòng)大小,它反映了在相同條件下試驗(yàn)的度的重現(xiàn)性好壞(即精密度的高低);而平均值的值大小的推測。因此,在表達(dá)幾組類似實(shí)驗(yàn)結(jié)果離散度在小時(shí),建議使用杯準(zhǔn)差,而不要盲目 使用平均值的標(biāo)準(zhǔn)誤。因?yàn)閷ν唤M定量資料而言,標(biāo)準(zhǔn)誤小于標(biāo)準(zhǔn)差,容易掩蓋實(shí)際存在的 較大的離散度,使哪些原奉水適臺埔近似正志分布法表達(dá)和處理的資料,都錯(cuò)誤地運(yùn)用了這些方法。
6.分位數(shù)間距 先用分位數(shù)法求出兩個(gè)關(guān)于中位數(shù)對稱的同類分化數(shù),如四分位數(shù)(Q1)與第三四分位數(shù)(Q3),令QR=Q3 -Q1,則QR就叫做四分位數(shù)問距,這個(gè)數(shù)值的大小,標(biāo)志著一組呈偏態(tài)分布定量資料居中的50%數(shù)值的離散度的大小。那么,我們可以用(P97.5一P2.5)來反映一組呈偏態(tài)分布定量資料居中的95%數(shù)值的離散度的大小。
極差與四分位數(shù)間距的用法比較:四分位數(shù)間距反映了一組性質(zhì)相同的定量數(shù)據(jù)中居中的50%的數(shù)據(jù)所在的范圍,它比極差更有參考價(jià)值。
標(biāo)準(zhǔn)差與四分位數(shù)間距的用法比較:在偏態(tài)分布資料中,一般不適合使用標(biāo)準(zhǔn)差,此時(shí)可 用四分位數(shù)間距取代標(biāo)準(zhǔn)差。