第八章 方 差 分 析 方差分析,是数理统计的基本方法之一,是分析试验或观察数据的一种方法。促使观察数据产生方差的因素:一是条件误差(或系统误差),另一是随机误差(或偶然误差)。方差分析的作用,就是从观察数据总方差中,将上述两种因素造成的部分,分别求出并加以比较,寻找出对观察数据起主要影响的因素。在实际工作中,人们已利用方差分析这一特殊性能改进体育教学和训练方法,提高教学质量和运动成绩。现实中的事物是复杂的影响它的因素是多种多样的,而且这些因素间又常常是相互制约、矛盾、依存的。如何通过有限的观察或试验数据,分析出各个因素以及各因素之间的交互作用的影响,抓住事物的主要矛盾解决问题,这就是方差分析要解决的主要课题之一。 第一节 单因素多水平的方差分析 一、基本原理 单因素多水平的方差分析,也称一种方式分组的方差分析,即对要研究的问题的影响因素只有一个。若影响因素不止一个,这时可先只考察其中的一个因素,把除此之外的其他因素都暂固定下来;然后再将要考察的这个因素的范围,划分成几个区段(即水平),分别通过多次重复试验取得数据;最后将所取得的数据,以一定的格式列表,进行方差分析。因此,人们就称它为一种方式分组的方差分析。通过下例,可从中理解方差分析解决问题的思想,并归纳出一种方式分组的方差分析的一般方法。 例 8 — 1 为迎接运动会承制运动员服装,某体委统一购进一批由同种原料织成的布料。经不同染整工艺处理后进行缩水试验,测得缩水率的百分数如下表: 1 五种染整工艺缩水试验(%) 染整工艺缩水试验(%) 布样编号 Ⅰ 1 2 3 4 4. 3 7. 8 3. 2 6. 5 21. 8 5. 450 Ⅱ 6. 1 7. 3 4. 2 4. 1 21. 7 5. 425 Ⅲ 6. 5 8. 3 8. 6 8. 2 31. 6 7. 900 Ⅳ 9. 3 8. 7 7. 2 10. 1 35. 3 8. 825 Ⅴ 9. 5 8. 3 11. 4 7. 8 37. 5 9. 375 总缩水率()总平均缩水率 1(4)/20 =()=147. 9 组内平均1 4 (1)/20 4=7. 395 试考察哪一种染整工艺结缩水率影响比较显著。 解:(一)由表中数据可以看出 1. 布料的缩水率在不同试验,不同工艺中,都存在差异; 2. 不同工艺的缩水率的平均值的差异,说明不同工艺对缩水率有一定影响; 3. 同一工艺下四块布样缩水率也存在差异。显见这种差异不是由工艺引起的,而是由试验误差生成的; 4. 由于试验误差存在,自然会对2. 的结论产生怀疑,不同工艺缩水率平均值差异除了工艺影响之外,是否有较大的试验误差影响? 为了得出正确结论,必须对试验数据进行更加细致的分析。方差分析的意图,是设法把由不同工艺造成缩水率的误差与其它偶然因素的试验误差分开。 (二)具体方法 1. 用同一工艺的四块布料的离均差平方和反映试验误差。它们是: Ⅰ:( 4. 3-5. 45 ) 2+( 7. 8-5. 45 ) 2+( 3. 2-5. 45 ) 2+( 6. 5-5. 2 45 ) 2=13. 01; Ⅱ:( 6. 1-5. 425 ) 2+( 7. 3-5. 425 ) 2+( 4. 2-5. 425 ) 2+( 4. 1-5. 425 ) 2=7. 23; Ⅲ:( 6. 5-7. 90 ) 2+( 8. 3-7. 90 ) 2+( 8. 6-7. 90 ) 2+( 8. 2-7. 90 ) 2=2. 70; Ⅳ:( 9. 3-8. 825 ) 2+( 8. 7-8. 825 ) 2+( 7. 2-8. 825 ) 2+( 10. 1-8. 825 ) 2=4. 51; Ⅴ:( 9. 5-9. 375 ) 2+( 8. 8-9. 375 ) 2+( 11. 4-9. 375 ) 2+( 7. 8-9. 375 ) 2=6. 93。 这五个离均差平方和相加,反映了试验误差大小,称为组内平方和,记为S2 。 S2 =13. 01+7. 23+2. 70+4. 51+6. 93=34. 38 2. 五种工艺对缩水率的影响,可用每种工艺的平均缩水率与总平均缩水率差的平方和来表示。由于每种工艺处理四块布样,故将此平方和四倍,称为组间平方和,记为S1 。 S1 = 4 × [ ( 5. 45-7. 395 ) 2+( 5. 425-7. 395 ) 2+( 7. 90-7. 395 ) 2+( 8. 825-7. 395 ) 2 ] = 55. 53 组内平方和S2 刻划试验误差大小。组间平方和S1 刻划不同工艺缩水率之间的差异程度,它除了包含着随机因素的影响外,还包含着不同工艺(条件因素)对缩水率的影响。因此,比较S1 与S2 的大小,就可以从中看到不同工艺对缩水率的影响是否显著。 3. S1 与S2都是若干项的平方和,其大小与参加求和的项数有关。为了进行比较,须将项数对它们的影响消去,即各自用自己的自由度去除(这里的自由度为项数减1)。如一个平方和是由几部分的平方和组成,则总自由度等于各部分自由度之和。因S1 是五项的平方和,它的自由度是5-1 = 4 。 S2 是四部分平方和的总和,每一部分的自由度是4-1 = 3,于是S2 的自由度为3×5 = 15。 4. 把S1 和S2 分别除以各自的自由度,记为 S1(平均组间平方和)和 S2(平均组内平方和)。 S1=S155. 53==13. 88; 443 S2=S234. 38==2. 29。 2525以F表示 S1与 S2的比值。 F =S113.88==6. 1 S22.29比值越大,说明不同工艺对布块的缩水率影响越显著;反之,说明不同工艺对缩水率的影响不显著。 5. 判断影响显著与否界限,由F值表(书后附表4)给出,表中 n 1′为分子的自由度,n 2′为分母的自由度。 n 1′= 4 , n 2′= 15 , = 0. 05时, 临界值F0. 05 = 3. 1; n 1′= 4 , n 2′= 15 , = 0. 01时, 临界值F0. 01 = 4. 9 若算得的F < 3. 1 = F0. 05 , 说明不同工艺对缩水率影响不大; 若算得的 F0. 05 = 3. 1 < F < 4. 9 = F0. 01 , 说明不同工艺对缩水率影响显著; 若算得的F > 4. 9 = F0. 01 , 说明不同工艺对缩水率影响非常显著。 (三)汇总以上全部结果,编制成如下方差分析表 方差来源 平方和 自由度 均 方 (Si) F 显著性 组 间 55. 53 4 13. 88 6. 1 * * (注) 组 内 34. 38 15 2. 29 总 和 . 91 19 注:* :显著; * * :特显著。(以下各表与此相同) (四)为了减少计算错误,可采用如下两个措施 1. 将所有试验(或观察)数据同减一数,上述表中平方和一列数值不变。将所有试验数据同乘一数,上表中F值不变。 2. 将全部计算工作,列成如下表格进行(表中数据是减去5以后的数值)。 布料编号 Ⅰ -0. 7 Ⅱ 1. 1 Ⅲ 1. 5 4 Ⅳ 4. 3 Ⅴ 4. 5 1 2 3 4 2. 8 -1. 8 1. 5 ) 2 1. 8 3. 24 13. 82 2 .3 -0. 8 -0. 9 1. 7 2. 7. 95 3. 3 3. 6 3. 2 11. 6 134. 56 36. 34 3. 7 2. 2 5. 1 15. 3 234. 09 63. 03 3. 8 6. 4 2. 8 17. 5 306. 25 63. 49 47. 9 681. 03 204. 63 ( 2 表中,是同列各数之和;( 后结果。由此计算 P = 的数据个数); ) 2是同列各数和的平方;2是同列各数各自平方后的和。表中最后一列(右边),即为全表计算的最1 ( 47. 9 ) 2 = 114. 72(式中20是全部试验所得201Q = × 681. 03 = 170. 26(式中4是每种工艺试验的布4样数); R = 204. 63 由P、Q、R得 S1 = Q-P = 170. 26-114. 72 = 55. ; S2 = R-Q = 204. 63-170. 26 = 34. 37; S = S1 + S2 = R-P = 204. 63-114. 72 = . 91 这就是一种方式分组的方差分析的基本原理和计算过程的计算格式的表达方法。 二、一般计算程序和格式 对一般情况,可从上述叙述中归纳出更一般的计算格式。 5 若要研究某一因素(A)对某种试验结果有无显著影响,这时可按如下程序进行。 (一)将因素A(试验条件)在要考察的范围内,划分为A1 ,A2 ,……… ,Ab 个水平(试验条件)。 (二)在每一水平Ai 下进行a 次试验,每次试验结果所得数据以Xi j 表示。Xi j 表示在Ai 水平(条件)下进行第j 个试验的结果。i = 1, 2, ……… ,b ; j = 1, 2, ……… ,a 。 (三)将全部试验结果Xi j ,写入如下表内,并按表格内要求计算的内容,依次进行计算。(表8 — 1) 表 8 — 1 单因素多水平方差分析计算表 试验次数 A 1 X 1 1 X 1 2 … A 2 X 2 1 X 2 2 … …… …… …… …… …… …… A i X i 1 X i 2 … …… …… …… …… …… …… A b X b 1 X b 2 … 1 2 … j … X 1 j … X 2 j … X i j … X b j … X b a ba X 1 a X 2 a X i a (a2aX1 j j1aaX2 j j1aX i j j1aX b j Xij i1j1baaj1) (X1j)j12 (X2j)j1a2 …… (aaX i j ) …… 2(Xbj)j1aa2 (Xij)2 i1j1j12 aj12X1j j12X2 j …… j12Xi j …… j12Xb j bai1j1Xi j 2 (四)计算平方和 6 令 1P= ( a b1Q= a 2X i j ) ( 8 — 1 ) bai1j1b( bi1aaX i j ) 2 ( 8 — 2 ) Xi2 j ( 8 — 3 ) j1R = 由此有 i1j1组间平方和 S1 = Q-P,自由度( b-1) (8-4) 组内平方和 S2 =R-Q,自由度b(a-1) (8-5) 总平方和 S = S1 + S2 = R-P,自由度(a b-1) (8-6) (五)写出方差分析表 表8-2 方差分析表 方差来源 平方和 自由度 均 方 F 显著性 组 间 S 1 b-1 S1S1S1 S2b1S2 组 内 S 2 b (a-1) S2 b(a1) 总 和 S a b-1 如与A1 ,A2 , …… ,A b 相应的试验次数不等,而是a1 ,a2 , …… ,a b 时,则上述各式写成如下形式。 P = 1ba ii1b ( i1a iX i j ) 2 (8-7) j1Q = bi11( a iba ia iX i j ) 2 (8-8) Xi2 j (8-9) 7 j1R = i1j1其余步骤与前述相同。 三、例题 例8-2 某体院,从体操专业中抽取条件基本相似的学生15人,由5位教师分别采用不同方法进行教学(每个教师教3名学生)。期终,按统一规定标准,连续进行三次测验,取得不同教法各次测验的学生成绩平均值如下表。 不同教师不同教法的水平(平均值) 学生成绩 A 1 1 2 3 90 92 88 270 A 2 97 93 92 282 94 A 3 96 96 93 285 95 A 4 84 83 88 255 85 A 5 84 86 82 252 84 1344 . 6 组内平均数 1 390 试分析不同教法的效果如何。 解:假定这5位教师的教学水平无显著差异。本例要研究的问题是教师的教法对学生成绩的影响。因此,教法是影响学生成绩的因素,将这因素按不同教法划分为5个水平,即A1 ,A2 ,A3 ,A4 ,A5 。学生成绩,是经过三次测验取得的,因此重复数是3,即1、2、3。所以,本题是单因素(5水平)方差分析,可用(表8-1)进行计算。因表中成绩数字比较大,可将表中各数都减去90,用减剩的余数进行计算。 不同教师不同教法的水平(平均值) 学生成绩 A 1 1 A 2 7 A 3 6 8 A 4 -6 A 5 -6 0 2 3 2 -2 ) 2 2 3 2 12 144 62 6 3 15 225 81 -7 -2 -15 225 -4 -8 -18 324 116 -6 918 356 ( 0 0 8 由此计算 1P = (-6 ) 2 = 2. 4(式中15是试验所得数据的总计个数); 15Q = R = 356 由此计算 S1 = Q-P = 306-2. 4 = 303. 6 ; S2 =R-Q = 356-306 = 50 ; S = S1 + S2 = 303. 6 + 50 = 353. 6 写出方差分析表 方差来源 平方和 自由度 均 方 F 显著性 组 间 303. 6 4 75. 9 15. 18 * * 组 内 50. 5 10 5. 0 总 和 353. 6 14 由F值表(书后附表4)查临界值F: 在n1′= 4 , n2′=10 时,查得F0。05 =3. 48,F0。01 =5. 99。进行判断: 因F = 15. 18 > F0。01 =5. 99,故不同教法对学生的成绩的影响非常显著。 1×918 = 306(式中3是每种教法的重复测验次数); 3第二节 双因素多水平的方差分析 9 一、基本原理 在实际问题中,影响一个量的因素常是很多的,这些因素对一个量的影响如何,哪些因素是主要的,因素之间有无交互作用。关于这类问题,下面通过介绍双因素方差分析方法,逐项给予解答。现以下例来说明用双因素方差分析求解这类问题的原理和方法。 例 8-3 某运动鞋生产厂,为改进运动鞋橡胶的质量,在橡胶的配方中,采用了三种不同的促进剂(A1 、A2 、A3 )和四种不同份量的氧化锌(B1 、B2 、B3 、B4 )。同样的配方测试定强两次,测得300%定强数据如下表。请问氧化锌(B)、促进剂(A),以及两者的交互作用,对橡胶定强(一个量)有无显著影响? 什么是主要矛盾? 解:本题是研究两个因素(A和B)对一个量(橡胶300%定强)的影响的问题,用方差分析解决这类问题的基本思想,与单因素方差分析是一样的,先把定强的总平方和分解为: 一部分是试验误差; 一部分是氧化锌引起的; 一部分是促进剂引起的; 一部分是氧化锌与促进剂交互作用引起的。 然后以这些平方和,分别与试验误差平方和进行比较,来确定它们对定强的作用是否显著。 S = SA + SB +SA×B +Se (8 - 10) 式中:Se 是试验误差的平方和。现在的任务是设法算出上式中的各项平方和。 用Xi j k 表示在Ai Bj 条件下,作第K次重复试验的数据。用Xi j = xi j k 表示在Ai Bj 条件下所有试验数据的和。令a 表示因素A的水平数。b表示因素B的水平数,C表示同条件下的试验重复数。在本例中 a = 3, b = 4, c = 2。 计算 1P= ( a b c i1baX i j ) 2 ( 8 — 11 ) j110 1Q= b c1R= a ca( ( ai1babX i j ) 2 ( 8 — 12 ) X i j ) 2 ( 8 — 13 ) Xi2 j ( 8 — 14 ) cj1bj1i11T = cW = 式中 X i j = k1ai1j1i1bj1k1Xi2 j k ( 8 — 15 ) cXi j k (8-16) 于是,所求的平方和为 S = W-P (8-17) SA = Q-P (8-18) SB = R-P (8-19) SA×B = T-Q-R + P (8-20) Se = W-P (8-21) 为计算方便,将以上各式列成表格进行计算。在计算时,将题中原表内所有数据都减去37后,仍以X i j k 记之。 本例双因素方差分析的P、W、T值计算表 A B X i j 1 X i j 2 X i j =X i j 1+X i j 2 ck1Xi j k= Xi j 1+ Xi j 2 Xi2 j 222B 1 A 1 -6 -4 -1 -1 1 -3 0 2 4 -10 -4 -3 3 -7 -1 2 5 11 52 10 5 5 25 1 4 17 100 16 9 9 49 1 4 25 B 2 -3 B 3 -2 B 4 2 B 1 -4 B 2 -1 B 3 0 B 4 1 A 2 B 1 A 3 -2 0 1 3 7 -2 1 5 12 abcP = 1 4 1 13 74 W = 211 4 1 25 144 cT=387 B 2 0 B 3 2 B 4 5 由表中最后倒数第一、二两行分别算得 P = 11×1 = ×1 = 0. 042≈0 ; abc342W = 211; 11T =×387 = ×387 = 193. 5 2c利用上表中Xi j 列的数据,按下表算Q和R值。 本例双因素方差分析的Q、R值计算表 X i j A B B 1 B 2 B 3 B 4 -10 -7 -2 -19 361 -4 -1 1 -4 16 -3 2 5 4 16 3 5 12 20 400 ( ) 2 A 1 A 2 A 3 -14 -1 16 acR=793 196 1 256 bcQ=453 ( ) 2 由表右下角两个数得 Q = 11×453 = ×453 =56. 6; 42bc11R = ×793 = ×793 = 132. 2; ac32于是 12 S = W-P = 211-0 = 211; SA = Q-P = 65. 6-0 = 56. 6; SB = R-P = 132. 2-0 = 132. 2; SA×B = T-Q-R + P = 193. 5-56. 6-132. 2 + 0 = 4. 7; Se =W-T = 211-193. 5 = 17. 5。 将计算结果列成方差分析表: 本例双因素(A及B)方差分析表 方差来源 平方和 自 由 度 均方(S) F 显著性 A 56. 6 a-1=3-1=2 28. 3 19. 4 * * B 132. 2 b-1=4-1=3 44. 1 30. 2 * * A×B 4. 7 (a-1)( b-1)=2×3=6 0. 8 0. 55 误 差 17. 5 ab( b-1)=3×4×(2-1)=12 1. 46 总 和 211. 0 abc-1=3×4×2-1=23 注:F值等于各因素的均方除以误差的均方。 注查F值表(书后附表4)求临界值F(n,n): 12F0. 01 (2, 12) = 6. 93 ; F 0. 01 (3, 12) = 5. 95 ; F0. 05 (6, 12) = 3. 00 。 从方差分析表知 FA =19. 4 > F0. 01 (2, 12) = 6. 93 ; FB = 30. 2 > F 0. 01 (3, 12) = 5. 95 ; FA×B = 0. 55 < F0. 05 (6, 12) = 3. 00 。 故可结论:A与B都是影响定强的重要因素,其中B因素更重要。A、B两因素无交互作用,相应的平方和是误差的一种反映,可将该项与误差项合并,相应的自由度也合并,以提高分析的精度。于是,方差分析表变成 方差来源 平方和 自由度 均 方 F 显著性 A 56. 6 2 28. 3 22. 8 * * B 132. 1 3 44. 0 35. 4 * * 误 差 22. 3 18 1. 24 13 总 和 211. 0 23 在本例中,如每种配方只做一次试验(即C = 1),没有重复,这时交互作用和误差混在一起,就无法分析交互作用的大小,其总平方和只能分解成 S = SA + SB + Se (8-22) 若仍用Xi j 表示在Ai Bj 条件下的数据,解P、Q、R、T的计算式变为 1P= ( a b 1Q= b1R= ai1baX i j ) 2 ( 8 — 23 ) j1a( ( i1babX i j ) 2 ( 8 — 24 ) X i j ) 2 ( 8 — 25 ) Xi2 j ( 8 — 26 ) j1bj1ai1T = i1j1W项不复存在,相应的平方和为 S = T-P,SA =Q-P,SB =R-P,Se = T-Q-R + P (8-27) 其它与前述步骤类似。在有条件时,最好能作重复试验(C > 1),以提高分析精度。 二、一般计算程序和格式 (一)根据课题所给内容,确定要研究的对象和影响“对象”的因素个数,以决定将要采用的方差分析方法。 (二)根据要考察的因素的范围划分各因素水平,通过试验(最好是重复试验),取得数据X i j k 。 (三)将数据X i j k 填入下表,进行P、W、T值计算。 当X i j k 值过大时,可将每一数据减去一常数;过小时,可乘以一常数,经此处理后的数,仍以X i j k 记之(所有数据减去一常数, 14 表中平方和一列不变;如同乘一常数,F值不变)。 表8 - 3 双因素方差分析的P、W、T值计算表 A B X i j 1 …… X i j k …… X i j c X i j ck1cXi j k 2Xi j 22 B 1 … X111 … X11 k … X11c … X11 … k1X12 1 k … cX1 1 … X1 j … X1 b 2A 1 B j … X1j1 … X1j k … X1j c … X1j … k12X1 j k 2B b B 1 … X1b1 X i 11 … X1bk X i 1k … X1b c X i 1c … X1b k1X12 b k cc… X i 1 … k1X… c2i 1 k Xi 1 … Xi j … Xi b Xa 1 … Xa j … Xa b 2222A i B j … X i j1 … X i j k … X i j c … X i j … k1Xi2 j k c2B b X i b1 B 1 … X a11 … X i b k X a1k … X i b c X a1c … X i b k1Xi2 b k 2Xa 1 k cX a1 … k1A a B j … X a j1 … X a j k … X a j c … X a j … k12Xa j k c… … 2B b X a b1 X a b k X a b c X a b k1X c 15 abcP = W = … 2a b k cT = Xi j Xi1j1i1j1k1ababc2i j k X2 i ji1j1ab 表中 i = 1, 2, 3,……,a ; j = 1, 2, 3,……, b ; k = 1, 2, 3,……,c。 X i j = X i j 1 + X i j 2 + …… + X i j c ; k1Xi2 j k = Xi2 j 1+ Xi2 j 2+ ……+ Xi2 j c (8 — 28) c由表的最后两行求得 1P = a b cW = ai1abX i j ( 8 — 29 ) Xi2 j k ( 8 — 30 ) Xi2 j ( 8 — 31 ) j1i1bcj1ak11T = ci1bj1(四)利用(表8-3)中X i j 列的数据,按下表计算Q、R值 表8-4 双因素方差分析的Q、R值计算表 X i j A 1 … B i X 11 … …… …… …… …… aB B j X 1j … …… …… … B b bj1 () 2 (X1j) 2 j1bX 1 b X i b X1j …A A i … X i 1 … X i j … …… … Xi j j1b(Xi j) 2 j1b… A a X a 1 aX a j …… aX a b Xa j j1b(Xa j) 2 j1b… bcQ=() i1a2 Xi 1 …… i1Xi j …… i1Xi b i1 16 … . () (Xi 1) …… (Xi j) …… (Xi b) acR=() 2 222aaab2 i1i1i1j1 由表右下角两个数得 1Q=b c(i1a)2 (8-32) 1bR=()2 (8-33) a cj1(五)计算平方和 S = W-P; SA×B = T-Q-R + P; SA =Q-P; Se = W-T。 (8-34) SB = R-P; (六)编写方差分析表 表 8-5 方差分析表 方差来源 平方和 自 由 度 均 方 F 显著性 A SA =Q-P a-1 SASA/(a1) SA/Se B SB = R-P b-1 SBSB/(b1) SB/Se A×B SA×B=T-Q-R+P (a-1)( b-1) SABSAB/ SAB/Se a1b1 误 差 Se = W-T ab( c-1) SeSe/abc1 总 和 S=SA+SB+SA×B+Se abc-1 (七)给定显著性水平 ,进行判断 ,n取 = 0. 05 或 0. 01,查F值表(书后附表4)得F0. 05(n12),n及F0. 01(n12)临界值。若 ,nF <F0. 05(n12),不显著; ,n,nF0. 05(n12)< F < F0. 01(n12), 显著; ,nF >F0. 01(n12),非常显著。 17 第三节 系统分组的方差分析 系统分组,有时也叫多层分组、成套设计。在社会调查中经常采用这种方法,如对中学生的体质调查,开始时总是先在全国范围内有计划地选取几个城市,然后在选定的城市中,又随机选取几个中学。如需要的话,还可在选定的中学中随机选取几个班的学生进行调查。象这样层层深入的,大范围套小范围的调查方法,就是所谓系统分组法。由这种方法取得的数据在进行方差分析时,不能再使用前述两种分析方法。 例8-4 为治疗运动员的膝关节扭伤,大夫用不同的两种中药,配制成A、B两种外敷药膏,这两种药膏的贴敷对温度的要求是不一样的。A药膏要求在20-30oC下,B药膏要求在35-40oC时贴敷。通过试验取得如下数据。 药 膏 温 度(oC) 治愈率(%) 20 4 2 A 25 4 6 30 6 8 35 3 9 B 40 10 12 45 11 9 试分析药膏和温度对膝关节扭伤治愈率的影响。 解:解决这一问题的想法同前,也是把治愈率的总平方和S分解成三个部分,即一部分是药膏的;一部分是温度是;一部分是误差的。即 S = S药膏 + S温度 + Se 前两种方差分析,都是用因素的均方,分别和误差的 Se比较来确定因素的显著性。而系统方差分析,则是用 S温与 Se 、S药膏与 S温比较来确定温度与药膏的影响是否显著。 表8-6 本例系统分组方差分析计算表 Xi j i j84 行的数据个数 18 Xi j i j3 6 4 30 10 4 6 14 6 8 12 3 9 22 10 12 20 11 L = 2 M = 6 N = 12 X i j X i j 2 9 注:表中“K”为重复实验数。 计算时,先将数据自下而上逐步累加,然后分别计算: P = =1(Xi j) 2 (8-35) Ni j1×842 =588 12123(X i j)2 (8-36) Q = Mi1j1= 1 × [ (6 + 10 + 4) 2 + (12 + 22 + 20) 2 ] = 636 ; 6123X2T = (8-37) i jLi1j1= W = 12(6 + 10 2 + 4 2 + 12 2 + 22 2 + 20 2 ) = 680 ; 2X2i1j1k1232i j k (8-38) = 4 2 +2 2 + 6 2 + …… + 9 2 = 780 由此得: S药膏 = Q-P 自由度(L-1) (8-39) = 636-588 = 48 , 自由度L-1 = 2-1 =1; S温度 = T-Q 自由度(M-L) (8-40) = 680-636 = 44 , 自由度K-L = 6-2 =4; S e = W-T 自由度(N-M) (8-41) 19 = 708-680 = 28 , 自由度N-M = 12-6 =6; S = W-P 自由度(N-1) (8-42) = 708-588 = 120 , 自由度N-1 = 12-1 =11。 把计算结果列成方差分析表 表8-7 本例系统分组方差分析表 方差来源 药 膏 温 度 误 差 总 和 平 方 和 S药 = 48 S温= 44 S e= 28 S = 120 自 由 度 L-1=1 M-L=4 N-M=6 N-1=11 均 方 F S药=4. 36 S温S温=2. 36 SeS药=48 S温=11 Se=4. 67 由F值表(书后附表4)查得临界值 F0. 05 (1, 4) = 7. 71 , F0. 01 (1, 4) = 16. 26 ; F0. 05 (4, 6) = 4. 53 , F0. 01 (4, 6) = 9. 15。 因为F均小于F0. 05 (1, 4) 和F0. 05 (4, 6) ,说明两种因素对治愈率的影响均不显著。 第四节 多重比较法 在前述几节中,是用F检验来断定因素的显著性,但当因素的水平数K≥3时,即使F检验显著,而所有水平之间差异并不一定都显著。弄清水平之间差异显著与否,对实际工作是很有意义的。 解决多重比较的方法有好几种,这里只介绍以q 表作检验的“T”法。现以例8-1来说明。 令 K:比较的个数,即参与试验的因素的水平数; n:每种工艺(或水平)重复试验次数; :Se 的自由度。 对例8-1来说,K = 5,n = 4, = 15。 20 查q 值表(书后附表5),K = 5的一列与 = 15的一行的相交处,有q() q15(0.05)4.37。例8-1的组内平方和相当于Se ,它的均方 Se= 2. 29,据此可计算T。 kT = q() k5S e (8-43) n2.29 45= q15(0. 05) 2.29= 4. 37× = 3. 31 4T是衡量两种染整工艺平均缩水率的尺度。平均缩水率之差小于T,两种工艺差别不显著;平均缩水率之差大于T,两种工艺有显著差异。五种工艺相应的平均缩水率为 1 = 5. 450, 2 = 5. 425, 3 = 7. 900, 4 = 8. 825, 5 = 9. 375。 任意两种工艺平均缩水率之差为: |1-2| = 0.025; |2-3| = 2.475; |3-4| = 0.925; |4-5| = 0.550 |1-3| = 2.450; |2-4| = 3.400; |3-5| = 1.475; |1-4| = 3.375; |2-5| = 3.950; |1-5| = 3.925 其中办有 |1-5| , |1-4| , |2-5| , |2-4| 大于T,其余均小于T,因此只有工艺 Ⅰ、Ⅱ与 Ⅳ、Ⅴ之间有显著差异,其余均则否。它给人们选择最优工艺条件时留有充分的余地。 从最后的结果看,本方法实际上是前述几种方法的补充。通过本方法的补充,使前述各种方差分析方法更加完善。 第五节 方差分析小结 一、分析应用条件 在进行方差分析是,必须满足下述条件: 21 (一)被检验的各总体服从正态分布,即正态性假定; (二)假定各总体的方差相等,即方差齐性假定; (三)把数据当做线性模型来处理,即线性假定; 只有满足上述三个条件,才能使用方差分析。这三个假定是不可分割的,是缺一不可的。 二、一般方差分析的程序 (一)先对原数据进行简化,即将原数据减或乘以常数,使原数据变成比较小的整数,为四则运算提供方便条件。 (二)按简化后的数据,列出方差分析计算表,分别计算P、Q、W值和平方和S。 (三)编列方差分析表,根据表中平方和及自由度,计算与其相应的均方(S)和F值。 、n2 查F表,得临界值(四)以给定显著水平和自由度 n1、n2)。以F与 F(n1、n2) 比较来进行显著性判断。 F(n1(五)选择最优水平(最优组合方案或最优工艺条件)。 为留有余地起见,此时可对显著的因素进一步用多重比较法,分清哪些水平之间是显著的,哪些是不显著的。 为了证实试验结论,最好能进行验证试验。验证试验中的各因素的水平,可以同原试验一样,也可以不一样。 习 题 八 1. 什么是方差分析?其作用如何? 2. 方差分析的基本假定有哪些?方差分析的基本步骤有哪些? 3. 科研人员在研究运动员百米赛跑中步长变化情况时,对3名百米赛跑成绩相同的男运动员,分别测量了他们在百米赛跑中若干不同距离段上的步长,获得资料如下: 运 动 员 不同距离段(米)上的步长(厘米) 22 30 甲 乙 丙 233 236 213 50 228 243 219 70 238 255 211 90 238 263 212 试分析运动员百米赛跑时的步长在这四个距离段上有无显著差异。 4. 根据1979年对全国16省市近20万大中小学生体质调查结果,就小学男生(7-11岁)的身高与同年份的日本和美国全国调查资料比较见下表。 国 别 中 国 日 本 美 国 试用方差分析法研究种族(或民族)因素与年龄因素对小学男生身高的影响。 5. 某市教育局要了解甲、乙两校高二年级学生体育达标的情况。调查组分别在两校高二年级随机抽查了三个班,每班均安排两次体育达标测验,获得资料如下: 学 校 班 级 达标率 (%) 试分析甲、乙两校高二年级学生的体育达标率有无显著差异。 7 — 11岁男生的身高(厘米) 7 121. 2 121. 2 127. 8 8 125. 7 126. 6 133. 4 9 130. 6 131. 8 137. 9 10 135. 3 137. 0 142. 5 11 139. 9 142. 7 148. 4 Ⅰ 85 82 甲 Ⅱ 83 86 Ⅲ 86 86 Ⅰ 90 86 乙 Ⅱ Ⅲ 91 95 23