实 习 二 计量资料的统计分析方法
一、目的与要求:
1 、熟悉抽样误差的概念;熟悉标准误的意义及其应用;标准差与均数标准误的区别;
2 、掌握总体均数 95 %的计算及适用条件;
3 、 掌握 常用的 t 检验方法;
4 、了解 方差齐性检验和变量变换;
5 、掌握 方差分析的基本思想;各种设计方案 ( 完全随机设计、随机区组设计 ) 变异和自由度的分解方法;
6 、掌握不同设计非参数统计假设检验方法和步骤。
二、学时:
3 学时。
三、案例:
1 .某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表 2-1 :
表 2-1 某年某地健康成年人的红细胞数和血红蛋白含量
指 标 |
性别 |
例数 |
均数 |
标准差 |
标准值 * |
红细胞数 |
男 |
360 |
4.66 |
0.58 |
4.84 |
( 10 /L ) |
女 |
255 |
4.18 |
0.29 |
4.33 |
血红蛋白 |
男 |
360 |
134.5 |
7.1 |
140.2 |
( g/L ) |
女 |
255 |
117.6 |
10.2 |
124.7 |
* 实用内科学 (1976 年 ) 所载均数 ( 转为法定单位 )
问题 1 :说明女性的红细胞数与血红蛋白的变异程度何者为大?
问题 2 :计算男性两项指标的抽样误差。
问题 3 :估计该地健康成年女性红细胞数的均数。
问题 4 :该地健康成年男、女血红蛋白含量是否不同?
问题 5 :该地男性两项血液指标是否均低于上表的标准值 ( 若测定方法相同 ) ?
2. 某医生应用泼尼松、转移因子和胸腺肽治疗系统性红斑狼疮( SLE )患者 14 人。治疗前后血清 Sil-2R ( U/ml )数据见表 2-2 :
表 2-2 治疗前后血清 Sil-2R ( U/ml )数据
No. |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
治疗前 |
1410.37 |
893.54 |
1569.45 |
936.51 |
529.94 |
477.23 |
999.4 |
治疗后 |
1353.57 |
876.88 |
1534.42 |
879.98 |
468.66 |
427.23 |
971.56 |
No. |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
治疗前 |
474.85 |
873.04 |
252.61 |
1227.20 |
595.40 |
359.81 |
1097.99 |
治疗后 |
446.67 |
825.06 |
175.30 |
1110.19 |
470.83 |
337.75 |
1022.31 |
问题 1 :该医生对此数据应用两组独立样本的 t 检验,结果为 t =0.3737 ,自由度为 26 , P =0.7116 。于是,该医生的结论是治疗前后血清 Sil-2R 的差异没有统计学意义。你是否同意这种分析结果?
问题 2 :有人提议做配对资料的 t 检验,如果治疗前后的差异有统计学意义就可以说明治疗有效。你是否同意这样做?
3. 《脑积液磷酸己糖异构酶检测用于脑膜炎诊断的探讨》一文为比较三组患儿 CST 中 PHI 值是否不同,数据及分析结果见表 2-3 。
表 2-3 三组患儿 CST 中 PHI 值的比较
组别 |
n |

|
t |
P |
PM |
15 |
407.0±294.7 |
5.34 |
<0.01 |
WM 、 VE |
14 |
15.0±13.1 |
6.47 |
<0.01 |
对照组 |
23 |
7.0±4.8 |
|
|
问题 1 :该资料采用的是何种统计分析方法?
问题 2 :使用的统计分析方法是否正确?若不正确,可以采用何种正确的统计分析方法。
问题 3 :采用该统计分析方法应满足什么条件?该资料是否满足?
4. 某研究者对恶性滋养细胞肿瘤患者灌注治疗,测得其治疗前后的 hcG ( Pmol/L )值,其结果见表 2-4 :
表 2-4 恶性滋养细胞肿瘤患者灌注前后 hcG 值( Pmol/L )
病例号 |
治疗前( X 1 ) |
治疗后( X 2 ) |
㏒ X 1 |
㏒ X 2 |
1 |
1280000 |
210000.0 |
6.10721 |
5.32222 |
2 |
75500 |
3300.0 |
4.87795 |
3.51851 |
3 |
12450 |
2210.0 |
4.09517 |
3.34439 |
4 |
1500000 |
6.9 |
6.17609 |
0.83885 |
5 |
10000 |
2500.0 |
4.00000 |
3.39794 |
6 |
9700 |
1203.0 |
3.98677 |
3.08027 |
7 |
15588 |
4825.0 |
4.19279 |
3.68350 |
8 |
4223 |
914.0 |
3.62562 |
2.96095 |
对于该资料研究者作了如下分析:
分别对 和 取对数, 
=- 2.3733
以 查 界值表, , <0.05 。得出治疗有效的结论。
问题 1 :该资料的分析方法是否合适?为什么?
问题 2 :应该如何分析该资料?
问题 3 :从该研究者的分析结果您还应该注意什么问题?
附: SPSS 程序
1.配对 t 检验,以 实习二第 2题为例。
数据文件:“例2-2.sav”。
数据格式:2列14行,2个反应变量,变量名为“ x1 ”和“ x2 ”。
程序 :
T-TEST
PAIRS = x1 WITH x2 (PAIRED)
/CRITERIA = CI(.95)
/MISSING = ANALYSIS.
2 . 两样本均数比较的 t 检验,以 实习二第 2 题为例。。
数据文件 :“ 例 2-2.sav ” 。
数据格式 : 2 列 28 行 , 1 个反应变量 , 变量名为 “ x ”; 1 个分组变量 , 变量名为 “ group ”, 有 2 个水平。
程序 :
T-TEST
GROUPS = group(1 2)
/MISSING = ANALYSIS
/VARIABLES = x
/CRITERIA = CI(.95) .
3 . 完全随机设计资料的方差分析,以 实习二第 3题为例。。
数据文件 :“ 例 2-3.sav ” 。
数据格式:2列52行,1个反应变量,变量名为“PHI 值 ”;1个分组变量,变量名为“ group ”,有3个水平。
程序 :
ONEWAY
PHI 值 BY group
/STATISTICS DESCRIPTIVES HOMOGENEITY
/PLOT MEANS
/MISSING ANALYSIS
/POSTHOC = SNK LSD ALPHA(.05).
附: SAS 程序
1. 配对资料两样本均数比较的 t 检验 以 实习二第 2题 为例。
/*用 MEANS 作配对资料两个样本均数比较的t检验*/
data ex2_2; |
/*建立数据集*/ |
input x1 x2 @@; |
/*确定变量名称,x1和x2分别为两组个体值*/ |
d=x1-x2; |
/*计算两个变量的差值作为变量d的值*/ |
cards; |
/*变量赋值*/ |
略 |
|
; |
|
proc means t prt; |
/*调用means过程,要求输出 t 值和所对应的 P 值*/ |
var d; |
/*定义分析变量为d*/ |
run; |
|
/*用 UNIVARIATE 过程作配对资料两样本均数比较的t检验*/
proc univariate data=ex2_2 ; |
/*调用univariate过程*/ |
var d ; |
/*定义分析变量为d*/ |
run ; |
|
2.两 样本均数比较的 t 检验 以 实习二第 2题 为例。
data ex2_2; |
/*建立数据集*/ |
input x c@@; |
/*确定变量名称,x为分析变量,c为分组变量*/ |
cards; |
/*变量赋值*/ |
略 |
|
; |
|
proc ttest; |
/*调用ttest过程*/ |
var x; |
/*定义分析变量为x*/ |
class c; |
/*定义分组变量为c*/ |
run; |
|
3.完全随机设计资料的方差分析 以 实习二第 3题为例。
data ex2_3; |
/*建立数据集*/ |
input x c; |
/*确定变量名称,x为分析变量,c为分组变量*/ |
cards; |
/*变量赋值*/ |
略 |
|
; |
|
proc anova; |
/*调用anova过程*/ |
class c; |
/*定义分组变量为c*/ |
model x=c; |
/*定义模型,分析g对x的影响*/ |
means c/lsd; |
/*用LSD法对多组均数进行两两比较*/ |
means c/hovtest; |
/*作方差齐性检验,默认levene法*/ |
run; |
|
|