实 习 一 计量资料的统计描述、统计图表
一、目的与要求:
1 、了解 计量资料的频数分布表的编制方法和分布规律;
2 、掌握 计量资料的统计描述方法;
3 、掌握正态分布的概念和特征,标准正态分布的概念和标准化变换,正态分布的应用;
4 、理解统计表和统计图在统计描述中的作用;
5 、掌握统计表的制表原则和基本要求;
6 、掌握制作统计图的基本要求和各种统计图的适用条件。
二、学时:
3 学时。
三、案例:
1 . 某市 1974 年留驻该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民 238 人的发汞值( μmol/kg )检测结果见表 1-1 的第 1 和 3 列所示:
表 1-1 某市 1974 年 238 人的发汞检测结果
组段 |
组中值 x o |
人数 f |
频率 |
累计频率 |
fx o |
fx o 2 |
1.5 ~ |
2.5 |
20 |
0.084 |
0.084 |
50 |
125 |
3.5 ~ |
4.5 |
66 |
0.277 |
0.361 |
297 |
1336.5 |
5.5 ~ |
6.5 |
60 |
0.252 |
0.613 |
390 |
2535 |
7.5 ~ |
8.5 |
48 |
0.202 |
0.815 |
408 |
3468 |
9.5 ~ |
10.5 |
18 |
0.076 |
0.891 |
189 |
1984.5 |
11.5 ~ |
12.5 |
16 |
0.067 |
0.958 |
200 |
2500 |
13.5 ~ |
14.5 |
6 |
0.025 |
0.983 |
87 |
1261.5 |
15.5 ~ |
16.5 |
1 |
0.004 |
0.987 |
16.5 |
272.25 |
17.5 ~ |
18.5 |
0 |
0.000 |
0.987 |
0 |
0 |
19.5 ~ 21.5 |
20.5 |
3 |
0.013 |
1.000 |
61.5 |
1260.75 |
合计 |
|
238 |
1.000 |
|
1699 |
14743.5 |
问题 1 :简述发汞的分布规律。
问题 2 :某人按照加权法计算的均数为 ( μmol/kg ),是否可以用该均数说明其发汞的平均水平?为什么?
问题 3 : 计算发汞的 95% 医学参考值范围。
2 .根据 1999 年某地某单位的体检资料, 116 名正常成年女子的血清甘油三酯( mmol/L )测量结果见表 1-2 :
表 1-2 某单位 1999 年正常成年女子血清甘油三酯( mmol/L )测量结果
组 段 |
频 数 |
0.6 ~ |
1 |
0.7 ~ |
3 |
0.8 ~ |
9 |
0.9 ~ |
13 |
1.0 ~ |
19 |
1.1 ~ |
25 |
1.2 ~ |
18 |
1.3 ~ |
13 |
1.4 ~ |
9 |
1.5 ~ |
5 |
1.6 ~ 1.7 |
1 |
合 计 |
116 |
问题 1 :描述集中趋势应选择何指标?并计算。
问题 2 :描述离散趋势应选择何指标?并计算。
问题 3 :求该地正常成年女子血清甘油三酯的 95% 参考值范围。
问题 4 :试估计该地正常成年女子血清甘油三酯在 0.8 mmol/L 以下者及 1.5 mmol/L 以下者各占正常女子总人数的百分比。
问题 5 :该地 90% 正常成年女子血清甘油三酯集中在哪个范围。
3 .某单位 1990-1998 年普通感冒与支气管炎发病率见表 1-3 :
表 1-3 某单位 1990-1998 年普通感冒与支气管炎发病率( ‰ )
年 份 |
感 冒 |
支气管炎 |
1990 |
126.27 |
6.37 |
1991 |
92.19 |
6.37 |
1992 |
107.59 |
5.90 |
1993 |
101.93 |
5.69 |
1994 |
92.60 |
5.49 |
1995 |
73.20 |
4.32 |
1996 |
51.40 |
3.04 |
1997 |
42.39 |
2.42 |
1998 |
33.92 |
2.27 |
问题 1 :说明两种疾病随时间的变化趋势应该选用何种统计图形?并绘制。
问题 2 :说明两种疾病随时间的变化速度应选择何种统计图形?并绘制。
4 .某人制作了表 1-4 :
表 1-4 某地 EB 病毒抗体阳性人群药物干预治疗后 EB 病毒抗体阳性例数
第一疗程 |
第二疗程 |
1 月 |
2 月 |
3 月 |
1 月 |
2 月 |
3 月 |
检
查
人
数 |
血清学指标 |
检
查
人
数 |
血清学指标 |
检
查
人
数 |
血清学指标 |
检
查
人
数 |
血清学指标 |
检
查
人
数 |
血清学指标 |
检
查
人
数 |
血清学指标 |
V
C
A |
E
A |
D
N
A
se |
V
C
A |
E
A |
D
N
A
se |
V
C
A |
E
A |
D
N
A
se |
V
C
A |
E
A |
D
N
A
se |
V
C
A |
E
A |
D
N
A
se |
V
C
A |
E
A |
D
N
A
se |
328 |
252 |
84 |
52 |
315 |
237 |
78 |
46 |
306 |
229 |
62 |
28 |
283 |
192 |
56 |
22 |
272 |
168 |
44 |
20 |
266 |
144 |
38 |
18 |
问题 1 :该统计分析表存在哪些问题?
问题 2 :根据该表所反映的内容制作正确的统计分析表。
附: SPSS 程序
描述统计量 以 实习一第 2题为例,求① 描述统计量,如均数,中位数,标准差,标准误,最大值,最小值,第2.5、25、50、75、97.5百分位数;② 求偏度和峰度系数及其标准误;③ 绘制直方图。
数据文件:“例1-2.sav”。
数据格式:1列116行,1个反应变量,变量名为“ 甘油三酯 ”。
程序:
FREQUENCIES
VARIABLES= 甘油三酯
/NTILES= 4
/PERCENTILES= 2.5 97.5
/STATISTICS=STDDEV SEMEAN MEAN SKEWNESS SESKEW KURTOSIS SEKURT
/HISTOGRAM NORMAL
/ORDER= ANALYSIS .
附: SAS 程序
描述统计量 以下的几个程序均以 实习一第 2题 为例。
/*制作频数表*/
data ex1_2; |
/*建立数据集*/ |
input x @@; |
/*确定变量名称x*/ |
low=0.6; |
/*确定频数表最低下限为0.6*/ |
dis=0.1; |
/*确定频数表组距为0.3*/ |
z=x-mod(x-low,dis); |
/*新建变量z,该变量的值就是将变量x转化为该数值所在组段的下限值*/ |
cards; |
/*给变量赋值*/ |
略 |
|
; |
|
proc freq; |
/*调用FREQ过程*/ |
tables z; |
/*计算变量z各数值的频数*/ |
run; |
|
/*用MEANS 过程计算例数、均数、标准差、标准误和95%可信区间*/
proc means data=ex1_2 |
/*调用means过程,处理数据集ex1_2.sd2*/ |
n mean std stderr clm; |
/*计算的统计量为例数、均数、标准差、标准误和95%可信区间*/ |
var x; |
/*分析变量为x*/ |
run; |
|
/*用 MEANS 过程对频数表计算例数、均数、标准差、最小值和最大值*/
data ex1_2; |
/*建立数据集*/ |
input x f @@; |
/*确定变量名称,x的值为各组段的组中值,f的值为各组段的频数*/ |
cards; |
/*变量赋值*/ |
略 |
|
; |
|
proc means; |
/*调用means过程*/ |
freq f; |
/*定义频数变量为f*/ |
var x; |
/*定义分析变量为x*/ |
run; |
|
/*用UNIVARIATE 过程进行描述性统计*/
proc univariate data=ex1_2; |
/*调用univariate过程*/ |
freq f |
/*定义频数变量为f*/ |
var x; |
/*定义分析变量为x(组中值)*/ |
run; |
|
/* 计算 2.5 %和 97.5 %分位数*/
proc univariate data=ex1_2; |
/*调用univariate过程*/ |
var x; |
/*定义分析变量为x*/ |
output out=pct |
/*将结果输出到外部数据集pct*/ |
pctlpre=p |
/*数据集pct中百分位数变量的前缀*/ |
pctlpts=2.5 97.5; |
/*需要计算2.5%和97.5%百分位数*/ |
run; |
|
proc print data=pct; |
/*显示数据集pct*/ |
run; |
|
/*作正态性检验、茎叶图、箱式图和正态概率图*/
proc univariate data=ex1_2 |
/*调用univariate过程*/ |
normal |
/*作正态性检验*/ |
plot; |
/*作茎叶图、箱式图和正态概率图*/ |
var x; |
/*定义分析变量为x*/ |
run; |
|
|