统计描述
(一)数值变量资料的统计描述
- 频数表
- 频数分布图
- 描述集中趋势的指标
- 描述离散趋势的指标
1.频数表
目的:
- 简化数据,
- 考察观察结果的分布特征
须找出最小值和最大值
2.频数分布图
- 又称直方图
- 用途:反映计量资料的分布特点(连续变量各种取值出现的机会)
3.描述集中趋势的指标
- 算术平均数(均数)
- 中位数
- 几何平均数
算术平均数(均数),
适用条件:资料呈正态分布(或近似正态,对称分布)
μ(miǖ):表示总体均数
χ上加一横(ái ke si bá):表示样本均数
中位数: 用M表示
位置居中的变量值(n奇数),或位置居中的两个变量值的均值(n偶数).
中位数是位次平均指标.
适用情况:
- 当资料呈明显的偏态分布
- 资料一端或两端无确定数值,
- 资料的分布情况不清楚.
几何平均数: 用G表示
适用条件:
- 等比资料
抗体的平均滴度
药物的平均效价
人口几何增长资料
- 对数正态分布资料
4.描述离散趋势(程度)的指标
- 方差和标准差
- 全距
- 百分位数
- 变异系数
(1)方差和标准差
描述对称分布离散趋势的重要指标
mean是平均值,SD是标准差
σ²=总体方差, 开平方得到总体标准差σ
S²= 橛本方差, 开平方得到样本标准差S
(2)全距 :
- 用R表示,即极差
- 一组资料的最大与最小值之差
- 全距越大,说明资料的离散程度越大
- 缺点:
不能全面反映一组资料的离散程度
易受个别特大值,特小值影响,不稳定
(3)百分位数:
- 位置指标
- 中位数是第50百分位数,用P50表示
- 常用于描述偏分布次料在某百分位置上的水平及确定偏态分布资料医学参考范围
- 四分位数间距: P25-P75
与中位数一起,描述不对称分布资料的特征
偏态分布:
用中位数:描述集中趋势
用四分位数间距:描述离散趋势
正态分布:
用均数:描述集中趋势
用标准差或方差:描述离散趋势
(4)变异系数:
描述数值变量可靠性的指标
用CV表示,
CV=标准差S/均数X*100%
(二)分类资料的统计描述
- 频数表
- 相对数(构成比和率