您好,欢迎光临中科蓝海(天津)科技有限公司!
  

服务与支持 设为首页 加入收藏

技术分享

当前位置 首页 > 技术分享

【中科蓝海课堂】SPSS 数据分析教程之卡方检验

发布日期:2025-12-03 来源:中科蓝海(天津)科技有限公司

在学术研究和论文写作中,我们经常需要探讨两个分类变量之间的关系。这些问题都涉及两个分类变量之间的关联性检验或差异性检验,而卡方检验正是解决这类问题的核心统计方法。 卡方检验能够帮助我们科学地验证两个类别变量之间是否存在显著的关联或分布差异,为研究结论提供可靠的统计证据。

一、什么是卡方检验?

卡方检验是一种常用的非参数统计方法,适用于分析分类变量之间是否存在显著关联或分布差异。根据研究设计的不同,卡方检验在 SPSS 等工具中主要包括以下三类应用:

1拟合优度检验

用于检验单个分类变量的实际观测频数是否与某种理论分布(如均匀分布、正态分布等)相符,适用于判断数据是否符合特定模型或假设。

2独立性检验

用于分析两个分类变量之间是否相互独立,常见于列联表分析,例如探究性别与投票偏好之间是否存在关联。

3同质性检验

用于比较多个组或总体在某一分类变量上的分布是否一致,例如分析不同地区人群的血型分布是否有显著差异。

卡方检验的核心在于比较实际观测频数与理论期望频数之间的偏差程度,并通过卡方分布判定该差异是否具有统计显著性。

二、实例应用一

若研究者希望探究 120 位样本在问卷中第 3-5 题的各选项勾选次数是否存在显著差异,则应采用拟合优度检验。此检验的目的在于判断某一变量各选项的实际观察频数分布是否与理论期望分布一致。若两者一致,说明样本在该变量的各选项勾选情况大致均匀,分布符合理论预期;若两者存在显著差异,则说明样本在该变量上的分布可能受到其他因素影响。

1研究假设

H₀:实际观察频数与理论期望频数之间无显著差异(即各选项被勾选的次数均匀分布)。

H₁:实际观察频数与理论期望频数之间存在显著差异(即各选项被勾选的次数不均匀)。

在拟合优度检验中,使用的统计量仍为卡方值(χ²),通过比较实际频数与期望频数之间的偏差进行计算。若计算所得的卡方值所对应的 p 值小于显著性水平(如 0.05),则拒绝零假设,接受备择假设,认为变量各选项间的勾选次数存在显著差异。

2研究问题

样本在第三题四个选项上的勾选次数是否有显著不同?

样本在第四题四个选项上的勾选次数是否有显著不同?

样本在第五题四个选项上的勾选次数是否有显著不同?

3卡方拟合优度检验操作步骤(SPSS

依次点击:分析(Analyze非参数检验(Nonparametric Tests旧对话框(Legacy Dialogs卡方(Chi-Square

注:不同 SPSS 版本菜单名称可能略有差异,请根据实际界面调整。

 

1.png

 

将待检验的分类变量选入 检验变量列表Test Variable List)框中。

期望值Expected Values)栏中:若检验均匀分布,选择 所有类别相等All categories equal);

若检验特定理论分布,选择 Values)并手动输入各理论期望比例(需按类别顺序输入)。

 

2.png

 

点击确定运行分析。

4结果解读

1描述性统计表

3.png

4.png

 

查看实际观测频数(OBSERVED)和期望频数(EXPECTED),初步了解分布情况。

2检验统计表

5.png

 

p < 0.05:拒绝原假设,认为实际分布与理论分布存在显著差异;

p ≥ 0.05:则无显著差异,接受原假设。

卡方值 (Chi-Square Value):反映实际频数与期望频数的总体偏差,值越大差异越明显。

自由度(df):计算公式为(类别数 - 1)。

渐近显著性(Asymp. Sig.):即 p 值。

三、实例应用二

案例背景研究性别(男/女)与购物渠道偏好(线上/线下)是否存在显著关联,共收集 200 份有效问卷数据。

性别(赋值:1=男,2=女);购物偏好(赋值:1=线上,2=线下)。

 

6.png

 

点击菜单栏:【分析】【描述统计】【交叉表】

 

7.png

 

变量设置:将"性别"变量拖入""区域;将"购物偏好"变量拖入""区域。

 

8.png

 

统计量设置:点击右侧"统计"按钮,勾选"卡方",点击"继续"

 

9.png

 

单元格显示设置:点击"单元格"按钮,在"百分比"框里勾选"",点击"继续"

 

10.png

 

1运行分析:点击"确定"开始分析。

2结果解读

1交叉表:看清数据分布


11.png

 

这个表格展示了两个变量的分布情况。

解读要点:

男性明显倾向于线下购物(80.9%)。

女性明显倾向于线上购物(79.2%)。

两者呈现出几乎相反的偏好模式,初步判断存在关联。

2卡方检验表:判断是否显著


12.png

 

这是最关键的输出表格。

关键信息解读:

皮尔逊卡方值:χ² = 72.000

自由度(df):对于 2x2 表格,自由度 = (2-1)*(2-1) = 1

▲ P 值:p < 0.001

期望计数检查:表格下方的注释"0 个单元格(0.0%)的期望计数小于 5。最小期望计数为 46.06",这意味着数据完全满足卡方检验的前提条件。

3最终结论:由于 p < 0.001,远小于 0.05 的显著性水平,我们拒绝原假设。表明性别与购物偏好之间存在显著的关联。

四、常见问题与解答

Q1出现"期望计数小于 5"的警告怎么办?

1. 增加样本量(最优解)。

合并相关类别(例如,将"非常满意""满意"合并)。

改用 Fisher精确检验。

Q2SPSS 输出那么多卡方值该看哪一个?

对于 2x2 表格:

a)如果总样本量 > 40”所有期望频数 > 5”,看皮尔逊卡方

b)如果总样本量 > 40”有期望频数在1-5之间,看连续性校正

c)如果总样本量 < 40”有任何期望频数 < 1”,看“Fisher精确检验

对于非 2x2 表格(如 3x3):

a)如果所有期望频数 ≥ 5”,看皮尔逊卡方

b)如果超过20%的格子期望频数 < 5”,看“Fisher精确检验

Q3卡方检验与 t 检验的区别?

卡方检验:分析两个分类变量(如性别与偏好)间的关系。

t 检验:比较一个连续变量(如工资收入)在两个分类群体(如男/女)上的差异。