在写论文过程中,数据分析是不可或缺的环节。无论是理工科论文中的实验数据验证,还是社科类论文的量化研究,都离不开数据分析。SPSS是全球最早的统计分析软件,操作页面十分友好,是众多研究生进行数据处理和统计分析的首选工具。今天,小白给大家带来了几大SPSS常用方法,让你高效完成论文实证。
对SPSS感兴趣可直接扫码领取
【spss软件操作教程和安装教程】
无套路、无需转发,直接领取即可
👇👇👇
一、描述性统计分析
分析分类型变量:点开“分析→描述统计→频率→统计”。针对分类型变量,“众数”有统计意义。
分析连续数值型变量:点开“分析→描述统计→频率→统计”。针对连续数值型变量“平均数”、“中位数”、“四分位数”、“标准差”、“方差”、“范围”、“最大值”、“最小值”有统计意义。
注意,服从正态分布的变量,“平均值"才具有统计意义;不服从正态分布的变量,“平均数”没有统计意义,“中位数”、“四分位数才有统计学意义。
二、卡方检验
适用于分类型变量的统计分析,检验分类型变量中各个类别的构成比的差异的统计学方法。分组变量可以是无序或者有序分类变量,但被检验变量只能是无序分类变量。
点开“分析→统计→交叉表”点开“统计”,勾选“卡方”,点开“单元格”,勾选“行”、“列”。可以在“变量视图”中的“缺失”中定义组别缺失,以分析两两组别之间的差异是否显著。
“显著性(p)”,p<0.05 说明存在显著性差异,p>=0.05 说明不存在显著性差异。
三、独立样本 T 检验
该方法适用于对两个组别均值差异的检验,以判断该差异是否具有统计学意义。需要特别注意的是,所有组别的均值必须遵循正态分布。
依次打开“分析”菜单,选择“比较平均值”下的“独立样本T检验”。在界面中点击“定义组”,并填写各组别所代表的数值。
莱文方差等同性检验“显著性(p)”p>=0.05说明方差相等,p<0.05说明方差不相等根据P值选择使用哪一组数据。再看“平均值等间性t检验”中的“显著性(p)”,p<0.05说明平均值存在显著性差异,p>=0.05说明平均值不存在显著性差异。
四、配对样本T检验
适用于同一批样本前后或同一批样本两种状态下均值的差异性检验,差异是否具有统计学意义。注意:先检验前后两组变量的差值是否服从正态分布。点开“分析一比较平均值一成对样本T检验”选中一个变量,按住shift,再选中一个变量。
“配对样本相关性表中的“显著性(p)”p<0.05说明两个均值显著相关,可以使用成对样本T检验;p>=0.05说明两个均值不具有相关性,不可以使用成对样本T检验
“配对样本检验”表中的“显著性(p)”,p<0.05说明两个均值存在显著差异,p>=0.05说明两个均值不存在显著差异
对SPSS感兴趣可直接扫码领取
【spss软件操作教程和安装教程】
无套路、无需转发,直接领取即可
👇👇👇
五、单因素方差分析和事后比较
该方法适用于对三个及以上组别之间均值差异的检验,以判断差异是否具有统计学意义。需要注意的是,所有组别的均值必须服从正态分布。
依次打开“分析”菜单,选择“比较平均值”中的“单因素ANOVA检验”,将“因变量”指定为检验变量,并将“因子”指定为组别。
接着,点击“选项”,并勾选“描述”以获取描述性统计信息。在“ANOVA”表中,若“显著性(p)”值小于0.05,则表示各组之间均值存在显著性差异;若p值大于或等于0.05,则表明均值之间不存在显著性差异。
当“ANOVA”表中的“显著性(p)”,p<0.05 时,进行事后比较。点开“分析→比较平均值→单因素ANOVA检验→事后比较”检验变量为“因变量”,组别为“因子”勾选“邦弗伦尼”““多重比较"表中的“显著性(p)”p<0.05说明均值存在显著性差异,P>=0.05说明均值不存在显著性差异。
六、正态性检验
方法一:直方图。点开“图形→旧对话框→直方图”,选入检验变量,勾选“显示正态曲线”
方法二:PP 图或 Q-Q 图。点开“分析→描述统计-P-P 图或 Q-Q图”,选入检验变重。
方法三:KS检验(样本量>=2000)和 SW(夏-威)检验(样本量<2000)。点开“分析→描述→探索”,选入检验变量为因变量,点开“图”,勾选“含检验的正态图”“自由度”为样本量““显著性(p)”p>=0.05说明服从正态性,p<0.05说明不服从正态性。
七、相关性分析(两个平等变量之间的关系)
两变量均为连续数值型变量的相关性分析-皮尔逊分析(pearson)。点开“分析相关→双变量”,选入两变量,勾选“皮尔逊”“个案数”为样本量。“显著性(p)”,p>=0.05说明两变量不具有相关性,p<0.05说明两变量具有相关性“皮尔逊相关系数”大于0,越接近1越正相关,>=0.7说明强正相关;小于0,越接近-1 越负相关,<=0.7说明强负相关。含有分类型变量的相关性分析一斯皮尔曼分析(Speaman)。点开“分析→相关→双变量”选入两变量,勾选“斯皮尔曼”。
“个案数”为样本量。“显著性(p)”,p>=0.05说明两变量不具有相关性,p<0.05说明两变量具有相关性。
“皮尔逊相关系数”,大于0,越接近1越正相关,>=0.7说明强正相关;小于0,越接近-1越负相关,<=0.7说明强负相关。
八、线性回归分析(一个或多个变量对另一个变量的影响)
自变量可以是一个或多个,既可以是连续数值型变量,也可以是分类型变量。在存在分类型变量的情况下,需要进行虚拟线性回归。因变量则只能为一个,并且必须是连续数值型变量。
请依次打开“分析”菜单,选择“回归”下的“线性”选项,将自变量和因变量输入相应的字段。接下来,点击“统计”选项,勾选“共线性诊断”。然后,进入“图”选项,勾选“直方图”。
“模型摘要”表中的“R方”,大于0.5说明模型拟合较好自变量可以很好解释因变量,在实际数据中,大于0.2就可说明拟合较好。
“ANOVA"表中的“显著性(p)”,p<0.05说明至少一个自变量可以显著影响自变量p>=0.05说明没有一个自变量可以显著影响自变量。系数”表中的“显著性(p)"可以说明各个自变量是否能显著影响因变量,p<0.05说明此自变量可以显著影响自变量,p>=0.05说明此自变量不可以显著影响自变量“系数“表中的“B(或Beta)"说明自变量增加1,因变量增加B(或Beta)的数值,B(或Beta)有正有负。
最后进行对回归模型进行诊断:
“回归模型共线性诊断”的重要性在于各自变量之间不得存在重叠或包含关系。如果“系数”表中所有自变量的方差膨胀因子(VIF)均小于5,则说明各自变量之间不存在多重共线性,这确保了回归模型运算结果的稳定性与可靠性。
另一方面,“回归模型残差诊断”则强调,大部分自变量能够有效解释因变量,只有少数自变量未能对因变量进行有效解释,且这种现象在分布上是随机且基本符合正态分布(残差为零的高频率并不会影响模型的有效性)。在此情况下,回归模型的运算结果同样能够保持稳定可靠。
九、非参数检验/秩和检验(存在不服从正态分布的变量/分类变量)
独立样本T检验的非参数检验。点开“分析,非参数检验,旧对话框→2个独立样本”,填入“检验变量”““分组变量”,点开“定义组”填入组别中各分类代表的数值。检验统计”表中的“显著性(p)”p<0.05说明存在显著性差异,p>=0.05说明不存在显著性差异。
点开“分析→描述→探索”,填入“因变量”、“因子”,点开“统计”,勾选“百分位数”,只需要“加权平均”。写成中位数(下四分位数~上四分位数)。
对于配对样本的T检验,可进行非参数检验。在“分析”菜单中选择“非参数检验”,进入“旧对话框”,并选择“2个相关样本”。在此界面中,选中一个变量,并按住Shift键,同时选择另一个变量。
在“检验统计”表中,若“显著性(p)”值小于0.05,则表明存在显著性差异;若p值大于或等于0.05,则表示不存在显著性差异。
最后,再次打开“分析”菜单,选择“描述”下的“探索”,填写“因变量”和“因子”,再进入“统计”选项,勾选“百分位数”,并将结果以中位数形式呈现(下四分位数 ~ 上四分位数)。
对SPSS感兴趣可直接扫码领取
【spss软件操作教程和安装教程】
无套路、无需转发,直接领取即可
👇👇👇