spss频数分布表制作教程 spss四方位数是指?

[更新]
·
·
分类:行业
2309 阅读

spss频数分布表制作教程

spss四方位数是指?

spss四方位数是指?

四分位数:将所有数值按大小顺序排列并分成四等份,处于三个分割点位置即为四分位数。Q1下四分位数,即第25百分位数;Q2中位数,即第50百分位数;Q3上四分位数,即第75百分位数。通过Q1,Q2,Q3比较,分析其数据变量的趋势。可四分位数绘制成箱线图,所谓箱线图就是由数据的最大值、最小值、中位数和两个四分位数绘制的一个箱子和两条线段的图形,箱线图直观地反映出一组数据的分布特征,并进行多组数据的分析比较。
四分位数还可用于四分位数间距Q Q3-Q1的计算,四分位数间距常用于描述偏态频数分布以及分布的一端或两端无确切数值资料的离散程度,其数值越大,变异度越大,反之,变异度越小。由于四分位数间距不受两端个别极大值或极小值的影响,因而四分位数间距较全距稳定,但仍未考虑全部观察值的变异度。

如何用spss画roc图像?

ROC曲线图是反映敏感性与特异性之间关系的曲线。横坐标X轴为 1 – 特异性,也称为假阳性率(误报率),X轴越接近零准确率越高;纵坐标Y轴称为敏感度,也称为真阳性率(敏感度),Y轴越大代表准确率越好。
根据曲线位置,把整个图划分成了两部分,曲线下方部分的面积被称为AUC(Area Under Curve),用来表示预测准确性,AUC值越高,也就是曲线下方面积越大,说明预测准确率越高。曲线越接近左上角(X越小,Y越大),预测准确率越高。
案例分析
(1)背景
当前进行一项影响“低出生体重儿”的研究,希望研究产妇年龄,产妇体重对于“低出生体重儿”的预测准确率。将低出生体重儿赋值为1,正常出生体重儿赋值为0。
(2)操作步骤
使用路径:SPSSAU→可视化→ROC曲线
拖拽分析项到分析框中,放置位置如下图所示:
右侧的数值(分割点)代表变量Y的判断标准,大于或等于这个标准的数值判断为“阳性”,小于这个标准的数值判断为“阴性”。默认判断数值为1,如果默认数值与判断标准不符,可手动修改。
*设置不同的数值,会得到不一样的结果,如果没有公认的金标准,也可以尝试设置不同的数值,对比分析找到更佳的预测曲线。
本例中数字1代表低出生体重儿,数字0代表正常儿,所以将分割点设为1。
(3)结果分析
①频数分析
表1 频数分析
表1为频数分析表格,主要来简单描述Y值的分布情况。根据上表显示,低出生体重儿共有130人,正常儿为59人,阳性比例为68.78%,阴性比例为31.22%。
②ROC结果汇总表
表2 ROC曲线结果汇总
表2展示的是根据产妇年龄、产妇体重分别构建的ROC曲线。
AUC代表ROC曲线下的面积,表示预测准确率。AUC值取值在0-1之间,数值越大,代表正确率越高。
根据上表可知,产妇年龄对应的AUC值为0.549,说明产妇年龄对于低出生体重儿的诊断价值比较低。产妇体重对应的AUC值为0.601大于0.05但小于0.7,P0.025 lt0.05,说明虽然产妇体重对低出生体重儿的诊断价值显著的高于0.5,但诊断价值依旧比较低。
综合来看,产妇年龄、产妇体重两个因素对判断低出生体重儿的诊断价值都比较低。
ROC曲线
从ROC曲线上也可以直观的看出:曲线没有靠近左上角,说明诊断的准确性并不高,也就没有很高的诊断价值。
③ROC最佳界值结果
最佳界值
如果表2的某个因素的AUC值大于0.7说明有较高的诊断价值,此时可通过此表找到最佳界值。最佳界值点也就是ROC曲线最靠近左上角的点。
从上表可以看出:产妇年龄,其最佳界值出现在敏感度为0.277,特异度为0.881时,即在该点时,最靠近左上角,整体最优。针对产妇体重,其最佳界值出现在敏感度为0.785,特异度为0.407时,整体最优。
最佳界值