对于关联度测量,你应该弄清楚以下事情。
在进行两个变量间的测量时,有些假设两个变量间存在的是线性关系,如果你观察散点图,你会发现可以从左上端画一条到右下端的直线,或者是从左下端画一条到右上端的直线,这说明这两者间存在着线性关系;如果不是这样的话,那么这两个变量间可能存在的是非线性或曲线关系。如果两个变量间存在的是非线性关系,那么皮尔逊相关系数就可能低估了两个变量间的关联程度。
我们在前面已经知道离散值会影响到变量中心集中趋势,比如平均数。离散值也会对两变量间关联度测量产生影响,特别是样本数太少时,因此在数据记录或是数据录入时,检査离群值并及时修正绝对是有帮助的。
理想状况,变量值应该是正态分布的,也就是说,你所绘制出的变量值的直方图或条形图应该是钟形的。样本的分布会影响到统计检验的结果,因此有必要检查变量值的分布情况。
同方差性(homoscedasticity),也被称为方差齐性(homogeneityofvariance),是说一个变量的变动情况与其他变量相同。如果你描绘出每个变量的散点图,则散点图大致呈现岀椭圆形。如果对变量进行皮尔逊相关系数或回归运算,则你需要使数据遵循同方差性。
扫码关注调研家公众号,随时随地获取调研家观点
关注公众号
调研家将为您提供
一对一专业服务,根据您的项目情况,为您定制专属解决方案
Copyright © 2023 SurveyPlus 瀚一数据科技(深圳)有限公司 粤ICP备18114013号
粤公网安备44030502004015号