另外一个相关系数是phicofficient(cp)系数,这特别适合于2x2的列联表分析。用卡方系数除以样本数,然后开平方即可得到(P值。(P的范围和相关系数一样,都介于0〜1。Cramer'sV也是一种关联度测量的方法,适用于大于2x2的列联表,其范围也介于0~1。
Goodman和Krushal'sgamma适用于测量定序变量间的关联程度,如受教育程度与收入水平之间的关系,Gamma值介于-0.1和+0.1之间。Gamma值的局限是它只适用于存在线性关系的两个变量,而<p系数则适用于变量间的各种关系(线性/曲线关系、对称/非对称关系)。Kendall、tau%也适用于两个变量都是定类变量的情况,特别适用于正方形的列联表分析(如4x4、5x5等)。
斯皮尔曼秩相关系数(Spearman'srho),也被称为斯皮尔曼相关系数,对具有一定等级序列的数据测量非常具有用,如李克特量表式的问题。如果变量值之间的间隔并不是等分的,那么可以使用Kendall'stau而不是斯皮尔曼相关系数。
如果你有两个计量型的变量,也就是连续性变量,如每月发送的短信数、气温和软饮料销售量、寿命和收入、受教育的年限等变量。如果你想验证这些变量间是否具有关联,最合适的就是皮尔逊相关系数,也被称为皮尔逊积矩相关系数(Pearson'sproduct moment correlation coefficient,PMCC)O寻求相关关系的第一步是绘制散点图,这会形象化地展示出两个变量间的关系。你可以从散点图中大致看出两个变量间存在的是线性关系还是曲线关系,是正相关关系还是负相关关系。可以通过数学方法计算出两个变量间的相关系数r,『会显示出两变量间的关系强弱。r的值介于T和+1之间;r=T意味着两变量间存在着强负相关关系(例如,X价格上升时,X的销量却下降);尸+1意味着两变量间存在着强正相关关系(例如,收入越高,寿命越长);尸0则说明两变量间不存在任何线性关系。
如果把r进行平方就会得夫\这就是决定系数(coefficientofdetermination),决定系数是描述在两个变量的总的变化中,可以相互以线性关系说明那部分所占的比重。
例如,如果l+0.2,两个变量间存在着非常弱的正相关关系,比如气温与软饮料的销售量;如果尸+0.7,则两个变量间存在着较强的正相关关系,此时中=0.49,也就是说,49%的软饮料销售量变动是由气温变化引起的。
皮尔逊相关系数自身就非常有用。它也被用于其他分析方法,如偏相关分析。偏相关分析是皮尔逊相关系数分析的一种延伸,它可以控制一些“混杂变量”。多元回归、聚类分析等都是皮尔逊相关分析的延伸。皮尔逊相关系数也被称为零秩相关系数(zero-ordercorrelationcoefficient),值得注意的是,皮尔逊相关系数也可以被用来检验显著性问题,我们会在稍后讨论这个问题。
扫码关注调研家公众号,随时随地获取调研家观点
关注公众号
调研家将为您提供
一对一专业服务,根据您的项目情况,为您定制专属解决方案
Copyright © 2023 SurveyPlus 瀚一数据科技(深圳)有限公司 粤ICP备18114013号
粤公网安备44030502004015号