先求 x、y 的平均数 x_=(3+4+5+6)/4=9/2,y_=(2.5+3+4+4.5)/4=7/2,
然后求对应的 x、y 的乘积之和 :3*2.5+4*3+5*4+6*4.5=66.5 ,x_*y_=63/4 ,
接着计算 x 的平方之和:9+16+25+36=86,x_^2=81/4 ,
现在可以计算 b 了:b=(66.5-4*63/4) / (86-4*81/4)=0.7 ,
而 a=y_-bx_=7/2-0.7*9/2=0.35 ,
所以回归直线方程为 y=bx+a=0.7x+0.35 。
扩展资料:
回归直线的求法
最小二乘法:
总离差不能用n个离差之和。
来表示,通常是用离差的平方和,即作为总离差,并使之达到最小,这样回归直线就是所有直线中Q取最小值的那一条,这种使“离差平方和最小”的方法,叫做最小二乘法:
由于绝对值使得计算不变,在实际应用中人们更喜欢用:Q=(y1-bx1-a)²+(y2-bx2-a)²+······+(yn-bxn-a)²,这样,问题就归结于:当a,b取什么值时Q最小,即到点直线y=bx+a的“整体距离”最小。
回归方程的写法:spss数据表中有非标准系数一栏,这其实就是回归方程的系数。对应的变量就是和系数相乘。如果有常数项,就不用和变量值相乘。
回归直线的原理:
如果散点图中点的分布从整体看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。根据不同的标准,可以画出不同的直线来近似表示这种线性相关关系。
回归直线比如可以连接最左侧点和最右侧点得到一条直线,或者让画出的直线上方的点和下方的点数目相等。当所有数据点都分布在一条直线附近,显然这样的直线还可以画出许多条,而我们希望找出其中的一条,它能最好地反映x与Y的关系。
换言之,我们要找出一条直线,使这条直线"最贴近"已知的数据点。记此直线方程为y^=a+bx。这里在y的上方加记号"^"是为了区分Y的实际值y,表示x取值xi(i=1,2,3……,n)时,Y相应的观察值为yi,而直线上对应于xi的纵坐标是yi^=a+bxi(i为x右下角的数值)。
y^=a+bx式叫做Y对x的回归直线方程,b叫回归系数。要确定回归直线方程,只要确定a与回归系数b。
参考资料:回归直线_百度百科