春满大地,富贵花开。微雨众卉新,一雷惊蛰始。敬请关注微信公众号:AiryData。

【进阶】使用Excel进行回归分析,预测真实值

Excel Airy 4634℃ 0评论

预备阅读:【进阶】使用Excel进行相关分析

前言

昨天学习了Excel中的相关分析,在数据分析中,相关分析和回归分析关系紧密,今天来学习下Excel中的回归分析。

回归分析

回归分析(regressionanalysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。

我们在得到两组数据之间的相关程度之后,就可以使用回归分析进行预测了,换言之,相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。但只有当数据之间存在高度相关时,进行回归分析寻求相关的具体形式才有意义。

回归分析的分类

在我们的日常数据分析过程中,回归分析是应用十分广泛的一种数据分析方法,该方法主要用于分析单个因变量是如何受到一个或多个自变量影响的。如分析某个产品的销售情况与产品质量、价格、促销活动、天气等因素之间的关系。根据已知的一组数据,我们就可以知道这几个因素对销售额的影响,然后对同类产品的销售额进行预测。

回归分析的分类如下图1所示:

实例应用:使用多元线性回归分析预测销售额

1、实例描述

某品牌汽车经销商的经理了解到投放广告对于汽车销售额增长具有很大的作用,但是他并不明确在电视台投放广告与在各个视频网站投放广告哪种方式对增加汽车销售额更有效。在2017年1月,若在电视台和视频网站分别投入的广告费为20万和30万,那么应估算汽车的销售额为多少万元?针对这种情况,经理手机本公司去年各月的汽车销售额数据及每月在以上两种媒介上投入的广告费用数据,如下图2所示。

2、实例分析

简单根据上面的数据,我们并不能确定这两种广告投放渠道哪种更有效,所以,这里我们使用Excel中的回归分析方法,先检验这两组数据与销售额的相关性程度,随后再根据回归分析过程中所得到的线性回归方程预测确定广告费时的销售额。

3、操作分析

使用Excel进行多元线性回归分析的因变量是销售额,自变量是两种渠道的广告费,具体步骤如下:

第1步:选择回归分析工具并设置参数。打开“数据分析”对话框,选择“回归”分析工具,单击“确定”,如图3所示,弹出“回归”对话框,设置“Y值输入区域”为“$D$2:$D$14”,“X值输入区域”为“$B$2:$C$14”;勾选“标志”“置信度”复选框,并设置置信度为“95%”;单击“输出区域”,并设置该区域为“$F$1”;单击确定即可。如图4所示。

第2步:显示回归分析结果。此时返回工作表,就能得到详细的各项参数值。如图5所示。

操作解析:

回归分析的计算结果一共包括三个模块:

(1)第一个模块为回归统计表,其中主要包含MultipleR、RSquare、AdjustedRSquare、标准误差和观测值。MultipleR为复相关系数,也就是前面说的相关系数,用来衡量x和y之间的相关程度大小,RSquare为复测定系数R2,其用来说明自变量解释因变量变差的程度,从而测量同因变量y的拟合效果,AdjustedRSquare为调整后的复测定系数R2,标准误差衡量拟合程度大小,值越小,说明拟合程度越好,观测值指的是用于估计回归方程数据的观测值个数。

(2)第二个模块为方差分析表。其主要作用是通过假设检验中的F-检验来判断回归模型的回归效果。

(3)第三个模块是回归参数表。第一列表示截距,第二列表示对应模型的回归系数,包括了截距和斜率,可以根据这个建立回归模型。第三列为回归系数的标准误差,值越小,表明参数的精确度越高,第四列对应的是统计量t值,用于检验模型参数。第五列为各个回归系数的P值,当P<0.05时,可以认为模型在α=0.05的水平上显著,或置信度达到了95%。最后几列为回归系数置信区间的上限和下限。

4、决策分析

上面的结果中可以看到,R值为0.9863,表示广告支出费与销售额之间的关系为高度正相关,复测定系数为0.9727,表明用自变量可解释因变量变差的97.27%,AdjustedRSquare为0.9666,说明自变量能说明因变量的96.66%,因变量剩余的3.33%则由其他因素来解释。

回归参数表中,回归方程的截距和两个斜率分别为-316.29,9.13,51.06。又因为P值小于0.05,说明了这两个自变量对汽车销售额均有显著影响,但是,两个斜率中,视频网站对应的回归系数更大,说明在视频网站上投放广告更有效。

由此可得该回归分析的线性回归方程为:y=-316.29+9.13×1+51.06×2。

预测一下,当电视广告费和视频广告费分别为20万和30万时,汽车销售额的预测值为:y=-316.29+9.13*20+51.06*30=1398.11(万)。

小结

上面就是今天的主题内容了,今天学习一下Excel中如何使用相关分析进行预测,这对数据分析很有帮助,可以看到不同渠道投放的广告对我们销售额的影响大小。希望通过上面的操作能帮助大家。如果你有什么好的意见,建议,或者有不同的看法,我都希望你留言和我们进行交流、讨论。

如果想快速联系我,欢迎关注微信公众号:AiryData。

转载请注明:数据之美 » 【进阶】使用Excel进行回归分析,预测真实值

喜欢 (11)or分享 (0)
发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
(3)个小伙伴在吐槽
  1. 请问数据分析对话框在哪里打开?是加的插件吗?
    fenglei2017-04-07 13:34 回复
    • <a href="http://www.airyyun.com/421.html对的,这一篇我写了详细的步骤、你可以看一下。 " target="_blank" rel="nofollow">http://www.airyyun.com/421.html对的,这一篇我写了详细的步骤、你可以看一下。
      Airy2017-04-07 18:35 回复
  2. 请教小编,在第4段决策分析部分,提到的那些值和系数为什么和分析结果的图上数据不一样
    David.L2017-10-13 22:59 回复