数据分析之预测模型

什么叫数据分析?

        通过对大量数据进行科学分析,从而得出结论,提出建议,辅助决策。

科学的数据分析步骤有哪些?

        1.明确目的

        2.收集数据(已知数据或网络爬虫)

        3.数据处理

        4.数据分析(数据分析(业务),数据挖掘(代码+算法))

        5.数据报告(报告:ppt,word,markdown;可视化:python FilneBI PowerBI)

一元线性回归趋势预测

        一元线性回归:y=wx+b

Years(工龄)Salary(薪资)
1.119343
1.326205
1.517731
223525
2.219891
2.936642
340150
3.234445
3.244445
3.737189
3.943218
435794
436957
4.137081
4.541111
4.947938
5.146029
5.363088
5.961363
673940
6.871738
7.178273
7.981302
8.293812
8.789431
985582
9.596969
9.692635
10.3102391
10.5101872

读取数据:

代码:

import seaborn
import statsmodels.api
import pandas as pd
import numpy as np
df = pd.read_csv("Salary_Years.csv")
seaborn.lmplot(x='Years',y='Salary',data=df)
plt.show()

 画出散点图如下:

 求斜率和截距:

fit=statsmodels.api.formula.ols('Salary~Years',data=df).fit()
print(fit.params)
Intercept    5792.200199
Years        9449.962321
dtype: float64
  • 10
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值