数据统计与分析基础 实验四 机器学习算法建模与求解

实验目的

	掌握使用实用软件通过各类基础的机器学习算法解决实际数据统计分析任务的能力,熟悉线性回归、SVM、kmeans、PCA等算法的调用。

实验内容

1、对于下表中的数据,对1990年-2005年内的数据建立人口自然增长率对于国民总收入、CPI增长率和人均GDP的三元线性回归模型。


import numpy as np
import pandas as pd
import statsmodels.api as sm
file = r'f:\xx.xlsx'#实验数据保存位置,按照'国民总收入','CPI增长率','人均GDP','人口自然增长率'的格式输入对应数据
data = pd.read_excel(file)
data.info()
data.head()
x=sm.add_constant(data[['国民总收入','CPI增长率','人均GDP']])
y=data['人口自然增长率']
result = sm.OLS(y,x).fit() #模型拟合
print('打印模型拟合\n',result.summary())
print('打印模型参数\n',result.params)



运行参考

打印头部信息
在这里插入图片描述
打印模型拟合
在这里插入图片描述
在这里插入图片描述
打印模型参数
在这里插入图片描述


2、 下载UCI中wine数据集:http://archive.ics.uci.edu/ml/datasets/Wine。所下载数据可以用txt打开,其中每一行数据为一种Wine的记录,每条记录包含14个维度,其中第一维为该Wine类别,后面13维为具体的Wine属性。请基于所有的178个Wine样本对Wine的13个维度进行PCA降维分析,将贡献率之和大于90%的成分提取,并将原13维属性数据映射为新数据。
import sklearn
import numpy as np
import matplotlib as pls
from sklearn.decomposition import  PCA
import pandas as pd
data= np.loadtxt(r'f:/wine.data',delimiter=',',dtype='str')#文档保存位置
print('显示导入的数据:\n',data)
pca = PCA(n_components = 0.9)#方差和大于0.9,PCA会自动地选择下降维数
new_data = pca.fit_transform(data)
print('模型中的各个特征量:\n',pca.components_)
print('降维后各个成分的方差值:\n',pca.explained_variance_)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值