数据统计与分析基础实验四机器学习算法建模与求解

最新推荐文章于 2023-02-17 19:52:43 发布

qq_45964335

最新推荐文章于 2023-02-17 19:52:43 发布

阅读量1.1k

点赞数

文章标签： python

本文链接：https://blog.csdn.net/qq_45964335/article/details/122323857

版权

实验目的

	掌握使用实用软件通过各类基础的机器学习算法解决实际数据统计分析任务的能力，熟悉线性回归、SVM、kmeans、PCA等算法的调用。

实验内容

1、对于下表中的数据，对1990年-2005年内的数据建立人口自然增长率对于国民总收入、CPI增长率和人均GDP的三元线性回归模型。


import numpy as np
import pandas as pd
import statsmodels.api as sm
file = r'f:\xx.xlsx'#实验数据保存位置，按照'国民总收入','CPI增长率','人均GDP'，'人口自然增长率'的格式输入对应数据
data = pd.read_excel(file)
data.info()
data.head()
x=sm.add_constant(data[['国民总收入','CPI增长率','人均GDP']])
y=data['人口自然增长率']
result = sm.OLS(y,x).fit() #模型拟合
print('打印模型拟合\n',result.summary())
print('打印模型参数\n',result.params)

运行参考

打印头部信息
在这里插入图片描述
打印模型拟合

打印模型参数

2、下载UCI中wine数据集：http://archive.ics.uci.edu/ml/datasets/Wine。所下载数据可以用txt打开，其中每一行数据为一种Wine的记录，每条记录包含14个维度，其中第一维为该Wine类别，后面13维为具体的Wine属性。请基于所有的178个Wine样本对Wine的13个维度进行PCA降维分析，将贡献率之和大于90%的成分提取，并将原13维属性数据映射为新数据。

import sklearn
import numpy as np
import matplotlib as pls
from sklearn.decomposition import  PCA
import pandas as pd
data= np.loadtxt(r'f:/wine.data',delimiter=',',dtype='str')#文档保存位置
print('显示导入的数据:\n',data)
pca = PCA(n_components = 0.9)#方差和大于0.9，PCA会自动地选择下降维数
new_data = pca.fit_transform(data)
print('模型中的各个特征量:\n',pca.components_)
print('降维后各个成分的方差值:\n',pca.explained_variance_)

最低0.47元/天解锁文章

qq_45964335

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据统计与分析基础实验四机器学习算法建模与求解

实验目的掌握使用实用软件通过各类基础的机器学习算法解决实际数据统计分析任务的能力，熟悉线性回归、SVM、kmeans、PCA等算法的调用。实验内容1、对于下表中的数据，对1990年-2005年内的数据建立人口自然增长率对于国民总收入、CPI增长率和人均GDP的三元线性回归模型。import numpy as npimport pandas as pdimport statsmodels.api as smfile = r'f:\xx.xlsx'#实验数据保存位置，按照'国民总收入','C
复制链接

扫一扫