Python机器学习应用-北京理工大学-礼欣
MOOC课程地址:http://www.icourse163.org/learn/BIT-1001872001?tid=1001965001
课程资料可在GitHub上下载(包括数据与相关教学资料)
链接:https://github.com/caiiiac/Machine-Learning-with-Python
课程内容
非监督学习:聚类、降维
监督学习:分类、回归
强化学习:使用深度神经网络进行强化学习
sklearn
安装:pandas, numpy, scipy, matplotlib, sklearn
六个模块:分类、回归、聚类、降维、模型选择、数据预处理
使用sklearn进行机器学习的一般步骤
加载数据(数据格式整理,工作量一般较大)
创建模型 a = sklearn.***
训练模型 a.fit(train_data)
预测 a.predict(test_data_X)
检验,模型预测结果与真实结果进行比较
聚类:Kmeans
随机选择K个点作为聚类中心,根据与聚类中心的距离将所有样本点划分到各个簇,重新计算各个簇的中心点作为新的聚类中心,重复第2、3步直到聚类中心不再变化(或者达到一定迭代次数)
sklearn.cluster.KMeans(n_cluster) K
实例:31个省份家庭平均消费水平
聚类:DBSCAN
不需要制