Python机器学习
王樰沫
不撞南墙不回头
展开
-
运用scikit-learn库进行回归分析(一)
运用scikit-learn库进行回归分析(一)一、读取数据和构建模型(一)最小二乘法拟合模型(二)RANSAC(随机抽样一致性)拟合高鲁棒性回归模型二、模型性能评估三、正则化(一)岭回归(二)LASSO回归分析分为线性回归分析和非线性回归分析,本文主要介绍线性回归分析,使用数据来自网站房屋数据。一、读取数据和构建模型(一)最小二乘法拟合模型# 读取数据import pandas as ...原创 2019-02-15 13:07:55 · 912 阅读 · 0 评论 -
python如何可视化决策树
python如何可视化决策树第一步,打开gvedit.exe软件,点击“file”-“open”;第二步,找到.dot文件,打开,形成决策树;本文承接此链接决策树第一步,打开gvedit.exe软件,点击“file”-“open”;第二步,找到.dot文件,打开,形成决策树;...原创 2019-06-01 22:11:57 · 610 阅读 · 0 评论 -
Python进行集成学习
Python进行集成学习第一步,导入库和数据;第二步,构建集成函数;第三步,数据处理;第四步,单个分类器;第五步,多分类器;最后,多分类器性能评价;第一步,导入库和数据;# 导入库from sklearn import datasetsimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt# 使文字可以...原创 2019-06-01 20:26:40 · 435 阅读 · 0 评论 -
Python进行决策树和随机森林
Python进行决策树和随机森林一、决策树第一步,导入库;第二步,导入数据;第三步,数据预处理;第四步,决策树;第五步,决策树评价二、随机森林第一步,随机森林;第二步,随机森林评价;一、决策树第一步,导入库;# 导入库from sklearn import datasetsimport numpy as npimport pandas as pdimport matplotlib.p...原创 2019-05-26 21:37:58 · 1837 阅读 · 4 评论 -
Python进行Logistic回归
Python进行Logistic回归第一步,导入库和数据;第二步,处理数据;第三步,数据建模;最后,模型评价。第一步,导入库和数据;# 导入库from sklearn import datasetsimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt# 使文字可以展示plt.rcParams['fo...原创 2019-05-25 21:55:08 · 6836 阅读 · 2 评论 -
运用scikit-learn库进行bagging和AdaBoost
运用scikit-learn库进行bagging和Adaboost一、bagging二、AdaBoost一、bagging使用酒数据进行分析,数据获取来自该网站数据获取网站,获取数据后,将数据储存为.csv格式。# 获取数据import pandas as pddf_wine = pd.read_csv('wine.csv', header=None)df_wine.columns ...原创 2019-02-12 21:11:58 · 275 阅读 · 0 评论 -
运用scikit-learn库进行主成分分析和线性判别分析
运用scikit-learn库进行主成分分析和线性判别分析一、主成分分析二、线性判别分析一、主成分分析在进行数据分析之前,先对数据进行预处理。# 读取酒数据import pandas as pddf_wine = pd.read_csv('wine.csv', header=None)df_wine.columns = ['Class label', 'Alcohol', 'Malic...原创 2019-02-10 13:55:32 · 401 阅读 · 0 评论 -
运用scikit-learn库进行聚类分析
运用scikit-learn库进行聚类分析一、 k-means聚类算法(一)k-means算法(二)使用肘方法确定簇的最佳数量(三)使用轮廓图定量分析聚类质量二、层次聚类(一) 普通层次聚类步骤(二)通过scikit-learn 进行层次分析三、 使用DBSCAN(基于空间密度的聚类算法)划分高密度区域聚类分析常用的方法有 k-means聚类算法、 层次聚类算法、DBSCAN(基于空间密度的聚类...原创 2019-02-21 21:28:18 · 3400 阅读 · 0 评论 -
运用scikit-learn库进行线性和非线性分类
运用scikit-learn库对鸢尾花数据进行分类一、线性分类(一)感知器算法(二)Logistic回归(三)SVM(支持向量机)(四)决策树(五)随机森林二、非线性分类(一)核SVM(二)K近邻算法鸢尾花数据是进行机器学习常用的数据之一,本文就鸢尾花数据对分类进行系统的学习。鸢尾花数据获得来自http://archive.ics.uci.edu/ml/machine-learning-data...原创 2019-02-08 20:49:07 · 1562 阅读 · 0 评论 -
运用scikit-learn库进行回归分析(二)
运用scikit-learn库进行回归分析(二)一、多项式回归二、随机森林回归(一)决策树回归(二)随机森林回归本文主要介绍非线性回归分析,使用数据来自网站房屋数据。一、多项式回归# 读取数据import pandas as pddf = pd.read_csv('housing.csv', header = None, sep = '\s+')df.columns = ['CRIM'...原创 2019-02-15 13:26:18 · 277 阅读 · 0 评论 -
Python进行Bagging和Adaboost
Python进行Bagging和Adaboost一、Bagging第一步,导入数据和库;第二步,数据处理;第三步,Bagging;第四步,模型评价;(1)混淆矩阵(2)ROC曲线二、Adaboost第一步,Adaboost;第二步,模型评价(1)混淆矩阵(2)ROC曲线一、Bagging第一步,导入数据和库;# 导入库from sklearn import datasetsimport ...原创 2019-06-02 19:07:43 · 684 阅读 · 0 评论