机器学习实战
jingqiulyue
迭代升级中
展开
-
sklearn 鸢尾花 svm分类器
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn import datasets#一、数据的获取iris = datasets.load_iris()#df=pd.DataFrame(iris.data,columns=iris.feature_names)#df['target']=iris.target#plt.plot(df)#plt.show()#二、数据预处理fr原创 2020-08-23 23:41:03 · 854 阅读 · 0 评论 -
第1章 机器学习基础
推荐:https://zhuanlan.zhihu.com/p/30051176非监督学习: 数据没有类别信息,也不会给定目标值。 聚类:在无监督学习中,将数据集分成由类似的对象组成多个类的过程称为聚类。 密度估计:将寻找描述数据统计值的过程称之为密度估计。【就是:根据训练样本确定x的概率分布】 无监督学习还可以减少数据特征的维度,以便我们可以使用二维或三维图形更加直观地展示数据信息。...原创 2018-03-19 19:27:12 · 169 阅读 · 0 评论 -
第2章 k-近邻项目
推荐:https://zhuanlan.zhihu.com/p/30051322k-近邻(kNN, k-NearestNeighbor)算法主要是用来进行分类的,如划分电影的题材类型:动作片 和 爱情片 。 KNN 工作原理假设有一个带有标签的样本数据集(训练样本集),其中包含每条数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行...原创 2018-03-19 20:48:43 · 210 阅读 · 0 评论 -
第3章 决策树项目
推荐:https://zhuanlan.zhihu.com/p/30051638决策树(Decision Tree)算法主要用来处理分类问题。当然了,还可以用于回归的问题。 决策树 须知: 熵(entropy)指的是体系的混乱的程度,是信息的期望值。 信息熵(香农熵): 是一种信息的度量方式,表示信息的混乱程度,也就是说:信息越有序,信息熵越低。 信息增益: 在划分数据集...原创 2018-03-19 22:03:44 · 317 阅读 · 0 评论 -
第5章 Logistic回归 项目
Logistic回归是用来做分类的。 核心:根据现有数据对分类边界线(Decision Boundary)建立回归公式,以此进行分类。 项目案例: 使用 Logistic 回归在简单数据集上的分类 开发流程: 收集数据: 文本文件.txt中的数据 准备数据: 由于需要进行距离计算,因此要求数据类型为数值型。另外,结构化数据格式则最佳 分析数据: 画出决策边界def plotBest...原创 2018-03-20 21:33:43 · 215 阅读 · 0 评论 -
"libcudart.so.8.0 cannot open shared object file: No such file or directory"
解决办法是将一些文件复制到/usr/local/lib文件夹下:#注意自己CUDA的版本号!sudo cp /usr/local/cuda-8.0/lib64/libcudart.so.8.0 /usr/local/lib/libcudart.so.8.0 && sudo ldconfigsudo cp /usr/local/cuda-8.0/lib64/libcublas....原创 2018-12-22 14:54:12 · 423 阅读 · 0 评论