![](https://img-blog.csdnimg.cn/20210311100002682.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Python机器学习
python与机器学习
乘风破浪的牛马
安静的搬砖人士~
(有些内容涉及个人信息、公司信息,所以设置为付费专栏)
展开
-
机器学习公式推导
一、回归模型研究的对象:回归问题研究具有“相关关系”的变量,比如人的身高和体重具有一定的相关关系,他们就可以用回归模型研究原创 2020-09-15 15:11:23 · 417 阅读 · 0 评论 -
(1-1)sklearn库的----- 数据处理
scikit-learn已经成为Python重要的机器学习库了,scikit-learn简称sklearn,支持包括分类,回归,降维和聚类四大机器学习算法。还包括了特征提取,数据处理和模型评估者三大模块。一,sklearn官方文档的内容和结构1.1 sklearn官方文档的内容1.2 sklearn官方文档结构 由图中,可以看到库的算法主要有四类:分类,回归,聚类,降维。其中:常用的回归:线性、决策树、SVM、KNN;集成回归:随机森林、Adaboost、GradientBoosting、原创 2020-08-19 18:56:35 · 2011 阅读 · 0 评论 -
《(1-1)sklearn库的----- 数据处理》摘要
1,获取数据补充:什么是X[y==0, 0] ?X[2,3]就是返回第二行第3列数据X[:, (2, 3)]冒号代表全部,这句话就是返回所有行的第2列和第3列X[y==0,3]就是返回满足y为0的那些行中的第三列数据①鸢尾花from sklearn.datasets import load_iris #导入鸢尾花数据集iris=load_iris()X = iris.data # 获得其特征向量y = iris.target # 获得样本labeliris.keys() #dict_原创 2020-11-05 18:36:32 · 219 阅读 · 0 评论 -
(1-2)sklearn库的模型----监督学习
“人体运动状态信息评级”实例编写与对比一共有A、B、C、D、E 5个人的数据,原创 2020-08-19 18:56:23 · 765 阅读 · 0 评论 -
(1-3)sklearn库的模型----无监督学习
1.无监督学习中的 聚类算法之 k-means聚类算法–from sklearn.cluster import KMeansKMeans(n_clusters=8, init='k-means++', n_init=10, max_iter=300, tol=0.0001, precompute_distances='auto', verbose=0, random_state=None, copy_x=True, n_jobs=1, algorithm='auto')...原创 2020-08-19 18:56:06 · 988 阅读 · 0 评论 -
(1-4)sklearn库的----模型评估
4,定义模型在这一步我们首先要分析自己数据的类型,明白自己要用什么模型来做,然后我们就可以在sklearn中定义模型了,sklearn为所有模型提供了非常相似的接口,这样使得我们可以更加快速的熟悉所有模型的用法,在这之前,我们先来看看模型的常用属性和功能。# 拟合模型model.fit(X_train, y_train)# 模型预测model.predict(X_test) # 获得这个模型的参数model.get_params()# 为模型进行打分model.score(data_X,原创 2020-08-31 17:15:32 · 1074 阅读 · 0 评论 -
(1-5)从(1-2)和(1-3)提取出来的文件的读取
机器学习之文件的读取本文章提取自文档一文档二1.知识补充机器学习中,读取文件后要把读取到的内容存储在两个列表里(特征文件列表X和状态文件列表y),特征文件列表必须是多行一列,状态文件列表必须是多列一行,而且都要求是np.array类型的即X是下面这样式的:[[1000] [[8.32 5.36 3.69 ...] [ 792] 或 [9.65 2.35 7.86...] [1260] [4.56 1.32 7.89...原创 2020-08-29 16:51:07 · 287 阅读 · 0 评论 -
(1-6)从(1-2)和(1-3)提取出来的文件的读取
本文章提取自文档1例题一一共有A、B、C、D、E 5个人的运动数据,每个人的数据有41列若干行,即41个特征值,每一个特征值代表一个人的此时的体温、此时的加速度、一个人所处环境磁场的数据等等,根据这些特征值可以预测这个人此时的运动状态(跑步,骑行,还是蹲着)。这五个人的数据存储在featurePaths里面, featurePaths= [‘A/A.feature’,‘B/B.feature’,‘C/C.feature’,‘D/D.feature’,‘E/E.feature’]这五个人的运动状态存原创 2020-08-28 15:43:30 · 262 阅读 · 0 评论 -
(1-7)sklearn库的补充---如何生成数据?
1.2 创建数据集我们除了可以使用sklearn自带的数据集,还可以自己去创建训练样本,具体用法可以参考: https://scikit-learn.org/stable/datasets/1.2.1 生成回归数据 make_regression()from sklearn.datasets import make_regressionX, y, coef = make_regression(n_samples=200, n_features=1, n_informative=1, n_tar原创 2020-08-30 11:43:40 · 1033 阅读 · 0 评论 -
(2)机器学习的实际应用
运用了机器学习分析1.企业欺诈识别(本节内容的数据见电脑F:/python数据/audit_risk 或腾讯微云文件”python数据\audit_risk “)最后一列是预测列,预测是否存在风险;前面的列是特征列。我们要把特征列和预测列单独分开。第一步先阅读数据第二步:数据预处理我们要把非数值型数据处理为数值型第三步:模型划分(把数据划分为特征列和预测列,最后一列是预测列,预测是否存在风险;前面的列是特征列。)import pandas as pdframe=pd.read_c原创 2020-08-19 18:57:47 · 611 阅读 · 0 评论