![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习实战学习笔记
SilenceHell
学生,希望能在csdn上学到知识。
展开
-
聚类效果评判标准之轮廓系数
链接:https://blog.csdn.net/u012967763/article/details/79149703转载 2019-02-21 09:33:32 · 4530 阅读 · 0 评论 -
Python中的三引号''' '''的用法
链接:https://blog.csdn.net/GreenHandCGL/article/details/79703863转载 2019-02-20 10:59:42 · 22022 阅读 · 0 评论 -
plt.fill_between对图像进行填充
链接:https://www.cnblogs.com/gengyi/p/9416845.html转载 2019-02-20 10:54:19 · 1912 阅读 · 0 评论 -
PYthon——plt.scatter
链接:https://blog.csdn.net/qiu931110/article/details/68130199转载 2019-02-20 10:47:50 · 381 阅读 · 0 评论 -
from sklearn.datasets.samples_generator import make_blobs
链接:https://blog.csdn.net/kevinelstri/article/details/52622960转载 2019-02-20 10:39:44 · 3211 阅读 · 0 评论 -
KFold,StratifiedKFold k折交叉切分
转载于:https://blog.csdn.net/wqh_jingsong/article/details/77896449 StratifiedKFold用法类似Kfold,但是他是分层采样,确保训练集,测试集中各类别样本的比例与原始数据集中相同。例子:import numpy as np from sklearn.model_select...转载 2019-02-22 12:47:08 · 692 阅读 · 0 评论 -
对pandas中Series的map函数简介
地址放在这里方便以后查找:https://www.jb51.net/article/144399.htm转载 2019-02-03 22:14:28 · 1030 阅读 · 0 评论 -
python groupby()的使用
https://blog.csdn.net/qq_32618817/article/details/80587228转载 2019-01-16 10:56:00 · 1652 阅读 · 0 评论 -
利用线型模型对数据进行分类的步骤
1.对原始数据进行处理,将其处理成能够利用算法进行计算的模式。2.选取不同的线型模型对数据进行处理。3.对模型进行调参,尽可能得到比较好的结果。4.如果还是得不到满意的结果则对数据进行进一步的处理,比如相加相减,提取出新的特征,然后再利用模型进行处理。5.如果还得不到想要的结果,则利用集成算法进行处理,将多个算法的结果合成在进行处理计算。...原创 2018-12-28 12:00:24 · 536 阅读 · 0 评论 -
决策树剪枝策略
更常用的是预剪枝:限制深度:限制树的高度。限制叶子节点个数。叶子节点样本数:每个叶子节点里面的样本数。信息增益:设置信息增益阈值。后剪枝:C(T)=熵值*叶子节点里面的样本数,∣Tleaf∣|T_{leaf}|∣Tleaf∣剪枝候选人下面的叶子个数。...原创 2018-11-19 20:03:42 · 750 阅读 · 0 评论 -
sklearn.feature_selection讲解
class sklearn.feature_selection.SelectKBest(score_func=, k=10)作用:Select features according to the k highest scores选出分数最高的k个特征Parameters:score_func : callableFunction taking two arrays X and y, an...原创 2018-11-22 14:26:47 · 1683 阅读 · 0 评论 -
np.meshgrid的作用
链接:https://blog.csdn.net/dss875914213/article/details/82793314转载 2019-02-20 11:09:33 · 624 阅读 · 0 评论 -
python matplotlib contour画等高线图
链接:https://blog.csdn.net/Mr_Cat123/article/details/80677525转载 2019-02-20 12:55:20 · 1957 阅读 · 0 评论 -
pandas库scatter_matrix绘图可视化参数详解
https://blog.csdn.net/wangxingfan316/article/details/80033557转载 2019-02-21 09:27:54 · 1141 阅读 · 0 评论 -
matplot绘制3D图
#加入了新的维度rfrom mpl_toolkits import mplot3dr = np.exp(-(X ** 2).sum(1))def plot_3D(elev=30, azim=30, X=X, y=y): ax = plt.subplot(projection='3d') ax.scatter3D(X[:, 0], X[:, 1], r, c=y, s=50, ...原创 2019-02-20 13:45:35 · 548 阅读 · 0 评论 -
sklearn.datasets.make_circle()
链接:https://blog.csdn.net/qq_30339595/article/details/79218628补充一点: factor参数为内圆和外圆的半径比。转载 2019-02-20 13:26:06 · 660 阅读 · 0 评论 -
python zip()函数
链接:http://www.runoob.com/python/python-func-zip.html转载 2019-02-20 13:17:39 · 95 阅读 · 0 评论 -
skleaen中SVM的简单使用
from sklearn.svm import SVC # "Support vector classifier"model = SVC(kernel='linear')model.fit(X, y)def plot_svc_decision_function(model, ax=None, plot_support=True): """Plot the decision func...原创 2019-02-20 13:16:38 · 337 阅读 · 0 评论 -
sklearn.model_selection.cross_val_score
sklearn.model_selection.cross_val_score(estimator, X, y=None, groups=None, scoring=None, cv=’warn’, n_jobs=None, verbose=0, fit_params=None, pre_dispatch=‘2*n_jobs’, error_score=’raise-deprecating’)作...原创 2018-11-21 18:11:51 · 1084 阅读 · 0 评论 -
高斯混合模型
由于转载有问题,所以这里只贴链接,希望原作者不会删除吧。链接:https://blog.csdn.net/jinping_shi/article/details/59613054转载 2018-11-15 11:05:03 · 133 阅读 · 0 评论 -
线型回归模型LinearRegression
class sklearn.linear_model.LinearRegression(fit_intercept=True, normalize=False, copy_X=True, n_jobs=None)Parameters:fit_intercept : boolean, optional, default Truewhether to calculate the intercep...原创 2018-11-21 16:54:12 · 416 阅读 · 0 评论 -
recall和precise的区别
本文转载于:http://www.cnblogs.com/cnkai/p/7755141.html注:本文是人工智能研究网的学习笔记Precision和Recall都能够从下面的TP,TN,FP,FN里面计算出来。几个缩写的含义:缩写含义Pcondition positiveNcondition negativeTPtrue positive (with...转载 2018-11-14 20:36:58 · 1900 阅读 · 0 评论 -
LogisticRegression函数
转载于:https://blog.csdn.net/jark_/article/details/78342644 LogisticRegression,一共有14个参数: 逻辑回归参数详细说明参数说明如下:penalty:惩罚项,str类型,可选参数为l1和l2,默认为l2。用于指定惩罚项中使用的规范。newton-cg、sag和lbfgs求...转载 2018-11-14 20:01:22 · 2584 阅读 · 0 评论 -
enumerate()函数
转载于:https://www.cnblogs.com/yizhenfeng/p/7596113.html结合实例来理解比较好,网上找了一下这个enumerate用法,自己也记录一下加深印象看一下相关链接:链接1:http://www.cnblogs.com/danielStudy/p/6576040.html链接2:http://blog.csdn.net/churximi/articl...转载 2018-11-14 19:57:06 · 1390 阅读 · 0 评论 -
KFold
转载于:https://blog.csdn.net/kancy110/article/details/74910185/K折交叉验证:sklearn.model_selection.KFold(n_splits=3, shuffle=False, random_state=None)思路:将训练/测试数据集划分n_splits个互斥子集,每次用其中一个子集当作验证集,剩下的n_splits-...转载 2018-11-14 19:27:59 · 5857 阅读 · 0 评论 -
plt.imshow()
转载于:https://blog.csdn.net/Eastmount/article/details/73392106?locationNum=3&fps=1 版权声明:本文为博主原创文章,转载请注明CSDN博客源地址!共同学习,一起进步~ https://blog.csdn.net/Eastmount/article/details/7339210...转载 2018-11-15 21:25:00 · 50921 阅读 · 5 评论 -
np.set_printoptions
转载于:https://blog.csdn.net/nockinonheavensdoor/article/details/80328074 作用:确定浮点数字、数组、和numpy对象的显示形式。 例子:#精度为小数点后4位np.set_printoptions(precision=4)print(np.array([1.123456789...转载 2018-11-15 21:10:28 · 848 阅读 · 0 评论 -
sklearn.metrics.confusion_matrix
转载于:https://blog.csdn.net/m0_38061927/article/details/77198990 关于混淆矩阵的概念,可参考此篇博文混淆矩阵1.混淆矩阵 混淆矩阵是机器学习中总结分类模型预测结果的情形分析表,以矩阵形式将数据集中的记录按照真实的类别与分类模型作出的分类判断两个标准进行汇总。这个名字来源于它可以非常容易的...转载 2018-11-15 21:05:36 · 1381 阅读 · 0 评论 -
sklearn.model_selection.train_test_split
转载于:https://www.cnblogs.com/bonelee/p/8036024.htmlsklearn的train_test_split train_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签。格式:X_train,X_test, y_train, y_test =cross_validatio...转载 2018-11-15 20:30:48 · 153 阅读 · 0 评论 -
ICA(独立成分分析)(2)
转载于:https://blog.csdn.net/u012421852/article/details/80500940 版权声明:本文为博主原创文章,未经博主允许不得转载,转载请注明文章来源,联系方式:vipsummer@139.com https://blog.csdn.net/u012421852/article/details/80500940 ...转载 2018-11-15 15:57:40 · 12699 阅读 · 1 评论 -
ICA(独立成分分析)(1)
转载于:https://blog.csdn.net/u012421852/article/details/80500891 版权声明:本文为博主原创文章,未经博主允许不得转载,转载请注明文章来源,联系方式:vipsummer@139.com https://blog.csdn.net/u012421852/article/details/80500891 ...转载 2018-11-15 15:08:38 · 1045 阅读 · 0 评论 -
sklearn.datasets
from sklearn.datasets.california_housing import fetch_california_housinghousing = fetch_california_housing()type(housing)Out[21]:sklearn.utils.Bunchtype(housing.data)Out[23]:numpy.ndarrayhousing...原创 2018-11-20 17:12:28 · 906 阅读 · 1 评论 -
tree.DecisionTreeRegressor
from sklearn import treedtr=tree.DecisionTreeRegressor(max_depth=2)dtr.fit(housing.data[:,[6,7]],housing.target)Out[19]:DecisionTreeRegressor(criterion='mse', max_depth=2, max_features=None, ...原创 2018-11-20 17:14:28 · 1217 阅读 · 1 评论 -
集成学习
集成学习有三类Bagging,Boosting,Stacking。1.Bagging并行学习一系列的弱学习器(实验证明以树模型作为弱学习器比较好)。要想集成的结果比较好,不同的弱学习器差异越大越好(这个在机器学习技法笔记上有详细的推导)。为了体现差异性,一般采取数据采样随机,特征选择随机。当然还有很多其他的方法使随机性得到体现。1.由于我们随机选择特征,所以特征多不是我们的问题。2...原创 2018-11-21 16:11:35 · 159 阅读 · 0 评论 -
imblearn.over_sampling.SMOTE
oversampler=SMOTE(random_state=0)random_state:指定SMOTE算法选定种子时是否随机。就是以上公式的xix_ixi是否随机选取。以上函数只是定义了一个类,真实实现功能的是其类函数:oversampler.fit_sample(features_train,labels_train)features_train:特征集labels_trai...原创 2018-11-16 16:42:56 · 4519 阅读 · 0 评论 -
类别不平衡值过采样方法之
链接:https://www.cnblogs.com/Determined22/p/5772538.html转载出现问题,贴链接,祈祷作者不要删除。转载 2018-11-16 16:27:44 · 591 阅读 · 0 评论 -
predict_proba
转载于:https://blog.csdn.net/m0_37870649/article/details/79549142predict_proba返回的是一个 n 行 k 列的数组, 第 i 行 第 j 列上的数值是模型预测 第 i 个预测样本为某个标签的概率,并且每一行的概率和为1。# conding :utf-8 from sklearn.linear_model import L...转载 2018-11-16 15:59:55 · 1346 阅读 · 1 评论 -
plt.tight_layout()
tight_layout会自动调整子图参数,使之填充整个图像区域。这是个实验特性,可能在一些情况下不工作。它仅仅检查坐标轴标签、刻度标签以及标题的部分。使用之前:使用之后:参考:https://www.jianshu.com/p/91eb0d616adb...原创 2018-11-16 15:12:19 · 79419 阅读 · 2 评论 -
itertools.product
转载于:https://blog.csdn.net/qq_33528613/article/details/79365291 版权声明:本文为博主原创文章,可以转载,但转载前请联系博主。 https://blog.csdn.net/qq_33528613/article/details/79365291 ...转载 2018-11-16 15:06:20 · 138 阅读 · 0 评论 -
plt.test()
plt.text(0,0,“test”, horizontalalignment=“center”, color=“green” )其中:第一个0代表坐标轴x的位置第二个0代表坐标轴y的位置test是我们要显示的字符串center代表对其方式居中对其color代表显示的演示我们将坐标修改为(0.5,1)显示结果如下:...原创 2018-11-16 14:53:25 · 1469 阅读 · 0 评论