![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
小白拉普拉斯
这个作者很懒,什么都没留下…
展开
-
“三步法”阅读文献
“三步法”来阅读文献让你深深受益,一方面,使你对文献有全盘的理解,而不是淹没在细节当中;另一方面,由于每一步都有大致的时间预判,可以让你评估审阅一堆论文时需要花费的时间,也可以根据自己的需要和时间来调整对文献的理解深度。“三步法”的主要思想就是应该在三步内读完论文,而不是从一开始就不分轻重地苦读到最后。清楚自己为什么读这篇文献,始终不忘初心。不要陷入细节中,花费大量的时间精力,读完却发现对自己...原创 2019-10-12 19:09:52 · 416 阅读 · 0 评论 -
朴素贝叶斯实例(肿瘤良性与恶性)【机器学习算法一朴素贝叶斯5】
import matplotlib.pyplot as pltimport numpy as np#导入肿瘤数据集from sklearn.datasets import load_breast_cancercancer=load_breast_cancer()print("=======================数据集信息====================")print...原创 2019-07-19 15:14:52 · 1980 阅读 · 0 评论 -
线性回归【机器学习算法一广义线性模型2】
【线性回归原理】找到当前训练数据集中y的预测值和其真实值的平方差最小的时候,所对应的w值和b值。#导入数据集拆分工具from sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LinearRegressionfrom sklearn.datasets import make_r...原创 2019-07-17 15:34:41 · 259 阅读 · 0 评论 -
决策树【机器学习算法一决策树与随机森林1】
numpy.meshgrid用法(懂的可略过此部分)numpy.meshgrid(x, y)从两个坐标向量返回坐标矩阵参数x, y : ndarray,两个一维数组表示网格的x和y坐标返回值X, Y : ndarray,对于长度为Nx=len(x)和Ny=len(y)的向量x、y,返回X、Y,其中X和Y是(Ny, Nx)形状的数组,其中x和y的元素重复出现,以沿着x...原创 2019-07-19 17:44:11 · 341 阅读 · 0 评论 -
岭回归【机器学习算法一广义线性模型3】
【岭回归原理】为避免过拟合,岭回归模型保留所有特征变量,但是会减小特征变量系数值(通过改变alpha参数来控制减小特征变量系数的程度),让特征变量对预测结果的影响变小。其实是L2正则化。其泛化能力较好。scikit-learn中调用函数sklearn.linear_model.Ridge来实现岭回归。#导入数据集拆分工具from sklearn.model_selection import t...原创 2019-07-17 17:22:19 · 402 阅读 · 0 评论 -
套索回归lasso【机器学习算法一广义线性模型4】
【原理】将系数限制在非常接近0的范围内,使用L1正则化,有一部分特征的系数为0。有一些特征被模型忽略掉,可突出体现模型中重要的那些特征。#导入数据集拆分工具from sklearn.model_selection import train_test_split#使用含噪声的数据from sklearn.datasets import load_diabetes#糖尿病数据集X,y=loa...原创 2019-07-17 19:30:20 · 837 阅读 · 0 评论 -
随机森林【机器学习算法一决策树与随机森林2】
为避免决策树的过拟合问题,可以使用集合学习的方法。集合学习算法综合多个机器学习算法,从而制造一个更加大的模型。目前应用广泛的包括随机森林(Random Forests)和梯度上升决策树(Gradient Boosted Decision Trees,GBDT)。随机森林就是把参数不同的几棵决策树打包到一起,把每棵树预测结果取平均值,既保留决策树们的工作成效,又降低过拟合的风险。#导入随机森林模型...原创 2019-07-20 14:34:44 · 267 阅读 · 0 评论 -
决策树实例(工资预测)【机器学习算法一决策树与随机森林3】
数据集adult.data下载地址:http://archive.ics.uci.edu/ml/machine-learning-databases/adult/,下载后将其重命名为adult.csv,打开后可看到如下样子。数据集描述如下:属性如下:#导入pandas库import pandas as pd#用pandas打开csv文件data=pd.read_csv('C:/U...原创 2019-07-20 15:43:44 · 3806 阅读 · 2 评论 -
Python3导入自定义模块的三种方法详解
Python3导入自定义模块的三种方法详解原创 2019-08-30 11:36:30 · 248 阅读 · 0 评论 -
支持向量机SVM【机器学习算法一线性内核vs高斯内核】
import numpy as npimport matplotlib.pyplot as pltfrom sklearn import svmfrom sklearn.datasets import make_blobs#先创建50个数据点,让它们分为两类X,y=make_blobs(n_samples=50,centers=2,random_state=6)#创建一个线性内核的支...原创 2019-09-21 22:37:00 · 733 阅读 · 0 评论 -
线性模型基础【机器学习算法一广义线性模型1】
1.画直线y=0.5*x+3import numpy as npimport matplotlib.pyplot as plt#令x为-5到5之间,元素数为100的等差数列x=np.linspace(-5,5,100)y=0.5*x+3plt.plot(x,y,c='orange')plt.title('Straight Line')plt.show()2.根据两点拟合直线...原创 2019-07-16 20:51:31 · 567 阅读 · 0 评论 -
多项式朴素贝叶斯【机器学习算法一朴素贝叶斯4】
import numpy as npfrom sklearn.naive_bayes import MultinomialNB#导入数据集生成工具from sklearn.datasets import make_blobs#导入数据集拆分工具from sklearn.model_selection import train_test_splitX,y=make_blobs(n_sam...原创 2019-07-18 16:56:27 · 905 阅读 · 0 评论 -
numpy 数组元素访问详解
1. 代码import numpy as npX = np.array([[0,1,2],[3,4,5],[6,7,8],[9,10,11],[12,13,14],[15,16,17],[18,19,20]])print(X)print("\n")print(X[:,1])#输出所有1列元素print(X[1,:])#输出1行元素print(X[1])#输出1行元素print(X[...原创 2019-07-09 11:31:20 · 5266 阅读 · 0 评论 -
KNN分类实例(二元分类)【机器学习算法一KNN1】
1.代码from sklearn.datasets import make_blobsfrom sklearn.neighbors import KNeighborsClassifierimport matplotlib.pyplot as pltimport numpy as npdata = make_blobs(n_samples=200, centers =2,random_s...原创 2019-07-09 14:15:05 · 1504 阅读 · 0 评论 -
拉格朗日乘数法
拉格朗日乘数法更一般的情形原创 2019-07-09 16:54:22 · 597 阅读 · 0 评论 -
KNN多元分类【机器学习算法一KNN2】
1. 代码from sklearn.datasets import make_blobsfrom sklearn.neighbors import KNeighborsClassifierimport matplotlib.pyplot as pltimport numpy as npdata2 = make_blobs(n_samples=500, centers=5,random_...原创 2019-07-09 20:10:31 · 1127 阅读 · 0 评论 -
KNN回归分析【机器学习算法一KNN3】
1. 代码import matplotlib.pyplot as pltimport numpy as npfrom sklearn.datasets import make_regressionX, y = make_regression(n_features=1,n_informative=1,noise=50,random_state=8)plt.scatter(X,y,c='o...原创 2019-07-09 21:20:51 · 491 阅读 · 0 评论 -
KNN算法实例(酒的分类)【机器学习算法一KNN4】
1.代码未画图from sklearn.datasets import load_winewine=load_wine()#Bunch对象,包含键和数值print("=========================================")print("红酒数据集中的键:\n{}".format(wine.keys()))print("数据概况:{}".format(...原创 2019-07-10 16:46:12 · 4999 阅读 · 0 评论 -
朴素贝叶斯基础【机器学习算法一朴素贝叶斯1】
过去的7天当中,有3天下雨,4天没有下雨。用0代表灭有下雨,而1代表下雨,我们可以用一个数组来表示:y=[0,1,1,0,1,0,0]而在这7天当中,还有另外一些信息,包括刮北风,闷热,多云,以及天气预报给出的信息,如下表:对于一维数组或者列表,unique函数去除其中重复的元素,并按元素由大到小返回一个新的无重复元素的元组或者列表。...原创 2019-07-18 15:33:07 · 568 阅读 · 0 评论 -
伯努利朴素贝叶斯【机器学习算法一朴素贝叶斯2】
伯努利朴素贝叶斯方法适合于伯努利分布(即二项分布或0-1分布)的数据集。import numpy as npfrom sklearn.naive_bayes import BernoulliNB#导入数据集生成工具from sklearn.datasets import make_blobs#导入数据集拆分工具from sklearn.model_selection import tr...原创 2019-07-18 16:31:56 · 1208 阅读 · 0 评论 -
高斯朴素贝叶斯【机器学习算法一朴素贝叶斯3】
假设样本的特征符合高斯分布(正态分布)。import numpy as npfrom sklearn.naive_bayes import GaussianNB#导入数据集生成工具from sklearn.datasets import make_blobs#导入数据集拆分工具from sklearn.model_selection import train_test_splitX,...原创 2019-07-18 16:42:51 · 357 阅读 · 0 评论 -
Python生成已分类数据集
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Ma...原创 2019-07-08 21:31:48 · 2104 阅读 · 0 评论