![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Machine Learning
文章平均质量分 86
OliverkingLi
耶耶
展开
-
机器学习实战-使用朴素贝叶斯分类器来做垃圾邮件分类
coding:from numpy import *import redef loadDataSet(): postingList = [['my', ' dog', 'has', 'flea', 'problem', 'help', 'please'], ['maybe', 'not', 'take', 'him', 'to', 'dog'原创 2017-06-18 10:50:34 · 2164 阅读 · 0 评论 -
Iris数据跑回归模型
import numpy as npfrom sklearn.linear_model import LogisticRegressionimport matplotlib.pyplot as pltimport matplotlib as mplfrom sklearn import preprocessingimport pandas as pdfrom sklearn.prepr...原创 2018-06-05 16:37:31 · 952 阅读 · 0 评论 -
sklearn包实现广告数据的线性回归模型
code:import csvimport numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltimport pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import Li...原创 2018-06-05 14:46:11 · 619 阅读 · 0 评论 -
机器学习回归算法拟合多项式
code:import numpy as npfrom sklearn.linear_model import LinearRegression, RidgeCV, LassoCV, ElasticNetCVfrom sklearn.preprocessing import PolynomialFeaturesimport matplotlib.pyplot as pltfrom skle...原创 2018-06-06 09:35:44 · 4120 阅读 · 0 评论 -
决策树分类鸢尾花数据demo
code:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport matplotlib as mplfrom sklearn import treefrom sklearn.tree import DecisionTreeClassifierfrom sklearn.model_selecti...原创 2018-06-06 15:52:00 · 5002 阅读 · 0 评论 -
机器学习中决策树不同树深度对拟合效果的影响demo
code:import numpy as npimport matplotlib.pyplot as pltfrom sklearn.tree import DecisionTreeRegressorif __name__ =='__main__': N = 100 # 获取100个在[-3, 3)之间的数据 x = np.random.rand(N) * 6 - 3 x.sort...原创 2018-06-06 19:20:58 · 3285 阅读 · 0 评论 -
XGBoost实践泰坦尼克号可生还人员预测
联合之前的logistic和random forest:import xgboost as xgbimport numpy as npfrom sklearn.linear_model import LogisticRegressionfrom sklearn.model_selection import train_test_splitfrom sklearn.tree import D...原创 2018-06-07 17:52:04 · 1524 阅读 · 0 评论 -
xgboost实现蘑菇数据分类预测demo
数据集下载:训练集;测试集。import xgboost as xgbimport numpy as np# 自己实现loss function,softmax函数def log_reg(y_hat, y): p = 1.0 / (1.0 + np.exp(-y_hat)) g = p - y.get_label() h = p * (1.0 - p) return g, h# 自...原创 2018-06-07 19:22:16 · 3195 阅读 · 3 评论 -
XGBoost实现对鸢尾花数据集分类预测
code:import xgboost as xgbimport numpy as npimport pandas as pdfrom sklearn.model_selection import train_test_splitif __name__ == '__main__': iris_feature_E = "sepal lenght", "sepal width", "pet...原创 2018-06-07 19:50:45 · 4683 阅读 · 0 评论 -
神经网络梯度下降算法的demo
from sklearn.model_selection import train_test_splitfrom sklearn.metrics import classification_reportfrom sklearn.datasets import make_blobsimport matplotlib.pyplot as pltimport matplotlib as mpl...原创 2018-07-18 16:58:54 · 504 阅读 · 0 评论 -
机器学习KNN算法分类kaggle猫狗
KNN算法思想就不多说了,很简单,基于欧氏距离或者Mahantta距离进行计算,然后投票决定你的类别。这里用三个文件;simplepreprocessor.pyimport cv2class SimplePreprocessor: def __init__(self, width, height, inter=cv2.INTER_AREA): self.width = width s...原创 2018-07-12 17:42:35 · 2653 阅读 · 0 评论 -
机器学习SVM--基于手写字体识别
手写字体optdigits识别:每一行代表一个手写字体图像,最大值为16,大小64,然后最后一列为该图片的标签值。import numpy as npfrom sklearn import svmimport matplotlib.colorsimport matplotlib.pyplot as pltfrom PIL import Imagefrom sklearn.metrics ...原创 2018-06-12 10:46:15 · 9905 阅读 · 1 评论 -
机器学习svm--正确率和召回率以及基于不平衡数据的分类调参
code:import numpy as npfrom sklearn.metrics import accuracy_scorefrom sklearn.metrics import precision_score, recall_score, f1_score, fbeta_scorefrom sklearn.metrics import precision_recall_fscore_...原创 2018-06-12 09:32:55 · 7027 阅读 · 1 评论 -
机器学习--svm算法一些参数调节demo
1.这里生成一些样本点,然后使用svm里面的径向基函数作为核方法,分别使用ovo和ovr方法进行实验:import numpy as npfrom sklearn import svmfrom scipy import statsfrom sklearn.metrics import accuracy_scoreimport matplotlib as mplimport matplot...原创 2018-06-11 19:17:23 · 4972 阅读 · 0 评论 -
机器学习基于K-近邻算法(KNN)
KNN算法原理简介:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输人没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最 近 邻 )的分类标签。一般来说,我们只选择样本数据集中前&个最相似的数据,这就是&-近邻算法中&的出处,通常*是不大于20的整数原创 2017-06-11 12:55:25 · 498 阅读 · 0 评论 -
使用k-means(KNN)算法改进约会网站和手写字系统案例
直接上代码:一:约会from numpy import *import operatorfrom os import listdirimport matplotlibimport matplotlib.pyplot as plt# 距离计算def classify0(inX, dataSet, labels, k): dataSetSize = dataSet.sha原创 2017-06-14 15:59:07 · 529 阅读 · 0 评论 -
机器学习使用决策树
一:简单例子理解决策树概念二:决策树的一般流程三:信息增益划分数据集的大原则是:将无序的数据变得更加有序。我们可以使用多种方法划分数据集,但是每种方法都有各自的优缺点。组织杂乱无章数据的一种方法就是使用信息论度量信息,信息论是量化处理信息的分支科学。我们可以在划分数据之前使用信息论量化度量信息的内容。在划分数据集之前之后信息发生的变化称为信息增益原创 2017-06-15 00:50:03 · 578 阅读 · 0 评论 -
机器学习之决策树实现隐形眼镜预测
代码:from math import logimport operatorimport timeimport pickleimport matplotlib.pyplot as pltdef createDataSet(): dataSet = [[1, 1, 'yes'], [1, 1, 'yes'], [1,原创 2017-06-15 16:14:05 · 716 阅读 · 0 评论 -
Python绘制常见图形
#!/usr/bin/python# -*- coding:utf-8 -*-import numpy as npimport matplotlib as mplfrom mpl_toolkits.mplot3d import Axes3Dfrom matplotlib import cmimport timefrom scipy.optimize import leastsq原创 2018-02-02 11:56:10 · 1686 阅读 · 0 评论 -
python模拟多次采样通过低概率事件多次重复实验趋近必然事件
只接代码演示好了:import operator import numpy as np import matplotlib.pyplot as plt from functools import reduce def cal(n, k): # 返回排列组合的:从总体中选取若干的个体排列组合总数 return reduce(operator.mul,原创 2018-02-02 17:08:50 · 1422 阅读 · 0 评论 -
线性回归算法Python小实现
demo:数据集#!/usr/bin/env python3# -*- coding: utf-8 -*-"""Created on Fri Mar 9 20:05:51 2018@author: lisir"""import csvimport numpy as npimport matplotlib.pyplot as pltimport matplotlib as原创 2018-03-09 22:20:13 · 419 阅读 · 0 评论 -
浅谈SVD原理以及python实现小demo
在线性代数中我们都知道对于一个mxn的矩阵A,假设其中的特征值为k,其对应的特征向量为a。那么有: 上面的a为特征向量,k为对应的特征值。假设由|E-kA| = 0我们一共解的有i个特征值分别为: 对应的特征向量分别为: 对A进行特征值分解可以得到: 这里A是作为方阵的求法。更一般的我们吧这种由特征值分解求A的做法推广到原创 2018-02-02 16:25:00 · 1346 阅读 · 0 评论 -
机器学习算法--SVM分类鸢尾花数据集
code:import numpy as npimport pandas as pdfrom sklearn import svmfrom sklearn.model_selection import train_test_splitimport matplotlib as mplimport matplotlib.pyplot as pltdef iris_type(s): # ...原创 2018-06-11 17:08:51 · 10956 阅读 · 3 评论 -
神经网络实现基本的与或异或逻辑
平时计算机领域的OR AND XOR逻辑问题就不去详说,大家都有学习过。基本的逻辑图如下:最开始神经网络解决线性可分问题给它带来了一次小高峰,但是在几年之后一个学者提出了XOR非线性问题的时候,并且专门写了一篇论文论述神经网络对非线性问题求解的无能为力直接给当年的神经网络的发展带来了寒冰时代。直到十几年后,多层网络的出现,也就是俗称的MLP(Multiply layer percept...原创 2018-07-20 18:10:50 · 11465 阅读 · 3 评论