xingchengmeng-CSDN博客

原创 scikit-learn 笔记之支持向量机

支持向量机说明支持向量机说明支持向量机是一种经典的分类算法，其原理是找到一条决策边界使其距离两个最近的不同类别的点最远。对于线性可分的数据集，可以使用线性分类器进行分类，对于线性不可分函数，需要将数据集尝试通过函数变换映射到高维空间，利用核函数替代内积，求解最优α\alphaα ，随后求出权重www和截距bbb，最终求得决策边界。支持向量机在scikit-learn中SVC实现了支持向量机模型，可以用于二分类也可以用于多分类，支持线性和非线性，是比较常用到，对于大数据量的样本并不实用，并其原

2021-04-11 20:21:48 617

原创笔记之支持向量机及python实现

支持向量机算法1 概述2 算法特点1 概述支持向量机（support vector machines,SVM）主要作为一种二分类模型。它的强大之处在于既可以用作线性分类器又可以作为非线性分类器。2 算法特点优点：泛化错误率低，计算开销不大，结果容易解释。缺点：对参数调节和核函数的选择敏感，原始分类器不加修改仅适用于二分类问题。适用数据类型：数值型和标称型数据。...

2021-04-11 20:20:28 716

原创 scikit-learn 笔记之逻辑回归

逻辑回归说明逻辑回归总结说明逻辑回归（logistic regression）虽然名字里包含的是回归，但却是统计学习中的经典分类算法。因为算法比较简单和经典，一般在比赛分类任务（特别二分类任务）中使用逻辑回归模型作baseline，另外因为逻辑回归的可解释性，一般金融行业中比较青睐。逻辑回归在scikit-learn中LogisticRegression实现了逻辑回归模型，其原型为：class sklearn.linear_model.LogisticRegression(penalty=

2021-04-11 20:19:06 559

原创笔记之逻辑回归及python实现

逻辑回归算法

2021-04-11 20:17:14 329

原创 scikit-learn 笔记之贝叶斯

贝叶斯算法1 高斯贝叶斯分类器（GaussianNB）2 伯努力贝叶斯分类器（BernoulliNB）在scikit中有多种不同的朴素贝叶斯分类器，它们的区别在于假设了不同的P(X(j)∣y=ck)P(X^{(j)}|y=c_{k})P(X(j)∣y=ck)分布，下面介绍三种常用的朴素贝叶斯分类器。1 高斯贝叶斯分类器（GaussianNB） GaussianNB是高斯贝叶斯分类器，它假设特征条件概率分布满足高斯分布：P(X(j)∣y=ck)=12πσk2exp(−(x(j)−μk)22σk

2021-04-11 20:15:03 539

原创笔记之朴素贝叶斯及python实现

朴素贝叶斯算法1 概述2 算法特点3 算法原理3.1 贝叶斯定理3.1 朴素贝叶斯4 朴素贝叶斯学习与分类1 概述朴素贝叶斯（naive Bayes）法是基于贝叶斯定理与特征条件独立假设的分类方法。2 算法特点优点：在数据较少的情况下仍然有效，可以处理多分类别问题。缺点：对于输入数据的准备方式较为敏感，用于分类的特征之间要求是独立的。适用数据类型：标称型。3 算法原理对于给定的训练数据集，首先基于特征条件独立假设学习输入输出的联合概率分布，然后基于此模型，对给定的输入xxx，

2021-04-11 20:13:00 201

原创 scikit-learn笔记之决策树

决策树算法说明KNeighborsClassifier分类KNeighborsRegressor回归总结说明在scikit-learn中提供了两类决策树，一个DecisionTreeClassifier类来实现k近邻法分类模型，一个DecisionTreeRegressor类来实k近邻法回归模型。KNeighborsClassifier分类KNeighborsClassifier是分类模型，其原型为class sklearn.tree.DecisionTreeClassifier(*, cri

2021-04-11 20:11:10 387

原创笔记之决策树及python实现

1 概述决策树是一种基本的分类与回归方法。这里主要讨论用于分类的决策树。2 算法特点优点：计算复杂度不高，输出结果易于理解，对中间值的确实不敏感。可以处理不相关特征数据。缺点：可能会产生过度匹配问题。适用数据类型：数值型和标称型。3 算法原理...

2021-04-11 20:04:41 64

原创 scikit-learn 笔记之KNN(K近邻算法)

说明在scikit-learn中提供了一个KNeighborsClassifier类来实现k近邻法分类模型，一个KNeighborsRegressor类来实k近邻法回归模型。KNeighborsClassifier分类KNeighborsClassifier是分类模型，其原型为class sklearn.neighbors.KNeighborsRegressor(n_neighbors=5, *, weights='uniform', algorithm='auto', leaf_size=3

2021-04-11 20:01:56 1077

原创笔记之K-近邻算法及python实现

K-近邻算法主要用于处理分类问题，采用测量不同特征之间的距离进行分类。算法原理给定一个训练数据集，对新的输入实例，在训练数据集中找到与该实力最近邻的k个实例，这k个实例的多数属于某个类，就把该输入实例划分为这个类。算法特点优点精度高、对异常值不敏感、无数据输入假定缺点计算复杂度高、空间复杂度高适用数据范围数值型和标称型建立模型三要素距离度量k值的选择分类决...

2021-04-11 19:57:51 221

转载从贝叶斯方法谈到贝叶斯网络

0 引言事实上，介绍贝叶斯定理、贝叶斯方法、贝叶斯推断的资料、书籍不少，比如《数理统计学简史》，以及《统计决策论及贝叶斯分析 James O.Berger著》等等，然介绍贝叶斯网络的中文资料则非常少，中文书籍总共也没几本，有的多是英文资料，但初学者一上来就扔给他一堆英文论文，因无基础和语言的障碍而读得异常吃力导致无法继续读下去则是非常可惜的（当然，有了一定的基础后，便可阅读更多的...

2019-07-04 16:33:56 577

转载 Hive函数大全

原文地址：http://www.cnblogs.com/MOBIN/p/5618747.html#1数学函数 Return Type Name (Signature) Description DOUBLE round(DOUBLE a) Returns the rounded...

2019-05-10 17:39:36 324

原创 Win10 64位用Anaconda安装Tensorflow，CPU安装无安装CUDA

一、安装Anaconda安装Anaconda，我下载的是Anaconda3-5.2.0-Windows-x86_64.exe 下载地址：https://www.continuum.io/downloads/ 清华数据源：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 默认安装就...

2018-10-19 14:51:03 548 1

原创运行hive报错java.net.URISyntaxException

报错信息Exception in thread "main" java.lang.IllegalArgumentException: java.net.URISyntaxException: Relative path in absolute URI: ${system:java.io.tmpdir%7D/$%7Bhive.session.id%7D_resources解决办法打开hive...

2018-10-01 11:25:16 1634

原创虚拟机安装完CentOS 7后安装VMware Tools 及报错处理

1、点击安装VMware Tools，会在桌面出现一个VMware Tools文件夹。2、进入到VMware Tools文件所在目录，并将文件拷贝到指定路径下目的为了方便对文件操作，我的路径是 /home/localhost02/ cd /run/media/localhost02cp -Rf VMware\ Tools/ /home/localhost02/3、进入...

2018-09-27 10:53:07 2228

转载虚拟机下安装CentOS 7.4教程

转载地址：https://blog.csdn.net/qq_32786873/article/details/78726236一、首先安装虚拟机VMware，安装过程见：http://blog.csdn.net/qq_32786873/article/details/78725247 二、下载CentOS 7.4 ISO镜像：下载地址：http://www.centoscn.com...

2018-09-26 18:05:09 2657

原创 yum安装时出现Existing lock /var/run/yum.pid: another copy is running as pid 2922.错误

执行yum安装命令式报如下错误，解决办法通过强制关掉yum进程。Loaded plugins: fastestmirror, refresh-packagekit, securityExisting lock /var/run/yum.pid: another copy is running as pid 2922.Another app is currently holding the ...

2018-09-14 17:13:36 1214

转载 Cannot retrieve metalink for repository: epel…错误解决办法

centos下执行 yum -y install epel-release，安装epel源然后更新一下yum缓存，发生这样的错误:Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again这就表明你需要更新CA证书了，那么只需要更新CA证书就可以，不过在此同时需要临时...

2018-09-14 17:02:43 861

原创 VIM 使用快捷键

这是一位前辈总结的，现分享出来。# 关于Vimvim是我最喜欢的编辑器，也是Linux下第二强大的编辑器。虽然emacs是公认的世界第一，我认为使用emacs并没有使用vi进行编辑来得高效。如果是初学vi，运行一下vimtutor是个聪明的决定。（如果你的系统环境不是中文，而你想使用中文的vimtutor，就运行vimtutor zh）## Vim的几种模式- 正常模式：可以使用...

2018-08-19 22:43:29 293

原创启动tomcat，报错 Error occurred during initialization of VM Could not reserve enough space for object

启动tomcat时，鼠标双击startup.bat出现闪退现象，出现运行错误，localhost:8080网页自然也无法打开。1、可以在编辑startup.bat,在其末尾加入一行，目的为了查看运行报错的信息。为了更加详细的看到信息，我们再来更改一句：找到call "%EXECUTABLE%" run %CMD_LINE_ARGS% 把里面的start替换为run。pause2...

2018-08-19 21:10:16 64521 2

原创运行报错：Specified VM install not found: type Standard VM

右键点击要运行的Ant文件，打开 Run As >External Tools Configuration，选择红色区域按钮，保存后重新运行。

2018-08-13 17:17:10 645

转载 python: set()函数

python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算. sets 支持 x in set, len(set),和 for x in set。作为一个无序的集合，sets不记录元素位置

2017-03-27 10:32:23 1105

原创 python: extend(),append(),insert()

三者皆可添加元素建立两个list a,bappend()接受一个对象参数，把对象添加到列表的尾部>>> a[1, 2, 3]>>> b[4, 5, 6]>>> a.append(77)>>> a[1, 2, 3, 77]>>> a.append('good')>>> a[1, 2, 3, 77, 'good']>>> a[1, 2, 3

2017-03-24 16:22:30 627

原创 python :数组a[index,:]

举例说明建立一个全零的数组>>> a = zeros((2,3))>>> aarray([[ 0., 0., 0.], [ 0., 0., 0.]])数组a[index,:], index 数组的索引值，：切片符 ,a [:] 可以复制一个list a>>> b = [1,2,3,4] #建立list b>>> c = [5,6,7,8] # 建立lis

2017-03-23 11:26:44 4086

原创 python: min 和 max 函数

对于元组max(tuple)返回元组中元素最大值。min(tuple)返回元组中元素最小值。cmp(tuple1,tuple2)比较两个元组元素。tuple(seq)将列表转换为元组。>>> min(1,2,3)1>>> max(1,2,3)3对于二维数组>>> a = array([[1,2,3],[0,0,0],[-1,-2,-3],[2

2017-03-22 16:31:08 10906

转载【数字的可视化：python画图之散点图sactter函数详解】

原文地址 http://blog.csdn.net/u013634684/article/details/496463111、scatter函数原型2、其中散点的形状参数marker如下：3、其中颜色参数c如下:4、基本的使用方法如下：[python] view plain copy #导入必要的模块 import numpy

2017-03-22 15:07:22 1615

转载 python: Matplotlib 教程

Matplotlib 教程本文为译文，原文载于此，译文原载于此。本文欢迎转载，但请保留本段文字，尊重作者和译者的权益。谢谢。: )介绍Matplotlib 可能是 Python 2D-绘图领域使用最广泛的套件。它能让使用者很轻松地将数据图形化，并且提供多样化的输出格式。这里将会探索 matplotlib 的常见用法。IPython 以及 pylab 模式IPytho

2017-03-22 12:03:24 706 1

原创 python: matplotlib-绘制精美的图表

学习地址：http://old.sebug.net/paper/books/scipydoc/matplotlib_intro.html#matplotlib

2017-03-22 10:34:10 1752

原创 python: strip()函数

函数原型声明：s为字符串，rm为要删除的字符序列s.strip(rm) 删除s字符串中开头、结尾处，位于 rm删除序列的字符s.lstrip(rm) 删除s字符串中开头处，位于 rm删除序列的字符s.rstrip(rm) 删除s字符串中结尾处，位于 rm删除序列的字符举例说明rm为空时，默认删除空白符（包括'\n', '\r', '\t

2017-03-21 16:28:51 3902

原创 python: numpy -- zeros,ones,eyes函数

zeros():可以用来构造全零矩阵>>> zeros(3)array([ 0., 0., 0.])>>> zeros((3,3))array([[ 0., 0., 0.], [ 0., 0., 0.], [ 0., 0., 0.]])ones(): 可以用来构造全一矩阵>>> ones((3,3))array([[ 1., 1.,

2017-03-21 15:52:32 25729

原创 python: dict.get()方法

dict.get() 函数基本构造get(...) D.get(k[,d]) -> D[k] if k in D, else d. d defaults to None.举例说明如果输入的key 在dict中，会返回其对应的key值，否则会返回一个定义的参数d>>> dict = {'1':'one','2':'two','3':'three'}>>> dict.get(

2017-03-21 11:15:00 10178 2

原创 python : items()和iteritems()函数

items() :在 Python 2.x 里，官方文档里items的方法是这么说明：生成一个 (key, value) 对的list，也就是说以列表方式返回字典中的键值对。iteritems() :它实际上返回的是一个"full sequence-protocol object"，这个对象能够反映出 dict 的变化，iteritems以迭代器对象返回键值对儿viewitems():在

2017-03-21 10:36:49 5108

原创 python： sort和sorted()方法

Python list内置sort()方法用来排序，也可以用python内置的全局sorted()方法来对可迭代的序列排序生成新的序列。sorted语法结构sorted(...) sorted(iterable, cmp=None, key=None, reverse=False) --> new sorted list iterable:为可迭代序列cmp 和 key

2017-03-21 10:05:53 540

原创 python: numpy-- 函数 argsort 用法

argsort() 函数将数组的值从小到大排序后，并按照其相对应的索引值输出举例说明：一维数组>>> a = array([3,1,2])>>> argsort(a)array([1, 2, 0])二维数组>>> b = array([[1,2],[2,3]])>>> argsort(b,axis=1) #按行排序array([[0, 1], [0, 1

2017-03-20 15:00:13 6564

原创 python: sum 函数 --sum(axis=1)

sum函数当加入axis=0 就是每一列相加，当加入axis=1以后就是将一个矩阵的每一行向量相加举例说明：>>> a = [[1,2],[1,3]]>>> print sum(a)7>>> print sum(a,axis=0)[2 5]>>> print sum(a,axis=1)[3 4]

2017-03-20 11:09:30 1080

原创 python: numpy --函数 tile用法

函数格式: tile(A,reps)A : array_like, A的类型众多，几乎所有类型都可以：array, list, tuple, dict, matrix以及基本数据类型int, string, float以及bool类型。reps : array_like, reps的类型也很多，可以是tuple，list, dict, array, int, bool.但不可以是flo

2017-03-17 11:32:34 1695

原创 python: numpy--函数 shape用法

shape函数是numpy.core.fromnumeric中的函数，它的功能是查看矩阵或者数组的维数。举例说明：建立一个3×3的单位矩阵e, e.shape为（3，3），表示3行3列>>> e = eye(3)>>> earray([[ 1., 0., 0.], [ 0., 1., 0.], [ 0., 0., 1.]])>>> e.

2017-03-17 10:39:39 96461 5

原创 caffe 无cuda安装过程及python接口

主要过程稍微记录一下：1.安装BLASsudo apt-get install libatlas-base-dev 2.安装依赖项sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libboost-all-dev libhdf5-serial-dev protobuf-comp

2017-03-15 16:38:15 489

原创 CUDA安装说明文档

文档地址：http://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#axzz4bHZ7fIuV

2017-03-14 15:21:33 632

原创训练和测试自己的图片

1.准备数据下载图片，共有500张图片，分为大巴车、恐龙、大象、鲜花和马五个类，每个类100张。地址：http://pan.baidu.com/s/1nuqlTnN2.转换lmdb格式新建一个文件夹，用来存放配置文件和脚本文件，然后编写一个脚本create_filelist.sh，用来生成train.txt和test.txt清单文件sudo mkdir examples/new

2017-03-14 09:40:33 676

大规模机器学习平台的技术实现.pptx

空空如也