自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(51)
  • 资源 (3)
  • 问答 (1)
  • 收藏
  • 关注

原创 数据增强之Cutout

数据增强之CutoutCutout介绍分类cutout检测cutoutCutout介绍(内容摘自[CV技术指南],用于自学知识)该方法来源于论文《Improved Regularization of Convolutional Neural Networks with Cutout》在一些人体姿态估计,人脸识别,目标跟踪,行人重识别等任务中常常会出现遮挡的情况,为了提高模型的鲁棒性,提出了使用Cutout数据增强方法。该方法的依据是Cutout能够让CNN更好地利用图像的全局信息,而不是依赖于一小

2021-11-14 23:05:41 3935

原创 spark 集群使用手册

采用浪潮集群搭建Spark的四个节点(cu01,cu02,cu03,cu04),Spark和hadoop已经安装好。使用hadoop 的yarn集群管理器。 1.启动hadoop[wangj@mu01 ~]$ssh cu01 #进入主节点[wangj@controller ~]$ cd /opt/software/hadoop/[wangj@controller

2018-01-05 11:43:48 832

转载 安装numpy+mkl报错的处理办法

转载自:http://www.fkccp.com/archives/2710.html 非常感谢这个大神,我纠结了好久这个问题!Processing c:\users\rao\downloads\numpy-1.11.2+mkl-cp27-cp27m-win32.whl Installing collected packages: numpy Exception: Traceback (mo

2017-12-14 20:56:17 2680 1

原创 The cascade SVM (串联SVM;层级SVM;层叠SVM)

对于标题布置如何翻译较好; 本文翻译自论文:http://download.csdn.net/download/aq_cainiao_aq/10136946parallel support vector machine:the cascade svmcascade svm的提出是通过并行的方式解决svm算法时间和空间占用资源多的缺点,尤其是非线性svm需要较多的支持向量时,数据占用内存多,运行耗时

2017-11-29 15:22:16 2428

转载 如何理解矩阵特征值?

在学习使用PCA方法进行数据降维时,用到了特征值和特征向量知识。 知乎链接,讲的太好了: https://www.zhihu.com/question/21874816因为禁止转载,又想收藏,故采用截图方式保留作者思路。 上面用到了一个数学知识,在求矩阵A的特征值时,用到了: Ax=ax 其中,A是矩阵,a是特征值,x是特征向量。矩阵A的特征值可以有多个,特征值

2017-11-23 10:29:27 1875

转载 浅谈人工智能:现状、任务、构架与统一 | 正本清源

文章作者: 朱松纯 (视觉求索) 一直以来追求机器学习技术上进步,从未更深层次的考虑机器学习的根源。这篇文章值得反复阅读,尤其是对于做研究的学者来说。 摘要: 1.人工智能是学习“乌鸦”的智能,不是“鹦鹉”的智能。 2.大数据训练得到的模型,只能是“种瓜得瓜,得不到豆”;“小数据,大任务范式”下学习到的智能才能“适者生存”。 3.计算机视觉中,可以用深度学习解决的问题,是当前可以从图像中

2017-11-21 11:25:11 1121

翻译 pso-svm 算法实现(1):python DEAP

在之前的文章已经叙述了pso算法的实现,http://blog.csdn.net/AQ_cainiao_AQ/article/details/78448508 接下来解决pso-svm算法的实现。在pso-svm 算法中,参数寻优步骤大概如下:(1)PSO算法寻找适用于SVM模型的核函数类型Step 1:初始化粒子群规模m,设定算法的权重因子,终止条件和初始粒子编码;Step 2:将每个粒子的

2017-11-06 16:04:35 12774

翻译 python DEAP PSO 算法的学习

翻译自:http://deap.readthedocs.io/en/master/examples/pso_basic.html粒子群优化基础这里的实现是基本PSO算法的实现。wikipedia的PSO的定义如下: PSO通过拥有一个种群规模的候选解决方案来优化一个问题,这里的候选解决方案指的是粒子,在解空间中根据简单的数学公式移动这些粒子。粒子的移动被解空间的最优位置引导着,如果粒子发现更好的位

2017-11-05 11:51:29 3961

原创 python 的 DEAP框架学习

学习DEAP框架,找到如下资源: 1.github源码:https://github.com/deap/deap 2.deap文档:http://deap.gel.ulaval.ca/doc/dev/index.html 3.deap初学者中文介绍:https://segmentfault.com/a/1190000004368689 4.一篇介绍deap的文章:http://www.do

2017-11-04 11:40:15 12485

原创 python 安装模块出现问题:UnicodeDecodeError:

1.问题描述UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xbe in position 7: ordinal not in range(128) 在F:\Python\python2.7.11\Scripts目录下(因为pip安装在这个目录下),shift+鼠标右键,打开控制台,输入命令:pip install xlrd需要安装这个

2017-10-27 10:55:39 1058

原创 在集群上搭建搜索引擎的每一步(更新中)

- 2017-09-13 今天想要在实验室的浪潮集群上搭建自己的搜索引擎系统,目前没有完整的计划,hadoop也暂时没有用到,先解决一些基础问题,比如环境,爬虫之类的问题,然后,搭建hadoop平台,用mapreduce来并行处理网页文档,构建倒排索引表,存到数据库。1.环境准备(1)浪潮集群有了自己的账户,普通用户权限。集群本身是python3.1版本,用不惯,在本地下载了python2.7版本,

2017-09-12 20:54:39 415

原创 数据结构与算法之动态规划算法及其python实现

1 动态规划问题动态规划算法和分治法类似,都是将带求解问题分解为若干个子问题,先求解子问题,然后从这些子问题的解得到原问题的答案。与分治法不同的是,动态规划要用一个表来记录所有已解决的子问题的答案。不管该问题是否以后会被用到,只要它被计算过,就将其结果填入表中。在需要时从表中找出答案,避免大量重复计算,从而得到多项式时间算法。通常按一下几个步骤设计动态规划算法: (1)找出最优解性质,刻画最优解结

2017-08-29 18:58:57 855

原创 经典排序算法及其python实现

这是常见的几种排序算法,另外还有归并排序: 之后我将以此介绍每种排序算法并用python实现。

2017-08-27 20:58:08 1098

翻译 Python scikit-learn 模块的SVM方法介绍

本文翻译自: http://scikit-learn.org/stable/modules/svm.html#1.4 SVM支持向量机SVM是一系列监督学习算法,包括分类,回归,异常点检测。 SVM优点: 1. 在高维空间有效; 2. 即使维数高于样本数,算法仍然高效; 3. 决策函数由支持向量机(子数据集)决定,可在内存中有效; 4. 不同核函数产生不同的决策函数。常用的核函数和自定义

2017-07-28 10:37:13 9298 1

翻译 Python scikit-learn 模块svc方法的参数解释

关于sklearn.svm.SVC的参数的学习class sklearn.svm.SVC(C=1.0, kernel='rbf', degree=3, gamma='auto', coef0=0.0, shrinking=True, probability=False, tol=0.001, cache_size=200, class_weight=None, verbose=False, max_

2017-07-24 16:38:00 10396 1

原创 Python实现经典内部排序算法(归并排序)

归并排序1. 算法原理和Python代码归并(Merge)排序法是将两个(或两个以上)有序表合并成一个新的有序表,即把待排序序列分为若干个子序列,每个子序列是有序的。然后再把有序子序列合并为整体有序序列。

2017-07-20 18:18:25 5241 1

原创 Python中文乱码问题原理解释

写程序时经常需要添加中文注释,但是Python程序默认支持ASCII编码,即不显示中文,所以要在第一行或者第二行加入编码格式,utf-8,gbk等都可以。 这些编码格式都支持unicode字符集,可以正常显示中文,而ASCII码是美国标准码,只支持英文。# coding=utf-8# -*- coding: utf-8 -*-这两种方式都可以,Python主要是检测‘#’,‘coding’和‘u

2017-06-14 16:45:13 490

原创 每天一个MySQL知识点(更新中)

1.创建数据库 create database wj (wj是数据库名字) 2.创建表格 3.添加属性 4.修改属性 5.删除字段 6.删除表格 7.在Linux进入MySQL mysql -uroot -proot 8.进入数据库 use wj; 9.查看表格 show tables; 10.查看表格属性 desc table_name;

2017-06-09 17:47:52 555

原创 每天一个python知识点(更新中)

1.标准输出到另一个文件import sysoutput = sys.stdout #output是临时变量outputfile = open('wj_file','w') #打开文件sys.stdout = outputfile #把该文件赋值给标准输出print "hello" #hello 写入文件outputfile .close() sys.stdout = output #还

2017-06-07 18:17:21 502

原创 每天一个Linux命令(更新中)

1.查找文件夹下含有某个字符串的文件 find -type f -name ‘*.php’|xargs grep ‘GroupRecord’ 2.统计文件夹下文件的个数 ls -l |grep “^-“|wc -l 3.查看当前运行的进程 ps -ef |grep run.sh (其中run.sh是启动的程序) 4.输出tab健 ctrl + v + i 5.统计文件行数 ca

2017-06-07 17:46:48 676

原创 每天一个vim命令(更新中)

1.复制文件的几行到另一个文件 :1,5w!wj_file (复制当前文件的1到5行写到wj_file文件中) 2.横向切分屏幕,打开另一个文件 :vsp wj_file 3.同时打开两个屏幕 vim -O wj_file wj2_file

2017-06-07 17:46:11 622

原创 每天一个shell命令(更新中)

shell中常见的命令 1.set -e 父进程中有这个命令,当子进程异常退出(返回非零),父进程就会终止,不继续执行; 2.set +e 子进程exit 1或者其他非零值时,父进程会继续执行。 3. if 语句if [ $? ]then echo "hello"else echo "hi"fi注意[]内两侧有空格 4.变量定义temp=`date

2017-06-07 17:45:09 1209

转载 Ubuntu配置vim支持Python编程

如未安装vim,使用下面命令安装:sudo apt-get install vim 在用户目录下创建.vim目录,其下创建bundle目录:mkdir .vim\bundle 安装Bundle/Vundle:git clone https://github.com/gmarik/vundle.git ~/.vim/bundle/vundle 创建或编辑用户目录下的.vimrc文件,添加如下内容

2017-03-28 21:09:14 725

原创 ubuntu系统下,下载安装Python程序的方法汇总(wget;apt-get;easy_install;pip)

1.源码安装:已知源码的地址,例如:https://www.python.org/ftp/python/3.6.1/Python-3.6.1.tgz 这是Python3.6.1的源码地址,则可以使用wget下载:wget https://www.python.org/ftp/python/3.6.1/Python-3.6.1.tgz这种方式对于修改参数配置等较灵活;而且可以决定源代码的下载位置,如

2017-03-27 16:56:29 14398 2

转载 ubuntu系统下通过源码安装程序(configure,make,make install)

一、程序的组成部分Linux下程序大都是由以下几部分组成:二进制文件:也就是可以运行的程序文件库文件:就是通常我们见到的lib目录下的文件配置文件:这个不必多说,都知道帮助文档:通常是我们在Linux下用man命令查看的命令的文档二、Linux下程序的存放目录Linux程序的存放目录大致有三个地方:/etc, /bin, /sbin, /lib :系统启动就需要用到的程序,这些目录不能挂载额外的分

2017-03-27 11:08:23 9319 1

原创 电面1

2017-02-21预约面试两天前,工程师打电话预约了面试,并告知可能会有编程的考察,准备好了编程坏境等。我面试的职位是数据挖掘实习。2017-02-23下午两点电话面试1电面持续42分钟,接到电话后,首先从项目经历问起: 1.爬虫时怎么实现的?用什么技术? 2.怎样构建的倒排索引表,涉及到哈希表的问题及原理。 3.快速排序的种类,原理和每种排序的时间复杂度和空间复杂度,以及能否优化,优化的方

2017-02-23 17:16:21 544

原创 Python pandas df 写入excel 出现问题

学习Python数据分析挖掘实战一书时,在数据预处理阶段,有一节要使用拉格朗日插值法对缺失值补充,代码如下:#-*- coding:utf-8 -*-import pandas as pdimport matplotlib.pyplot as pltfrom scipy.interpolate import lagrange#导入拉格朗日插值函数inputfile="catering_sale

2016-11-21 10:46:43 22853 1

原创 pandas中read_excel和read_csv出现问题

利用Python的pandas数据结构来读取excel表格的数据,部分代码如下:#-*- coding:utf-8 -*-import pandas as pdimport matplotlib.pyplot as pltcatering_data="catering_sale.xls"data=pd.read_excel(catering_data,index_col=u'日期')#读取数

2016-11-04 11:21:54 11325 2

翻译 支持向量机(斯坦福大学课程讲义Andrew Ng)

SVM算法是最流行的监督学习算法之一(很多人认为是最好的)。为了讲清楚SVM算法,我们需要先讨论一下间隔(margin)和分离数据的间隙(gap)。 下一步,我们将会讨论最优间隔分类器,其中用到了拉格朗日对偶。 我们也会接触到核函数,核函数提供了一种将SVM应用于高维(比如无限维)特征空间的方法。 最后我们讲解SMO(序列最小优化)算法,它是SVM算法的高效实现。1.间隔:直观 这部分给出了间隔和

2016-10-28 19:19:44 1234

原创 安装Oracle11g_win32,以及遇到的问题和解决方案

1. 从官网下载相应的Oracle版本官网地址 2.开始安装Oracle 3.配置数据库

2016-07-26 10:35:52 1565

原创 使用matplotlib库绘图出现的问题

源代码需要导入dateutil包

2016-07-18 12:13:26 623

原创 Python的“绑定机制”(self)

“绑定”就是将实例对象与属性和方法相关联,通过实例对象来调用属性和方法。 在Python中,函数送的self参数就是用来接收绑定的。 运行下面的程序:class Test: def setXY(self,x,y): self.x=x self.y=y def printXY(self): print(self.x,self.y)创建

2016-07-05 15:54:08 1087

原创 python 的公有和“私有”

首先,python中没有关键字来定义公有或是私有,默认情况下,类中的所有属性和方法都是公有的,可以在外部使用。例如,如下代码:类person的实例p可以直接使用类中的变量name;但是,python提供了定义私有变量的方法,在变量前加两个“_”下划线,此时变量就成了私有变量。无法通过实例对象使用了,只能在内部使用。此时,只能在类的内部使用私有变量,通过调用getname方法才能得到name。事实上,

2016-07-04 14:35:14 2185

原创 python文件处理时的问题:split函数,input函数

文件操作目的:对文件中的对话内容进行分割,把买家和客户的谈话内容分别保存在不同的文件中,但是去掉谈话对象。遇到如下问题: 程序代码如下: 使用字符串的split时,报错错误内容:这个函数需要至少一个值。读取的文件是: 在split函数中,用“:”将文件内容分开时,必须保证文件中“:”是英文格式的,不能是中文格式的。修改后,即可正常运行。 input函数问题又遇到第二个问题:当输入保存谈话内容

2016-06-30 10:38:07 4966

原创 python 内嵌函数中,return调用函数的区别

这个程序有问题,在外部函数funX中,返回的是funY(),,,不对。。应该返回funY….改正后即可运行。。另一种调用方法:综上所述,调用函数时,必须加括号;如果是return funY,则返回的是这个函数所在的位置;如果后面跟的是函数名,加括号的,则表示调用这个函数。如果没有找到相应的函数,则报错。如果找到了对应的函数,并且对应参数一样,则会调用那个函数。所以,return后面既可以是funY,

2016-06-28 17:45:18 8231 1

原创 发布python代码模块

完全参照headfirst书的步骤来实现的。系统为windows。

2016-06-21 11:28:15 1658 2

原创 python IDLE 背景以及字体的修改

为了保护眼睛,决定把白色背景换掉: 1 首先,在已经下载好的python文件目录下,找到config-highlight.def文件,我的是在H:\python\python3**\Lib\idlelib**文件夹下。 2.打开文件后,你会看到一些默认的颜色配置,比如经典的颜色配置就是白色背景,一般这个文件中会有两种配置可供选择: [IDLE Classic]和 [IDLE New],表现在

2016-06-17 18:08:59 42574 6

原创 hadoop的配置

1.安装VMware虚拟机这一步很简单,直接双击就好,安装后如下: 然后你可以自己配置虚拟机的虚拟网卡,用于连接linux系统和window系统。在这里,有个小知识要讲解给初学者: 对于window系统来说,它有一个网卡用于连接外部网络的。但是linux系统是运行在虚拟机上,没有真实的网卡,所以VMware给它一个虚拟的网卡,同时给windows也生成一个虚拟的网卡vmnet8,打开主机的网

2016-05-17 20:48:25 497

原创 C语言实现非递归的比较两个二叉树是否同构

#include<stdio.h>#define STACK_SIZE 100typedef struct node{ node *lchild; node *rchild;}Node;static Node* stack1[STACK_SIZE];static Node* stack2[STACK_SIZE];int comp(Node *root1,Node *root2)

2016-04-27 17:32:36 806

原创 什么是java(TM)?

今天浏览器突然出现这个提示: 就特别想知道java(TM)是什么?以下是查阅一些资料的总结。

2016-04-08 09:20:07 13815

parallel support vector machine:the cascade svm

parallel support vector machine:the cascade svm 英文论文原稿

2017-11-29

吴恩达教授SVM讲义中英文版

资源中只有支持向量机部分的英文讲义以及笔者翻译的中文讲义。 切记:中文讲义需要使用Microsoft word 打开,如果使用WPS打开,数学公式无法查看。

2017-03-28

中英文svm支持向量机讲义

根据斯坦福大学吴恩达教授的机器学习讲义翻译的,上传资源包括中英文讲义。

2016-10-27

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除