自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

AQ_cainiao_AQ的博客

原创数据增强之Cutout

数据增强之CutoutCutout介绍分类cutout检测cutoutCutout介绍(内容摘自[CV技术指南],用于自学知识)该方法来源于论文《Improved Regularization of Convolutional Neural Networks with Cutout》在一些人体姿态估计，人脸识别，目标跟踪，行人重识别等任务中常常会出现遮挡的情况，为了提高模型的鲁棒性，提出了使用Cutout数据增强方法。该方法的依据是Cutout能够让CNN更好地利用图像的全局信息，而不是依赖于一小

2021-11-14 23:05:41 4149

原创 spark 集群使用手册

采用浪潮集群搭建Spark的四个节点（cu01,cu02,cu03,cu04），Spark和hadoop已经安装好。使用hadoop 的yarn集群管理器。 1.启动hadoop[wangj@mu01 ~]$ssh cu01 #进入主节点[wangj@controller ~]$ cd /opt/software/hadoop/[wangj@controller

2018-01-05 11:43:48 901

转载安装numpy+mkl报错的处理办法

转载自：http://www.fkccp.com/archives/2710.html 非常感谢这个大神，我纠结了好久这个问题！Processing c:\users\rao\downloads\numpy-1.11.2+mkl-cp27-cp27m-win32.whl Installing collected packages: numpy Exception: Traceback (mo

2017-12-14 20:56:17 2790

原创 The cascade SVM （串联SVM；层级SVM；层叠SVM）

对于标题布置如何翻译较好；本文翻译自论文：http://download.csdn.net/download/aq_cainiao_aq/10136946parallel support vector machine：the cascade svmcascade svm的提出是通过并行的方式解决svm算法时间和空间占用资源多的缺点，尤其是非线性svm需要较多的支持向量时，数据占用内存多，运行耗时

2017-11-29 15:22:16 2527

转载如何理解矩阵特征值？

在学习使用PCA方法进行数据降维时，用到了特征值和特征向量知识。知乎链接，讲的太好了： https://www.zhihu.com/question/21874816因为禁止转载，又想收藏，故采用截图方式保留作者思路。上面用到了一个数学知识，在求矩阵A的特征值时，用到了： Ax=ax 其中，A是矩阵，a是特征值，x是特征向量。矩阵A的特征值可以有多个，特征值

2017-11-23 10:29:27 1945

转载浅谈人工智能：现状、任务、构架与统一 | 正本清源

文章作者：朱松纯（视觉求索）一直以来追求机器学习技术上进步，从未更深层次的考虑机器学习的根源。这篇文章值得反复阅读，尤其是对于做研究的学者来说。摘要： 1.人工智能是学习“乌鸦”的智能，不是“鹦鹉”的智能。 2.大数据训练得到的模型，只能是“种瓜得瓜，得不到豆”；“小数据，大任务范式”下学习到的智能才能“适者生存”。 3.计算机视觉中，可以用深度学习解决的问题，是当前可以从图像中

2017-11-21 11:25:11 1220

翻译 pso-svm 算法实现（1）：python DEAP

在之前的文章已经叙述了pso算法的实现，http://blog.csdn.net/AQ_cainiao_AQ/article/details/78448508 接下来解决pso-svm算法的实现。在pso-svm 算法中，参数寻优步骤大概如下：（1）PSO算法寻找适用于SVM模型的核函数类型Step 1：初始化粒子群规模m，设定算法的权重因子，终止条件和初始粒子编码；Step 2：将每个粒子的

2017-11-06 16:04:35 12981

翻译 python DEAP PSO 算法的学习

翻译自：http://deap.readthedocs.io/en/master/examples/pso_basic.html粒子群优化基础这里的实现是基本PSO算法的实现。wikipedia的PSO的定义如下： PSO通过拥有一个种群规模的候选解决方案来优化一个问题，这里的候选解决方案指的是粒子，在解空间中根据简单的数学公式移动这些粒子。粒子的移动被解空间的最优位置引导着，如果粒子发现更好的位

2017-11-05 11:51:29 4102

原创 python 的 DEAP框架学习

学习DEAP框架，找到如下资源： 1.github源码：https://github.com/deap/deap 2.deap文档：http://deap.gel.ulaval.ca/doc/dev/index.html 3.deap初学者中文介绍：https://segmentfault.com/a/1190000004368689 4.一篇介绍deap的文章：http://www.do

2017-11-04 11:40:15 12834

原创 python 安装模块出现问题：UnicodeDecodeError:

1.问题描述UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xbe in position 7: ordinal not in range(128) 在F:\Python\python2.7.11\Scripts目录下（因为pip安装在这个目录下），shift+鼠标右键，打开控制台，输入命令：pip install xlrd需要安装这个

2017-10-27 10:55:39 1124

原创在集群上搭建搜索引擎的每一步（更新中）

- 2017-09-13 今天想要在实验室的浪潮集群上搭建自己的搜索引擎系统，目前没有完整的计划，hadoop也暂时没有用到，先解决一些基础问题，比如环境，爬虫之类的问题，然后，搭建hadoop平台，用mapreduce来并行处理网页文档，构建倒排索引表，存到数据库。1.环境准备（1）浪潮集群有了自己的账户，普通用户权限。集群本身是python3.1版本，用不惯，在本地下载了python2.7版本，

2017-09-12 20:54:39 475

原创数据结构与算法之动态规划算法及其python实现

1 动态规划问题动态规划算法和分治法类似，都是将带求解问题分解为若干个子问题，先求解子问题，然后从这些子问题的解得到原问题的答案。与分治法不同的是，动态规划要用一个表来记录所有已解决的子问题的答案。不管该问题是否以后会被用到，只要它被计算过，就将其结果填入表中。在需要时从表中找出答案，避免大量重复计算，从而得到多项式时间算法。通常按一下几个步骤设计动态规划算法：（1）找出最优解性质，刻画最优解结

2017-08-29 18:58:57 990

原创经典排序算法及其python实现

这是常见的几种排序算法，另外还有归并排序：之后我将以此介绍每种排序算法并用python实现。

2017-08-27 20:58:08 1175

翻译 Python scikit-learn 模块的SVM方法介绍

本文翻译自： http://scikit-learn.org/stable/modules/svm.html#1.4 SVM支持向量机SVM是一系列监督学习算法，包括分类，回归，异常点检测。 SVM优点： 1. 在高维空间有效； 2. 即使维数高于样本数，算法仍然高效； 3. 决策函数由支持向量机（子数据集）决定，可在内存中有效； 4. 不同核函数产生不同的决策函数。常用的核函数和自定义

2017-07-28 10:37:13 9428 1

翻译 Python scikit-learn 模块svc方法的参数解释

关于sklearn.svm.SVC的参数的学习class sklearn.svm.SVC(C=1.0, kernel='rbf', degree=3, gamma='auto', coef0=0.0, shrinking=True, probability=False, tol=0.001, cache_size=200, class_weight=None, verbose=False, max_

2017-07-24 16:38:00 10580

原创 Python实现经典内部排序算法（归并排序）

归并排序1. 算法原理和Python代码归并（Merge）排序法是将两个（或两个以上）有序表合并成一个新的有序表，即把待排序序列分为若干个子序列，每个子序列是有序的。然后再把有序子序列合并为整体有序序列。

2017-07-20 18:18:25 5330 1

原创 Python中文乱码问题原理解释

写程序时经常需要添加中文注释，但是Python程序默认支持ASCII编码，即不显示中文，所以要在第一行或者第二行加入编码格式，utf-8，gbk等都可以。这些编码格式都支持unicode字符集，可以正常显示中文，而ASCII码是美国标准码，只支持英文。# coding=utf-8# -*- coding: utf-8 -*-这两种方式都可以，Python主要是检测‘#’，‘coding’和‘u

2017-06-14 16:45:13 523

原创每天一个MySQL知识点（更新中）

1.创建数据库 create database wj （wj是数据库名字） 2.创建表格 3.添加属性 4.修改属性 5.删除字段 6.删除表格 7.在Linux进入MySQL mysql -uroot -proot 8.进入数据库 use wj; 9.查看表格 show tables; 10.查看表格属性 desc table_name;

2017-06-09 17:47:52 611

原创每天一个python知识点（更新中）

1.标准输出到另一个文件import sysoutput = sys.stdout #output是临时变量outputfile = open('wj_file','w') #打开文件sys.stdout = outputfile #把该文件赋值给标准输出print "hello" #hello 写入文件outputfile .close() sys.stdout = output #还

2017-06-07 18:17:21 548

原创每天一个Linux命令（更新中）

1.查找文件夹下含有某个字符串的文件 find -type f -name ‘*.php’|xargs grep ‘GroupRecord’ 2.统计文件夹下文件的个数 ls -l |grep “^-“|wc -l 3.查看当前运行的进程 ps -ef |grep run.sh （其中run.sh是启动的程序） 4.输出tab健 ctrl + v + i 5.统计文件行数 ca

2017-06-07 17:46:48 718

原创每天一个vim命令（更新中）

1.复制文件的几行到另一个文件：1,5w!wj_file （复制当前文件的1到5行写到wj_file文件中） 2.横向切分屏幕，打开另一个文件：vsp wj_file 3.同时打开两个屏幕 vim -O wj_file wj2_file

2017-06-07 17:46:11 679

原创每天一个shell命令（更新中）

shell中常见的命令 1.set -e 父进程中有这个命令，当子进程异常退出（返回非零），父进程就会终止，不继续执行； 2.set +e 子进程exit 1或者其他非零值时，父进程会继续执行。 3. if 语句if [ $? ]then echo "hello"else echo "hi"fi注意[]内两侧有空格 4.变量定义temp=`date

2017-06-07 17:45:09 1260

转载 Ubuntu配置vim支持Python编程

如未安装vim，使用下面命令安装：sudo apt-get install vim 在用户目录下创建.vim目录，其下创建bundle目录：mkdir .vim\bundle 安装Bundle/Vundle：git clone https://github.com/gmarik/vundle.git ~/.vim/bundle/vundle 创建或编辑用户目录下的.vimrc文件，添加如下内容

2017-03-28 21:09:14 768

原创 ubuntu系统下，下载安装Python程序的方法汇总（wget；apt-get；easy_install;pip）

1.源码安装：已知源码的地址，例如：https://www.python.org/ftp/python/3.6.1/Python-3.6.1.tgz 这是Python3.6.1的源码地址，则可以使用wget下载：wget https://www.python.org/ftp/python/3.6.1/Python-3.6.1.tgz这种方式对于修改参数配置等较灵活；而且可以决定源代码的下载位置，如

2017-03-27 16:56:29 15584 2

转载 ubuntu系统下通过源码安装程序（configure，make，make install）

一、程序的组成部分Linux下程序大都是由以下几部分组成：二进制文件：也就是可以运行的程序文件库文件：就是通常我们见到的lib目录下的文件配置文件：这个不必多说，都知道帮助文档：通常是我们在Linux下用man命令查看的命令的文档二、Linux下程序的存放目录Linux程序的存放目录大致有三个地方：/etc, /bin, /sbin, /lib ：系统启动就需要用到的程序，这些目录不能挂载额外的分

2017-03-27 11:08:23 9715

原创电面1

2017-02-21预约面试两天前，工程师打电话预约了面试，并告知可能会有编程的考察，准备好了编程坏境等。我面试的职位是数据挖掘实习。2017-02-23下午两点电话面试1电面持续42分钟，接到电话后，首先从项目经历问起： 1.爬虫时怎么实现的？用什么技术？ 2.怎样构建的倒排索引表，涉及到哈希表的问题及原理。 3.快速排序的种类，原理和每种排序的时间复杂度和空间复杂度，以及能否优化，优化的方

2017-02-23 17:16:21 586

原创 Python pandas df 写入excel 出现问题

学习Python数据分析挖掘实战一书时，在数据预处理阶段，有一节要使用拉格朗日插值法对缺失值补充，代码如下：#-*- coding:utf-8 -*-import pandas as pdimport matplotlib.pyplot as pltfrom scipy.interpolate import lagrange#导入拉格朗日插值函数inputfile="catering_sale

2016-11-21 10:46:43 23138

原创 pandas中read_excel和read_csv出现问题

利用Python的pandas数据结构来读取excel表格的数据，部分代码如下：#-*- coding:utf-8 -*-import pandas as pdimport matplotlib.pyplot as pltcatering_data="catering_sale.xls"data=pd.read_excel(catering_data,index_col=u'日期')#读取数

2016-11-04 11:21:54 11530 1

翻译支持向量机（斯坦福大学课程讲义Andrew Ng）

SVM算法是最流行的监督学习算法之一（很多人认为是最好的）。为了讲清楚SVM算法，我们需要先讨论一下间隔（margin）和分离数据的间隙（gap）。下一步，我们将会讨论最优间隔分类器，其中用到了拉格朗日对偶。我们也会接触到核函数，核函数提供了一种将SVM应用于高维（比如无限维）特征空间的方法。最后我们讲解SMO（序列最小优化）算法，它是SVM算法的高效实现。1.间隔：直观这部分给出了间隔和

2016-10-28 19:19:44 1288

原创安装Oracle11g_win32，以及遇到的问题和解决方案

1. 从官网下载相应的Oracle版本官网地址 2.开始安装Oracle 3.配置数据库

2016-07-26 10:35:52 2442

原创使用matplotlib库绘图出现的问题

源代码需要导入dateutil包

2016-07-18 12:13:26 697

原创 Python的“绑定机制”（self）

“绑定”就是将实例对象与属性和方法相关联，通过实例对象来调用属性和方法。在Python中，函数送的self参数就是用来接收绑定的。运行下面的程序：class Test: def setXY(self,x,y): self.x=x self.y=y def printXY(self): print(self.x,self.y)创建

2016-07-05 15:54:08 1212

原创 python 的公有和“私有”

首先，python中没有关键字来定义公有或是私有，默认情况下，类中的所有属性和方法都是公有的，可以在外部使用。例如，如下代码：类person的实例p可以直接使用类中的变量name；但是，python提供了定义私有变量的方法，在变量前加两个“_”下划线，此时变量就成了私有变量。无法通过实例对象使用了，只能在内部使用。此时，只能在类的内部使用私有变量，通过调用getname方法才能得到name。事实上，

2016-07-04 14:35:14 2260

原创 python文件处理时的问题：split函数，input函数

文件操作目的：对文件中的对话内容进行分割，把买家和客户的谈话内容分别保存在不同的文件中，但是去掉谈话对象。遇到如下问题：程序代码如下：使用字符串的split时，报错错误内容：这个函数需要至少一个值。读取的文件是：在split函数中，用“：”将文件内容分开时，必须保证文件中“：”是英文格式的，不能是中文格式的。修改后，即可正常运行。 input函数问题又遇到第二个问题：当输入保存谈话内容

2016-06-30 10:38:07 5140

原创 python 内嵌函数中，return调用函数的区别

这个程序有问题，在外部函数funX中，返回的是funY(),,,不对。。应该返回funY….改正后即可运行。。另一种调用方法：综上所述，调用函数时，必须加括号；如果是return funY,则返回的是这个函数所在的位置；如果后面跟的是函数名，加括号的，则表示调用这个函数。如果没有找到相应的函数，则报错。如果找到了对应的函数，并且对应参数一样，则会调用那个函数。所以，return后面既可以是funY,

2016-06-28 17:45:18 8333

原创发布python代码模块

完全参照headfirst书的步骤来实现的。系统为windows。

2016-06-21 11:28:15 1758

原创 python IDLE 背景以及字体的修改

为了保护眼睛，决定把白色背景换掉： 1 首先，在已经下载好的python文件目录下，找到config-highlight.def文件，我的是在H:\python\python3**\Lib\idlelib**文件夹下。 2.打开文件后，你会看到一些默认的颜色配置，比如经典的颜色配置就是白色背景，一般这个文件中会有两种配置可供选择： [IDLE Classic]和 [IDLE New]，表现在

2016-06-17 18:08:59 42769 3

原创 hadoop的配置

1.安装VMware虚拟机这一步很简单，直接双击就好，安装后如下：然后你可以自己配置虚拟机的虚拟网卡，用于连接linux系统和window系统。在这里，有个小知识要讲解给初学者：对于window系统来说，它有一个网卡用于连接外部网络的。但是linux系统是运行在虚拟机上，没有真实的网卡，所以VMware给它一个虚拟的网卡，同时给windows也生成一个虚拟的网卡vmnet8，打开主机的网

2016-05-17 20:48:25 555

原创 C语言实现非递归的比较两个二叉树是否同构

#include<stdio.h>#define STACK_SIZE 100typedef struct node{ node *lchild; node *rchild;}Node;static Node* stack1[STACK_SIZE];static Node* stack2[STACK_SIZE];int comp(Node *root1,Node *root2)

2016-04-27 17:32:36 871

原创什么是java（TM）？

今天浏览器突然出现这个提示：就特别想知道java（TM）是什么？以下是查阅一些资料的总结。

2016-04-08 09:20:07 14617

parallel support vector machine：the cascade svm

parallel support vector machine：the cascade svm 英文论文原稿

2017-11-29

吴恩达教授SVM讲义中英文版

资源中只有支持向量机部分的英文讲义以及笔者翻译的中文讲义。切记：中文讲义需要使用Microsoft word 打开，如果使用WPS打开，数学公式无法查看。

2017-03-28

中英文svm支持向量机讲义

根据斯坦福大学吴恩达教授的机器学习讲义翻译的，上传资源包括中英文讲义。

2016-10-27

Python编写的简单计时器程序问题

2016-07-06

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除