ys1305-CSDN博客

原创软件测试笔记

1、测试定义：1)通过人工或自动的手段，对被测对象进行检测的活动，目的在于发现被测对象是否实现用户的需求，或者弄清实际结果与预期结果之间的差异。2)需要理解什么软件：源代码、用户手册、配置数据。2、测试目的：发现被测对象与用户需求间的差异——俗称找bug;通过测试活动发现并解决缺陷，增加人们对被测对象的质量信心；通过测试活动，获取被测对象的质量信息，为决策提供数据依据；通过测试活动，...

2019-09-11 21:58:24 334

原创 C++继承中的特点

有public, protected, private三种继承方式，它们相应地改变了基类成员的访问属性。1.public 继承：基类 public 成员，protected 成员，private 成员的访问属性在派生类中分别变成：public, protected, private2.protected 继承：基类 public 成员，protected 成员，private 成员的访...

2019-09-09 15:39:55 340

原创 C++二维数组初始化的形式

数据类型数组名[整常量表达式][ 整常量表达式]={ 初始化数据 }；在{ }中给出各数组元素的初值，各初值之间用逗号分开。把{ }中的初值依次赋给各数组元素。有如下几种初始化方式：⑴ 分行进行初始化int a[2][3]={{1,2,3},{4，5，6}};在{ }内部再用{ }把各行分开，第一对{ }中的初值1，2，3是0行的3个元素的初值。第二对{ }中的初值4，5，6是1行的...

2019-08-26 09:36:23 40816 2

原创 LR为什么使用sigmoid函数

两个方面的原因Sigmoid 函数自身的性质sigmoid 函数连续，单调递增sigmiod 函数关于（0，0.5）中心对称对sigmoid函数求导p′=p∗(1−p)p′=p∗(1−p)p′=p∗(1−p)计算sigmoid函数的导数非常的快速LR可以推出来sigmod函数用指数簇分布推导出来的sigmod函数p(y;η)=b(y)exp(ηT(y)−α(η...

2019-08-24 09:48:13 439

原创特征选择

Filter**先进行特征选择，然后去训练学习器，所以特征选择的过程与学习器无关。**相当于先对特征进行过滤操作，然后用特征子集来训练分类器。主要思想：对每一维特征“打分”，即给每一维的特征赋予权重，这样的权重就代表着该特征的重要性，然后依据权重排序。主要方法：Chi-squared test（卡方检验）Information gain（信息增益）Correlation coeffi...

2019-08-14 16:21:22 585

原创 Pandas之drop_duplicates：去除重复项

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)参数去除特定列下面的重复行。返回DataFrame格式的数据。subset : column label or sequence of labels, optional 用来指定特定的列，默认所有列keep : {‘first’, ‘last’, Fal...

2019-08-14 09:34:38 1498

转载面试笔试整理5：项目问题准备

1、课题：从目的-》意义-》难点-》如何解决的-》用了什么方法为什么要用这些方法-》创新点。2、实习实习期间主要负责华为HC大会的推荐算法以及数据分析，用过SQL Server，制作过报表。3、自己曾经做过一些比赛，但是结果不是很好，不过还是准备写到简历里了，毕竟也算是自己做过的项目。做了一些数据挖掘的比赛，面试会问到的常见问题其实也没有多少，无非是从数据预处理、特征和模型几个内容。以j...

2019-08-13 18:30:15 151

任何回归都是从特征矩阵中学习，然后求解连续型标签y的过程，之所以能够实现这个过程，是因为回归算法认为，特征矩阵和标签之前存在着某种联系。实际上，标签和特征是可以相互转换的，比如说，在一个“用地区，环境，附近学校数量”预测“房价”的问题中，我们既可以用“地区”，“环境”，“附近学校数量”的数据来预测“房价”，也可以反过来，用“环境”，“附近学校数量”和“房价”来预测“地区”。而回归填补缺失值，正是...

2019-08-13 18:26:19 3530 1

原创决策树1

modelfeature select树的类型计算公式ID3{分类:信息增益}多叉树g(D,A)=H(D)−H(D∥A)g(D,A)=H(D)-H(D\|A)g(D,A)=H(D)−H(D∥A)C4.5{分类:信息增益比}多叉树gR(D,A)=g(D,A)HA(D)g_R(D,A)=\frac{g(D,A)}{H_A(D)}gR(D,A)=HA(D...

2019-08-13 15:17:47 180

原创 LR如何进行并行计算

由逻辑回归问题的求解方法中可以看出，无论是梯度下降法、牛顿法、拟牛顿法，计算梯度都是其最基本的步骤，并且L-BFGS通过两步循环计算牛顿方向的方法，避免了计算海森矩阵。因此逻辑回归的并行化最主要的就是对目标函数梯度计算的并行化。从梯度更新公式中可以看出，目标函数的梯度向量计算中只需要进行向量间的点乘和相加，可以很容易将每个迭代过程拆分成相互独立的计算步骤，由不同的节点进行独立计算，然后归并计算结果...

2019-08-12 15:59:26 950 1

原创全连接、局部连接、全卷积与局部卷积

全连接、局部连接、全卷积与局部卷积大多数神经网络中高层网络通常会采用全连接层(Global Connected Layer)，通过多对多的连接方式对特征进行全局汇总，可以有效地提取全局信息。但是全连接的方式需要大量的参数，是神经网络中最占资源的部分之一，因此就需要由局部连接(Local Connected Layer)，仅在局部区域范围内产生神经元连接，能够有效地减少参数量。根据卷积操作的作...

2019-08-12 15:05:47 7433 2

原创空洞卷积

空洞卷积# 在原始卷积核的每两个元素之间插入 d − 1个空洞# 膨胀的卷积核尺寸 = 膨胀系数 * (原始卷积核尺寸 - 1) + 1# 也可以写成 m + (m − 1) × (d − 1) 二者是相等的# m为原始卷积核尺寸 d为膨胀系数# 首先由于卷积的操作特性，卷积核尺寸是奇数，则原始卷积核尺寸减一为偶数。# 那么，在上述公式中，膨胀系数*偶数-1为奇数，保证了膨胀的卷积...

2019-08-12 15:03:21 5167

原创 pytorch实现正则化

下载地址参数正则化（Weight Regularization）以前的方法L2/L1 Regularization机器学习中几乎都可以看到损失函数后面会添加一个额外项，常用的额外项一般有两种，称作**L1正则化和L2正则化，或者L1范数和L2范数**。L1 正则化和 L2 正则化可以看做是损失函数的惩罚项。所谓 “惩罚” 是指对损失函数中的某些参数做一些限制。L1 正则化是指权值向量...

2019-07-31 20:40:00 23705 1

原创查看Pytorch网络的各层输出(feature map)、权重(weight)、偏置(bias)

BatchNorm2d参数量torch.nn.BatchNorm2d(num_features, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)# 卷积层中卷积核的数量C num_features – C from an expected input of size (N, C, H, W)>>&...

2019-07-31 20:36:18 24366 2

原创 keras笔记

一、keras套路序贯模型是多个网络层的线性堆叠。Sequential的第一层需要接受一个关于输入数据shape的参数，后面的各个层则可以自动的推导出中间数据的shape，因此不需要为每个层都指定这个参数指定模型Sequential( )---->堆叠模块 .add( )---->编译模型 .compile( )---->在训练数据上迭代 .fit( )----&g...

2019-07-31 12:15:40 253

原创 Keras中的BatchNormalization层

Keras中的BatchNormalization层有四个参数其中两个是可以训练的，对应于λ与β两个是不能训练的。keras.layers.normalization.BatchNormalization(axis=-1, momentum=0.99, epsilon=0.001, center=True, scale=True, beta_initializer='zeros', gamm...

2019-07-31 11:18:54 9595 1

原创 python 中正无穷，负无穷的表示

float(‘inf’) 表示正无穷-float(‘inf’) 或 float(’-inf’) 表示负无穷

2019-07-31 09:08:07 8257

原创剑指offer-python 数组中数值和下标相等的元素

题目描述：假设一个单调递增的数组里的每个元素都是整数并且是唯一的。请编程实现一个函数找出数组中任意一个数值等于其下标的元素。例如，在数组[-3, -1, 1, 3, 5]中，数字3和它的下标相等。样例：输入：[-3, -1, 1, 3, 5]输出：3注意：如果不存在，则返回-1。分析：首先想到的方法是对数组从头遍历，当遍历到一个元素和其下标相等时直接返回，如果遍历结束仍没有找到则返回...

2019-07-30 10:29:23 649

原创剑指offer-python 0到n-1中缺失的数字

一个长度为n-1的递增排序数组中的所有数字都是唯一的，并且每个数字都在范围0到n-1之内。在范围0到n-1的n个数字中有且只有一个数字不在该数组中，请找出这个数字。样例输入：[0,1,2,4]输出：3class Solution(object): def getMissingNumber(self, nums): """ :type nums:...

2019-07-29 19:05:25 429

原创 AdaBoost 算法

笔记下载链接AdaBoost 算法Boosting族算法最著名的代表是AdaBoost算法。AdaBoot算法两个核心步骤：每一轮中如何改变训练数据的权值？AdaBoost算法提高那些被前一轮弱分类器错误分类样本的权值，而降低那些被正确分类样本的权值。于是那些没有得到正确分类的数据由于权值的加大而受到后一轮的弱分类器的更大关注。最后如何将一系列弱分类器组合成一个强分...

2019-07-29 14:43:20 267

原创 pandas读取csv Error tokenizing data. C error: Expected 18 fields in line 173315, saw 20

Error tokenizing data. C error: Expected 18 fields in line 173315, saw 20此行内容为b55421db8f2f7f9610e7dfc08bcc76e5 销售顾问上市公司高薪高提成 - 719 \N 1 10000 5000 20190314 20190413 0 -1 null 大专 \N \N 岗位职责：1.独立并...

2019-07-25 20:55:12 9714

原创 linux wget 指定文件夹

wget -P 目标文件夹 http://...

2019-07-25 19:15:13 386

原创 keras指定batchsize

具体的测试可以将keras中的第6.4程序1、Sequential情况下如果想要指定批次的大小，需要在第一层的输入形状中使用batch_input_shape而不能使用input_shape，因为input_shape不能指定批次的大小，批次只能为Noneinput_shape和batch_input_shape。input_shape 不包含批量大小，batch_input_shap...

2019-07-23 20:54:22 7006

原创 pandas中求平均时间差

用最大时间减去最小时间然后除以次数报错：TypeError: ufunc true_divide cannot use operands with types dtype(‘O’) and dtype(’<m8[ns]’)同样的程序在处理训练集和测试集出现的结果是不同的时间类型均为orderTime_x datetime64[ns]orderTime_y date...

2019-07-23 16:28:42 1420

原创 pytorch编程的一般套路

笔记下载地址# loss.backward()是求梯度的过程,可以通过手动来更新参数，而不用优化器来更新# optimizer.step()只是使用loss.backward()得到的梯度进行更新参数# 需要to(device) 只有model,训练集data，标签targetimport torchimport torch.nn as nn # 各种层类型的实现import tor...

2019-07-22 19:36:00 1250

原创机器学习-深度学习笔记整理-md格式

机器学习笔记-md格式https://github.com/ys1305/machine-learning-note深度学习笔记-md格式https://github.com/ys1305/Deep-learning-note手写机器学习算法的实现https://github.com/ys1305/ML-handsklearn的使用https://github.com/ys1305/...

2019-07-21 19:59:22 676

转载深度学习500问记录-机器学习1

500问地址常用术语True positives(TP): 被正确地划分为正例的个数，即实际为正例且被分类器划分为正例的实例数；False positives(FP): 被错误地划分为正例的个数，即实际为负例但被分类器划分为正例的实例数；False negatives(FN):被错误地划分为负例的个数，即实际为正例但被分类器划分为负例的实例数；True negatives(TN): ...

2019-07-21 09:11:47 266

原创剑指offer-python 66 构建乘积数组

给定一个数组 A[0, 1,…, n-1]，请构建一个数组 B[0, 1,…, n-1]，其中 B 中的元素 B[i]=A[0]*A[1]*…*A[i-1]*A[i+1]*…*A[n-1]。要求不能使用除法。解题思路'''思路： B[0] = A[1] * A[2] * A[3] * A[4] *....*A[n-1] ;（没有A[0]） B[1 ]= ...

2019-07-20 17:26:19 158

原创剑指offer-python 63 股票的最大利润

可以有一次买入和一次卖出，买入必须在前。求最大收益。解题思路使用贪心策略，假设第 i 轮进行卖出操作，买入操作价格应该在 i 之前并且价格最低。class Solution: def maxProfit(self, prices): """ :type prices: List[int] :rtype: int "...

2019-07-20 16:44:42 395

原创剑指offer-python 65 不用加减乘除做加法

写一个函数，求两个整数之和，要求不得使用 +、-、*、/ 四则运算符号。解题思路class Solution: def Add(self, num1, num2): # write code here return sum([num1,num2])a ^ b 表示没有考虑进位的情况下两数的和，(a & b) << 1 就是进位。...

2019-07-20 16:37:19 177

原创剑指offer-python 67 把字符串转换成整数

将一个字符串转换成一个整数(实现Integer.valueOf(string)的功能，但是string不符合数字要求时返回0)，要求不能使用字符串转换整数的库函数。数值为0或者字符串不是一个合法的数值则返回0。Iuput:+21474836471a33Output:21474836470解题思路class Solution: def StrToInt(self, s)...

2019-07-20 16:14:51 256

原创剑指offer-python 61 扑克牌顺子

LL今天心情特别好,因为他去买了一副扑克牌,发现里面居然有2个大王,2个小王(一副牌原本是54张_)…他随机从中抽出了5张牌,想测测自己的手气,看看能不能抽到顺子,如果抽到的话,他决定去买体育彩票,嘿嘿！！“红心A,黑桃3,小王,大王,方片5”,“Oh My God!”不是顺子…LL不高兴了,他想了想,决定大\小王可以看成任何数字,并且A看作1,J为11,Q为12,K为13。上面的5张牌就可以变...

2019-07-20 15:07:03 115

原创剑指offer-python 59 滑动窗口的最大值

题目描述给定一个数组和滑动窗口的大小，找出所有滑动窗口里数值的最大值。例如，如果输入数组 {2, 3, 4, 2, 6, 2, 5, 1} 及滑动窗口的大小 3，那么一共存在 6 个滑动窗口，他们的最大值分别为 {4, 4, 6, 6, 6, 5}。针对数组{2,3,4,2,6,2,5,1}的滑动窗口有以下6个： {[2,3,4],2,6,2,5,1}， {2,[3,4,2],6,2,5,1...

2019-07-20 14:35:50 124

原创剑指offer-python 58 左旋转字符串

题目描述Input:S="abcXYZdef"K=3Output:"XYZdefabc"解题思路class Solution: def LeftRotateString(self, s, n): # write code here if n<1 or len(s)<1: return s ...

2019-07-20 14:15:15 169

原创剑指offer-python 58 翻转单词顺序列

题目描述牛客最近来了一个新员工Fish，每天早晨总是会拿着一本英文杂志，写些句子在本子上。同事Cat对Fish写的内容颇感兴趣，有一天他向Fish借来翻看，但却读不懂它的意思。例如，“student. a am I”。后来才意识到，这家伙原来把句子单词的顺序翻转了，正确的句子应该是“I am a student.”。Cat对一一的翻转这些单词顺序可不在行，你能帮助他么？Input:"I am...

2019-07-20 13:54:22 95

原创剑指offer-python 57 和为S的连续正数序列

题目描述题目：小明很喜欢数学,有一天他在做数学作业时,要求计算出9~16的和,他马上就写出了正确答案是100。但是他并不满足于此,他在想究竟有多少种连续的正数序列的和为100(至少包括两个数)。没多久,他就得到另一组连续正数和为100的序列:18,19,20,21,22。现在把问题交给你,你能不能也很快的找出所有和为S的连续正数序列? Good Luck!思路：设定两个指针，先分别指向数字1和...

2019-07-20 13:31:41 246

原创 1手写线性回归-2

githubimport numpy as npfrom sklearn.linear_model import LinearRegressionfrom sklearn.datasets import load_diabetesfrom sklearn.utils import shuffleimport matplotlib.pyplot as plt# 形状非常重要，而且容易错...

2019-07-19 20:54:57 160

原创 1-手写线性回归

githubimport numpy as npfrom sklearn.datasets import load_diabetesfrom sklearn.utils import shuffleimport matplotlib.pyplot as pltfrom sklearn.linear_model import LinearRegressiondef initialize...

2019-07-19 20:51:55 163

原创剑指offer-python 55 平衡二叉树

平衡二叉树左右子树高度差不超过 1。解题思路如果二叉树的每个节点的左子树和右子树的深度不大于1，它就是平衡二叉树。先写一个求深度的函数，再对每一个节点判断，看该节点的左子树的深度和右子树的深度的差是否大于1class Solution: def IsBalanced_Solution(self, pRoot): # write code here de...

2019-07-19 20:26:59 280

原创剑指offer-python 55 二叉树的深度

从根结点到叶结点依次经过的结点（含根、叶结点）形成树的一条路径，最长路径的长度为树的深度。解题思路利用递归实现。如果一棵树只有一个结点，那么它的深度为1。递归的时候无需判断左右子树是否存在，因为如果该节点为叶节点，它的左右子树不存在，那么在下一级递归的时候，直接return 0。同时，记得每次递归返回值的时候，深度加一操作，因为计算深度是从根节点下面一个节点开始计算的。class Solut...

2019-07-19 19:58:40 253

Deep Learning with Python笔记1

空空如也