自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 不均衡分类问题 之 class weight & sample weight

分类问题中,当不同类别的样本量差异很大时,很容易影响分类结果。因此,需要进行校正。 sklearn的做法是加权,加权就要涉及到class_weight和sample_weight,当不设置class_weight参数时,默认值是所有类别的权值为1。 类型权重 class_weight 字典类型,将...

2020-05-25 20:52:35 109 0

原创 连续特征离散化的必要性

在什么情况下将连续的特征离散化之后可以获得更好的效果? 工业界中很少直接将连续值作为逻辑回归模型的特征输入,而是将连续特征离散化为一系列0、1特征,这样做的优点可以归纳为以下几点: 1. 特征鲁棒性更强 离散化后的特征对异常值有很强的鲁棒性。 比如对于一个连续特征:年龄,如果直接将其作为特征,一...

2020-05-21 20:59:08 82 0

原创 信用评分模型详解(上)之 评分卡模型

介绍完分箱算法后,就不得不介绍一下评分卡模型了。评分卡模型由于在业务层面具有良好的解释性,对数据挖掘方面(如风控)仍深受欢迎。 目前,主流的评分卡模型仍以逻辑回归模型为主要模型。假设客户违约的概率为ppp,则正常的概率为1−p1-p1−p ...

2020-05-21 20:41:21 166 0

原创 特征离散化(五) 之 评分卡最优分箱

特征离散化 之 卡方分箱(三) 1. 卡方分箱 之 评分卡最优分箱

2020-05-18 19:50:00 114 0

原创 特征离散化(四) 之 bestKS分箱

特征离散化(四) 之 bestKS分箱

2020-04-27 21:38:48 103 0

原创 特征离散化(三) 之 最小熵分箱
原力计划

特征离散化 之 最小熵分箱 最小熵分箱在很多关于分箱的博客中都有提及,但很少有文章着重介绍该算法。因此,单独写篇博客记录一下对该算法的理解。 在介绍该算法之前,需要先了解一下决策树算法 1. 决策树 ...

2020-04-27 20:54:22 228 2

原创 特征离散化(二) 之 Chi2分箱

特征离散化 之 卡方分箱(二) 离散特征在数据挖掘的过程中具有重要作用,因此特征离散化是构建特征工程的一个很常见、也很重要的环节。 最近做项目需要用到卡方分箱实现特征的离散化,发现这么经典的功能python竟然没有相关的封装库。找了许多资料,老感觉差了一点,看的迷迷糊糊的。最后实在不得已,只...

2020-04-14 18:11:42 107 0

原创 特征离散化(一) 之 卡方分箱

特征离散化 之 卡方分箱 离散特征在数据挖掘的过程中具有重要作用,因此特征离散化是构建特征工程的一个很常见、也很重要的环节。 最近做项目需要用到卡方分箱实现特征的离散化,发现这么经典的功能python竟然没有相关的封装库。找了许多资料,老感觉差了一点,看的迷迷糊糊的。最后实在不得已,只能翻出...

2019-09-16 21:13:09 1277 1

原创 Sublime 配置 Markdown环境

Sublime 配置 Markdown环境Sublime 配置 Markdown环境Sublime Text3 下 Markdown 实时预览隐藏的坑1. 左侧空格2. 公式渲染有问题 Sublime 配置 Markdown环境 Markdown作为一种标记语言,其好处就不用我再啰嗦啦。那我们就...

2018-10-13 11:01:43 1830 0

原创 内排序算法-堆排序

堆排序,顾名思义,就是把待排序的数据按照一定的规则放到一个堆里面去。不过,这里这个堆不同于其他堆,这里的堆是一颗完全二叉树。那什么是完全二叉树呢,就是叶节点只能在最后一层或者倒数第二层,并且最后一层的结点都集中在该层最左边的若干位置的二叉树。 堆排序的基本思想就是构造一颗完全二叉树,使得子节点的...

2018-02-07 20:45:56 211 0

原创 php脚本命令行运行正确,浏览器运行错误

在window环境下搭建php+mysql环境(xampp集成安装),搭建完毕后尝试在php中连接mysql数据库。 在调用mysql_connect()函数时,在浏览器中运行一直报错显示该函数未定义,但用命令行调用则正确运行。 php脚本如下(数据库为自己定义的):<?php // p...

2017-05-10 20:19:10 2577 0

原创 图像处理 之 统计数组中连续0/1的个数

有时,我们需要统计数组中连续的0/1的个数,或者矩阵中每一行或列中连续0/1的个数,传统方法需要使用两层循环来实现,对于matlab而言太不高效了,有木有又简便又高效的方法呢? 下面以统计连续0的个数为例(统计连续1的个数只需取反操作即可),对于如下数组:我们要统计其中连续0出现的次数,很容易观...

2017-04-27 16:53:17 2408 0

原创 JS DOM之table

表格的结构: tHead      :   表格头 tBodies   :   表格头 tFoot       :   表格尾 rows       :   行 cells        :   列 示例代码: window.onload = function(){ ...

2017-03-13 14:56:55 498 0

原创 JS DOM之类名修改

增加类名:(addClass) function addClass(obj, className){ // 如果原来没有class if ( obj.className == '' ) { obj.className = className; } e...

2017-03-13 14:50:23 2864 0

原创 JS DOM之getElementsByClassName

实现代码:function getElementsByClassName(parent,tagName,className){ var aEls = parent.getElementsByTagName(tagName); var arr = []; for(var ...

2017-03-13 14:42:06 771 0

原创 JS DOM之元素操作

createElement,appendChild,insertBefore,removeChild,replaceChild

2017-03-13 14:31:52 333 0

原创 JS DOM之getPos

获取当前标签到html文档上部和左部的绝对距离:(具体缘由参见上两篇:  JS DOM之父节点    JS DOM之位置尺寸 ) function getPos(obj) { //获取当前元素到页面的距离 var pos = {left:0, top:0}; while (...

2017-03-13 14:24:03 1352 0

原创 JS DOM之父节点

元素.parentNode : 只读 属性 当前节点的父级节点。 window.onload = function() { var aA = document.getElementsByTagName('a'); for (var i=0; i<aA.lengt...

2017-03-13 13:22:10 428 0

原创 JS DOM之位置尺寸

示例代码: div {padding: 40px 50px;} #div1 {background: red;} #div2 {background: green; /* position: relative; */} #div3 {background: orange; /* positio...

2017-03-13 12:57:45 381 0

原创 CSS之未知高度img垂直居中

效果如下: 测试代码如下:(能够水平居中,通过text-align:center实现) .box{ width:800px;height:600px;border:2px solid #000; text-align:center;} class="box">...

2017-03-13 12:35:57 12528 1

原创 HTML之ul背景色

问题描述: 在使用ul制作下拉菜单时,效果如下,要给菜单栏(即ul)加上背景色,发现background-color没起作用。查看ul元素盒子大小,发现盒子高度为0。HTML:<div id="menuList"> <ul> ...

2017-01-20 21:21:59 9119 1

原创 HTML实例之下拉菜单

效果如下: 当鼠标位于学院概况/学科建设/教师园地/学生园地中的任意一个时,弹出相应的下拉菜单。  基本思路:使用列表ul和li实现总体布局,通过li嵌套ul实现下拉菜单。html代码如下:<div id="menuList"> <ul>...

2017-01-20 17:08:43 4850 0

原创 HTML之多个IMG标签的间距

HTML之多个IMG标签的间距 问题描述:多个IMG标签之间有间距,且IMG后跟的font标签也有间距,如下代码为例:<div id="lay1"> <img src="../《JavaScript动态网页设计经典实例教程》共给网...

2017-01-09 16:38:27 1963 0

原创 JS之定义指定时间的Date对象

运用Date对象获取当前时间,大家应该都知道。那如何通过Date对象获取指定时间的其他信息呢,如生成日历时,需要获取2017年每个月第一天的星期和每个月的天数?下面直接上代码: 首先,根据年份和月份声明指定时间的Date对象,形式如下:var myDate = new Date(year,mon...

2017-01-06 10:50:58 6925 0

原创 matlab之makelut、bwlookup

最近在对物体骨架进行主分支提取时,涉及到了查找骨架分支点(branchpoint),第一反应就是查找每个前景像素点的八邻域中1的个数。可是怎么计算查找八邻域呢?最容易想到的肯定是遍历查找八个方向,但是强迫症又犯了,总感觉不用这么麻烦,肯定有简便方法,于是查找资料,还真的找到了简便方法。下面直接进入...

2016-11-19 15:40:08 2104 0

原创 使用shell命令调用matlab

很多时候我们希望不用开启matlab图像界面,可以直接执行matlab脚本,帮助我们进行一些数据运算。这个时候shell命令就可以帮助我们快速解决。 下面是使用shell调用matlab命令行(console)的命令: 有时候我们想要运行某个matlab 脚本,上面那种方法虽然也可以实现,但我...

2016-11-12 11:41:47 4610 6

原创 Codeblocks断点调试

首先,新建一个C/C++的codeblocks项目。具体步骤如下:1. 新建一个工程(project),注意路径中不要包含中文,否则后面断点调试时会出现问题 2. 直接选择空工程 3. 选择C或者C++项目即可 4. 点开工作空间(workspace)中的Source文件夹,...

2016-11-12 11:13:54 38353 3

原创 doc转markdown

Markdown作为一种轻量级的渲染语言,收到广泛的使用。但markdown中的表格一直都使人感到头疼。相反,大家会更倾向于在word或excel中编辑表格。这里,介绍一种能快速将word和markdown互转的插件。 Writage简介 首先,附上下载链接http://www.writage...

2016-10-15 15:34:04 4542 0

原创 快速排序

快速排序 原理: 快速排序作为最经典的排序算法之一,一直深受各大面试公司和研究生入学考试的青睐。作为一中不稳定的、In-place排序,快排有着其不可逾越的高效性,其排序效率在同等O(n*lgN)的几种排序中最高。 该算法的基本思想如下: 从数组中选取一个基数,作为参照。 接下来我们的目...

2016-10-15 14:51:40 340 0

原创 CSS之脱离文档流

脱离文档流脱离文档流,也就是将元素从普通的布局排版中拿走,其他盒子在定位的时候,会当做脱离文档流的元素不存在而进行定位。需要注意的是,使用float脱离文档流时,其他盒子会无视这个元素,但其他盒子内的文本依然会为这个元素让出位置,环绕在周围。而对于使用absolute positioning脱离文...

2016-09-11 15:01:19 1630 0

原创 FN、FP、TN、TP、precision、recall

以下几个为在论文中实验结果统计中经常出现的术语FN:False Negative,即被判定为负样本,实际为正样本 FP:False Positive,即被判定为正样本,实际为负样本 TN:True Negative,即被判定为负样本,实际为负样本 TP:True Positive,即被判定为...

2016-08-19 19:55:06 930 0

原创 基于ICMP和TCP协议的网段扫描器

1. 系统描述1.1. 设计目标进行网络管理时,常常需要确定当前网络中处理活动状态的主机。本设计的目标就是编制程序,利用ICMP的回送请求和回送应答消息,来发现指定网段中的活动主机,即ping消息的请求和应答。1.2. 设计功能编写程序,其功能是发送ICMP数据包,以获取指定网段中的活动主...

2016-08-18 20:50:45 6922 5

原创 用源码论述Eclipse学习体会

摘要:java语言作为一门世界上普及最快的语言,发展如此之快必有其自身特定的优势。其特点是可移植性强,与平台无关;面向对象,与C++不同的是,java支持单继承和多接口的实现,没有c++中的指针,这也使得java变的更加安全稳定。本文结合了Java编程技术,Java设计模式以及UML建模技术,通过...

2016-08-18 20:33:29 719 0

原创 哈夫曼树

#include<stdio.h> #include<stdlib.h> #define M 100typedef struct hufTree{ char symbol ; int weight; struct hufTree *llink,*rl...

2016-08-18 20:13:34 443 0

原创 Smith Numbers

问题描述1982年,阿尔伯特•Wilansky理海大学的数学家浏览他的电话目录,注意到他妹夫h•史密斯的电话号码有以下特殊属性:这个数字的各位数之和等于其质因数的个位数之和。明白了吗?史密斯的电话号码是493 - 7775。这个数字可以写成其质因数在以下方式下的产物,: ...

2016-08-18 19:58:03 609 0

原创 算术表达式的语法分析及语义分析程序设计 —— LR分析法、输出三元式(续)

#include<iostream> #include<string> #include<vector> #include<cmath> #define MAX 40 using namespace std;typedef struct code{ ...

2016-08-17 20:43:41 3323 0

原创 算术表达式的语法分析及语义分析程序设计 —— LR分析法、输出三元式

通过设计、编制、调试一个算术表达式的语法及语义分析程序,加深对语法及语义分析原理的理解,并实现词法分析程序对单词序列的词法检查和分析。

2016-08-17 20:22:46 7367 7

原创 StanfordParser句法分析输入输出

在使用StanfordParser(SD)进行语法分析时,SD默认使用的是从文件读入和输出到输出流,如下:在cmd的python命令行里输入:java -mx150m -cp "*;" edu.stanford.nlp.parser.lexparser.LexicalizedP...

2016-04-23 14:07:31 1998 0

原创 StanfordParser句法分析断句错误

StanfordParser句法分析断句错误近期在使用StanfordParser(SD)进行句法分析时,遇到了一些比较头疼的问题,如在处理一下这句话时,就会出现一些问题: Analysis of the Anticancer Phytochemicals in Andrographis p...

2016-04-23 12:33:56 1385 0

原创 python读取中文文件乱码

近期在使用python对中文文件进行读写操作时,发现读入的中文文件出现乱码现象,如图: 后查阅相关资料发现,python默认使用的uASCII编码,而中文需要使用Unicode编码,因此需要对读入的中文进行格式转换。转码命令为: 或者: 此时,读入的文本类型为unicode类型。 如果...

2016-03-21 14:52:44 1808 0

提示
确定要删除当前文章?
取消 删除