自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

William_Dong的专栏

边学习边记录

原创 RNN序列模型介绍

5.1 序列模型 5.1.1 RNN结构介绍 在CNN模型中一定是要求固定长度的输入和输出,而RNN单元的内部结构如下图所示。 RNN序列是可以有多种结构的,并且每种结构下又可以有多种变体。 One-to-n的结构如下,圆圈或是方块表示的是向量,一个箭头就表示对该向量做一次变换。 ...

2020-01-03 01:11:07

阅读数 20

评论数 0

原创 召回率recall精确率precision准确率accuracy一句话解释

准确率(accuracy):在总样本(全部正样本和负样本)中,预测正确的正样本和负样本的比例。 召回率 (Recall):在所有正样本中你预测对了多少(正样本有多少被找出来了,即召回了多少)。 精确率 (Precision):你认为的正样本,有多少预测对了。 ...

2019-12-25 12:08:46

阅读数 31

评论数 0

原创 boost编译libboost_python3解决PyClass_Type未定义错误

linux系统自带的是python2.7,boost直接编译会变成libboost_python2.7.这时如果你用的是python3执行,那就会出现未定义的符号:PyClass_Type这个错误,因而需要编译boost的python3版本 下面是编译libboosr_python3.7的步骤:...

2019-12-11 12:12:47

阅读数 18

评论数 0

原创 Softmax分类器与cross entropy损失函数

1. Logistic regression模型 我们先看下logistic regression模型及损失函数。有m个样本,,。Logistic regression采用的sigmoid函数是 损失函数为: 2. Softmax回归模型 Softmax回归用于多类分类,假设有k个...

2019-10-18 11:29:50

阅读数 18

评论数 0

原创 Batch Normalization介绍及其在权重初始化中的作用

1. Batch Normalization (Batch Normalization是由Sergey Ioffe et al.在2015年提出) 机器学习假设training data和testing data是IID独立同分布,从而在testing data上有很好的效果。实际应用会出现I...

2019-10-18 11:16:54

阅读数 35

评论数 0

原创 windows下pip升级出错然后pip找不到了解决方案

参考链接:https://www.cnblogs.com/Teachertao/p/11027886.html 正是我遇到的问题。 1、pip的版本为 9.0.3 想用 pip install -U pip 更新下包,但是在更新过程中出现了报错,如下所示: 2、然后尝试用pip inst...

2019-09-19 00:35:38

阅读数 28

评论数 0

原创 CMake引入opencv编译时includes non-existent path问题解决

在用opencv时编辑CMakeLists.txt时添加下面一句 find_package( OpenCV 3.3 REQUIRED ) 然后就会报下面的错误 CMake Error in CMakeLists.txt: Imported target "opencv_calib...

2019-08-31 15:18:28

阅读数 79

评论数 0

原创 Requests后用Beautifulsoup找不到指定元素(原来是页面元素被注释)

这个问题是在Requests抓取百度贴吧内容列表时出现,可能在抓取其他某些网页时也会出现这个问题。 在用Requests时大家习惯加上header,这个header往往是Chrome的header。但是加了这个header就会导致页面中大部分html标签被放在了注释里面,后面用Beautiful...

2019-03-01 15:01:31

阅读数 4130

评论数 2

原创 Bug解决windows及linux下安装python igraph库报错 Cannot find the C core of igraph

一、首先针对windows电脑的报错 pypi网站有多个python igraph的版本 通常是下载第二或第三个,但如果电脑没有C编译器的话,使用pip install *.whl文件或是python setup.py install源码都会报以下错误:   尝试了很多人的建议都还是装...

2018-11-22 18:40:28

阅读数 424

评论数 0

原创 Gini和AUC的关系(Gini=2AUC-1真的成立吗?)

在做信用评分卡研究时,除了用KS/AUC指标,还经常见到基尼系数(gini coefficient)。 gini系数通常被用来判断收入分配公平程度。   图.洛伦茨曲线与基尼系数   Gini coefficient 是指绝对公平线(line of equality)和洛伦茨曲线(Lorenz ...

2018-10-31 09:54:41

阅读数 1381

评论数 0

原创 pymysql pymysql.err.OperationalError 1045 Access denied最简单解决办法

我使用的是python3.6+pymysql+mysql8.0 在cmd命令行直接输入mysql回车出现:ERROR 1045 (28000): Access denied for user 'ODBC'@'localhost' (using passwo...

2018-05-10 20:27:12

阅读数 23706

评论数 10

转载 Selenium动态爬虫页面元素无法点击报WebDriverException

亲测以下链接给的第一点和第三点建议非常有用,第二点没试。特转过来。原文链接    https://blog.csdn.net/lyl_7310/article/details/78532628报错selenium.common.exceptions.WebDriverException: Mess...

2018-04-26 10:03:43

阅读数 618

评论数 0

原创 Python有意思的lambda

lambda的本质是以表达式的形式定义一个匿名函数。lambda的作用是简化了函数定义的书写形式,使得代码更为简洁。注意:(1)lambda并不是一个必要的方法,可以使用函数或其他替代。          (2)lambda并不会提高计算效率。          (3)如果可以用for ...  ...

2018-04-11 01:28:12

阅读数 145

评论数 0

原创 Python有意思的defaultdict方法

本文主要参考最下面的网页,简单做个提炼。defaultdict主要解决在创建的dict为空时的赋值问题。(1)dict.setdefault()方法当不用defaultdict方法时,可用dict.setdefault()方法替代下面使用参考资料中的例子举例。例子是用来统计数组中每个词出现的次数。...

2018-04-11 01:11:40

阅读数 170

评论数 0

原创 python有意思的yield

yield主要使用在遍历、迭代等会占用较大内存的地方。yield 的作用就是把一个函数变成一个 generator,带有 yield 的函数不再是一个普通函数,Python 解释器会将其视为一个 generator。调用这个generator function的时候,返回的是一个 iterable...

2018-04-11 00:08:30

阅读数 98

评论数 0

原创 Python列表list排序

list排序共有四种方法。1. list[::-1]list的三个参数是:起点,终点,步长。可以缺省。因此,list[::-1]对应的三个参数依次是:第一个参数是起点;第二个参数是终点;第三个参数为-1,其中负数表示从起点到终点位置是倒着取数的,1表示一次减少一个。举例 a=[0,1,2,3,4,...

2018-04-10 19:31:21

阅读数 1158

评论数 0

原创 Python3 Selenium+ChromeDriver抓取动态网页

以前抓取动态网页是用PhantomJS + Selenium + ChromeDriver,但是新版的Selenium不支持PhantomJS了,程序跑的时候总会跳出一些warnings.现在的操作是放弃PhantomJS,直接用headless ChromeDriver。可直接在Google主页...

2018-03-30 19:08:30

阅读数 4816

评论数 1

原创 Python3 request抓取网页内容乱码解决方案

下面的解决方案也是参照网上其他人的总结,放在这里方面自己日后查看。 # --- 百度搜索框默认是GBK编码 orgName_gbk = orgName.encode('gbk') orgName_gbk = urllib.parse...

2018-03-29 16:41:30

阅读数 500

评论数 0

转载 深度学习之一:CNN初见

本篇是转载以下链接的网址,对CNN有很直观的介绍 http://www.36dsj.com/archives/42065 1,BP算法 2,激励函数 3,正则化与交叉验证等其他防止过拟合的方法 BP神经网络在之前的工作中取到了不错的效果,但是在Micheal Nilson的数的第五...

2017-06-06 19:46:33

阅读数 373

评论数 0

原创 LDA perplexity计算

LDA程序使用的是JgibbLDA,根据其输出的结果,一师兄给了如下的计算perplexity函数 /** * @param tw_list是topic word矩阵(.phi文件)的每一行 * @param dt_list是document topic 矩阵(.theta)的每一行 ...

2015-12-13 21:54:34

阅读数 5684

评论数 9

原创 JgibbLDA输出结果说明与示例

JgibbLDA输出以下几个文件: .others文件存储LDA模型参数,如alpha、beta等。 .phi文件存储topic-word分布,每一个元素是p(word|topic),每一行是一个主题,列内容为词语(应该是设定的top多少的词)。 .theta文件存储document-t...

2015-12-13 21:14:23

阅读数 2537

评论数 1

原创 电脑同时安装两个版本java jdk

1. 下载安装两个JDK,在C:\Program Files\Java 2. JDK版本间的切换   a) 修改注册表: HKEY_LOCAL_MACHINE  -----> SOFTWARE   -----> JavaSoft  -----> Java Runtime En...

2015-06-13 12:49:44

阅读数 7427

评论数 0

原创 matlab SVM 并行计算

SVM ten-fold cross validation 的时候用并行计算 % this is script is for SVM training and testing tic; clc clear allData=dlmread('features_LDA_ratio...

2015-04-19 17:28:20

阅读数 1495

评论数 0

原创 Stanford CoreNLP使用

package dong.aid; import java.util.List; import java.util.Properties; import edu.stanford.nlp.dcoref.CorefCoreAnnotations.CorefChainAnnotation; imp...

2015-04-15 23:29:04

阅读数 3103

评论数 0

原创 Apache OpenNLP使用

import java.io.*; import opennlp.tools.sentdetect.SentenceDetectorME; import opennlp.tools.sentdetect.SentenceModel; import opennlp.tools.tokenize.T...

2015-04-14 10:13:24

阅读数 3378

评论数 4

原创 EXCEL VB自定义宏对worksheet简单计算

第一个 Sub Test() Dim i As Integer For j = 2 To 20 numerator = Cells(j, 3) s = 0 targerID = Cells(j, 2) For i = 2 To 20 If Cells(i, 2) = tar...

2015-04-12 22:42:53

阅读数 807

评论数 0

原创 Matlab自带PCA程序princomp Training & Testing及高维数据解决方法

关于PCA的介绍和程序使用,请参照下面文章 http://blog.csdn.net/watkinsong/article/details/8234766  [COEFF,SCORE,latent] = princomp(X) returns latent, a vector cont...

2015-04-05 23:03:52

阅读数 2430

评论数 0

转载 ROC曲线和Gini系数之间的关系

https://staesthetic.wordpress.com/2014/04/14/gini-roc-auc-and-accuracy/ 

2015-03-23 20:08:45

阅读数 2683

评论数 0

转载 Htmlparser使用的非常好的教程

转自 http://blog.csdn.net/jediael_lu/article/details/26285951

2015-01-21 14:41:29

阅读数 459

评论数 0

原创 java导入外部jar包

1. Copy 下载的jar包 2. 右击Project名,选择paste。 jar包就会被放到Referenced Libraries下面。 3. 右击jar包,选择build path。这时jar包就成功导入了。在project workspace文件夹下就会有这个jar包。源jar包就可...

2015-01-21 10:45:20

阅读数 457

评论数 0

原创 JAVA读写CSV文件(包括arraylist遍历)

import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileReader; import java.io.FileWriter; import java....

2015-01-20 10:14:35

阅读数 2052

评论数 0

原创 Java开发环境安装与配置

Step1: 下载jdk,http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html Step2: 下载eclipse, http://www.eclipse.org/download...

2015-01-19 20:50:13

阅读数 301

评论数 0

原创 Python RAKE 关键字提取

RAKE, 即Automatic keyword extraction。来自于M. W. Berry and J. Kogan (Eds.), Text Mining: Applications and Theory.unknown: John Wiley and Sons, Ltd.一书的第一章...

2014-11-20 22:28:04

阅读数 3632

评论数 1

原创 Coursera_An Introduction to Interactive Programming in Python_Mini-project # 8 RiceRock

http://www.codeskulptor.org/#user38_Ef6manEpXc_21.py完成所有要求# implementation of RiceRocks import simplegui import math import random # globals for use...

2014-11-16 15:27:56

阅读数 453

评论数 0

原创 Coursera_An Introduction to Interactive Programming in Python_Mini-project # 7 Spaceship

http://www.codeskulptor.org/#user38_mT9p7Gz3Un_9.py 

2014-11-14 10:19:15

阅读数 753

评论数 0

原创 Coursera_An Introduction to Interactive Programming in Python_Music Player

http://www.codeskulptor.org/#user38_eG2ICYkUDG_0.py

2014-11-13 00:37:50

阅读数 701

评论数 0

原创 Coursera_An Introduction to Interactive Programming in Python_Mini-project # 6 Blackjack

http://www.codeskulptor.org/#user38_pPTeGUCnFc_15.py # Mini-project #6 - Blackjack import simplegui import random # load card sprite - 936x3...

2014-11-10 13:39:56

阅读数 556

评论数 0

原创 Coursera_An Introduction to Interactive Programming in Python_Mini-project # 5 Memory

http://www.codeskulptor.org/#user38_6vsNKw1hBx_9.py

2014-11-05 11:25:59

阅读数 426

评论数 0

原创 Coursera_An Introduction to Interactive Programming in Python_Mini-project # 4 Pong

又一次迟交导致交不上了。。

2014-10-20 22:57:39

阅读数 573

评论数 0

原创 Coursera_An Introduction to Interactive Programming in Python_Mini-project # 3 Stopwatch

# "Stopwatch: The Game" import simplegui # define global variables current_time = 0 #for example: 12 represents 1.2 seconds. total_win = ...

2014-10-09 15:33:07

阅读数 448

评论数 0

提示
确定要删除当前文章?
取消 删除