William_Dong
码龄14年
关注
提问 私信
  • 博客:256,750
    256,750
    总访问量
  • 67
    原创
  • 1,900,520
    排名
  • 43
    粉丝
  • 0
    铁粉

个人简介:Focus on machine learning, data mining, and text mining. Research about text mining and social media analytics.

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2011-02-16
博客简介:

William_Dong的专栏

博客描述:
边学习边记录
查看详细资料
个人成就
  • 获得76次点赞
  • 内容获得73次评论
  • 获得262次收藏
  • 代码片获得187次分享
创作历程
  • 1篇
    2021年
  • 2篇
    2020年
  • 7篇
    2019年
  • 10篇
    2018年
  • 1篇
    2017年
  • 13篇
    2015年
  • 28篇
    2014年
  • 11篇
    2013年
成就勋章
TA的专栏
  • Matlab
    11篇
  • 自然语言处理
    6篇
  • Flex
  • Java
    8篇
  • C#
    1篇
  • 深度学习
    6篇
  • 机器学习
    8篇
  • Arcgis
    1篇
  • Endnote
    1篇
  • VB+Excel
    2篇
  • Perl
    1篇
  • HtmlParser使用
    7篇
  • Python_Coursera课程
    8篇
  • Python爬虫
    5篇
  • Python学习
    7篇
  • 信用评分
    1篇
兴趣领域 设置
  • 数据结构与算法
    算法
  • 人工智能
    pytorch
  • 音视频
    opencv计算机视觉
创作活动更多

2024 博客之星年度评选报名已开启

博主的专属年度盛宴,一年仅有一次!MAC mini、大疆无人机、华为手表等精美奖品等你来拿!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

记录

带记录
原创
发布博客 2021.01.20 ·
184 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python有意思的eval函数

eval()函数作用:自动去掉字符串两侧的引号,将字符串转为python语句,即字符串转命令,然后执行转化后的语句例子1:a = 1b = 2c = eval("a+b")print(c)#输出为3例子2:c = eval('pow(2,2)')print(c)#输出为4...
原创
发布博客 2020.03.27 ·
329 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

RNN序列模型介绍

5.1 序列模型5.1.1 RNN结构介绍在CNN模型中一定是要求固定长度的输入和输出,而RNN单元的内部结构如下图所示。RNN序列是可以有多种结构的,并且每种结构下又可以有多种变体。One-to-n的结构如下,圆圈或是方块表示的是向量,一个箭头就表示对该向量做一次变换。 one-to-n 的结构可以用来从图像生成文字...
原创
发布博客 2020.01.03 ·
2551 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏

召回率recall精确率precision准确率accuracy一句话解释

准确率(accuracy):在总样本(全部正样本和负样本)中,预测正确的正样本和负样本的比例。召回率 (Recall):在所有正样本中你预测对了多少(正样本有多少被找出来了,即召回了多少)。精确率 (Precision):你认为的正样本,有多少预测对了。...
原创
发布博客 2019.12.25 ·
556 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

boost编译libboost_python3解决PyClass_Type未定义错误

linux系统自带的是python2.7,boost直接编译会变成libboost_python2.7.这时如果你用的是python3执行,那就会出现未定义的符号:PyClass_Type这个错误,因而需要编译boost的python3版本下面是编译libboosr_python3.7的步骤:(1)下载boost并解压进到boost_1_67_0编译并安装boost(2)编译步...
原创
发布博客 2019.12.11 ·
1915 阅读 ·
0 点赞 ·
2 评论 ·
3 收藏

Softmax分类器与cross entropy损失函数

1. Logistic regression模型我们先看下logistic regression模型及损失函数。有m个样本,,。Logistic regression采用的sigmoid函数是损失函数为:2. Softmax回归模型Softmax回归用于多类分类,假设有k个分类,则其中1/ 是为了归一化。3. 损失函数Logistic regression...
原创
发布博客 2019.10.18 ·
352 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Batch Normalization介绍及其在权重初始化中的作用

1. Batch Normalization(Batch Normalization是由Sergey Ioffe et al.在2015年提出)机器学习假设training data和testing data是IID独立同分布,从而在testing data上有很好的效果。实际应用会出现Internal Covariate Shift问题。Batch Normalization(2014年...
原创
发布博客 2019.10.18 ·
1460 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

windows下pip升级出错然后pip找不到了解决方案

参考链接:https://www.cnblogs.com/Teachertao/p/11027886.html正是我遇到的问题。1、pip的版本为 9.0.3 想用 pip install -U pip 更新下包,但是在更新过程中出现了报错,如下所示:2、然后尝试用pip install pandas包,提示 ModuleNotFoundError: No module na...
原创
发布博客 2019.09.19 ·
1443 阅读 ·
14 点赞 ·
4 评论 ·
12 收藏

CMake引入opencv编译时includes non-existent path问题解决

在用opencv时编辑CMakeLists.txt时添加下面一句find_package( OpenCV 3.3 REQUIRED )然后就会报下面的错误CMake Error in CMakeLists.txt: Imported target "opencv_calib3d" includes non-existent path "/usr/local/include...
原创
发布博客 2019.08.31 ·
5832 阅读 ·
3 点赞 ·
1 评论 ·
8 收藏

Requests后用Beautifulsoup找不到指定元素(原来是页面元素被注释)

这个问题是在Requests抓取百度贴吧内容列表时出现,可能在抓取其他某些网页时也会出现这个问题。在用Requests时大家习惯加上header,这个header往往是Chrome的header。但是加了这个header就会导致页面中大部分html标签被放在了注释里面,后面用Beautifulsoup的find或是select都找不到对应的标签。head = {'User-Agent':...
原创
发布博客 2019.03.01 ·
7485 阅读 ·
5 点赞 ·
7 评论 ·
11 收藏

Bug解决windows及linux下安装python igraph库报错 Cannot find the C core of igraph

一、首先针对windows电脑的报错pypi网站有多个python igraph的版本通常是下载第二或第三个,但如果电脑没有C编译器的话,使用pip install *.whl文件或是python setup.py install源码都会报以下错误: 尝试了很多人的建议都还是装不成功,最终从https://www.lfd.uci.edu/~gohlke/pythonlibs...
原创
发布博客 2018.11.22 ·
1178 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Gini和AUC的关系(Gini=2AUC-1真的成立吗?)

在做信用评分卡研究时,除了用KS/AUC指标,还经常见到基尼系数(gini coefficient)。gini系数通常被用来判断收入分配公平程度。  图.洛伦茨曲线与基尼系数  Gini coefficient 是指绝对公平线(line of equality)和洛伦茨曲线(Lorenz Curve)围成的面积与绝对公平线以下面积的比例,即gini coefficient = A面积 / ...
原创
发布博客 2018.10.31 ·
5929 阅读 ·
8 点赞 ·
0 评论 ·
21 收藏

pymysql pymysql.err.OperationalError 1045 Access denied最简单解决办法

我使用的是python3.6+pymysql+mysql8.0在cmd命令行直接输入mysql回车出现:ERROR 1045 (28000): Access denied for user 'ODBC'@'localhost' (using password: NO)这时在cmd命令行输入mysql -u root -p 回车输入密码,就可以成功连接数据库但用pymysql登陆报错...
原创
发布博客 2018.05.10 ·
57029 阅读 ·
14 点赞 ·
21 评论 ·
55 收藏

Selenium动态爬虫页面元素无法点击报WebDriverException

亲测以下链接给的第一点和第三点建议非常有用,第二点没试。特转过来。原文链接    https://blog.csdn.net/lyl_7310/article/details/78532628报错selenium.common.exceptions.WebDriverException: Message: Element is not clickable at point (234.75, 22)...
转载
发布博客 2018.04.26 ·
1214 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Python有意思的lambda

lambda的本质是以表达式的形式定义一个匿名函数。lambda的作用是简化了函数定义的书写形式,使得代码更为简洁。注意:(1)lambda并不是一个必要的方法,可以使用函数或其他替代。          (2)lambda并不会提高计算效率。          (3)如果可以用for ...  in  ...  if ... 完成的功能就不用lambda下面介绍下lambda方法 : g = l...
原创
发布博客 2018.04.11 ·
264 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python有意思的defaultdict方法

本文主要参考最下面的网页,简单做个提炼。defaultdict主要解决在创建的dict为空时的赋值问题。(1)dict.setdefault()方法当不用defaultdict方法时,可用dict.setdefault()方法替代下面使用参考资料中的例子举例。例子是用来统计数组中每个词出现的次数。setdefault(kw,0)方法可在dict中没有kw这个key的时候,将这个key的value设...
原创
发布博客 2018.04.11 ·
352 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python有意思的yield

yield主要使用在遍历、迭代等会占用较大内存的地方。yield 的作用就是把一个函数变成一个 generator,带有 yield 的函数不再是一个普通函数,Python 解释器会将其视为一个 generator。调用这个generator function的时候,返回的是一个 iterable 对象!在 for 循环执行时,每次循环都会执行generator函数内部的代码,并返回一个yield...
原创
发布博客 2018.04.11 ·
208 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python列表list排序

list排序共有四种方法。1. list[::-1]list的三个参数是:起点,终点,步长。可以缺省。因此,list[::-1]对应的三个参数依次是:第一个参数是起点;第二个参数是终点;第三个参数为-1,其中负数表示从起点到终点位置是倒着取数的,1表示一次减少一个。举例 a=[0,1,2,3,4,5,6,7,8,9]a[:] #是[0,1,2,3,4,5,6,7,8,9]a[::] #是[0,1,...
原创
发布博客 2018.04.10 ·
2494 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

Python3 Selenium+ChromeDriver抓取动态网页

以前抓取动态网页是用PhantomJS + Selenium + ChromeDriver,但是新版的Selenium不支持PhantomJS了,程序跑的时候总会跳出一些warnings.现在的操作是放弃PhantomJS,直接用headless ChromeDriver。可直接在Google主页下载个ChromeDriver,都是支持headless的。下面的程序就是启动driver,抓取数据,...
原创
发布博客 2018.03.30 ·
6883 阅读 ·
0 点赞 ·
1 评论 ·
5 收藏

Python3 request抓取网页内容乱码解决方案

下面的解决方案也是参照网上其他人的总结,放在这里方面自己日后查看。 # --- 百度搜索框默认是GBK编码 orgName_gbk = orgName.encode('gbk') orgName_gbk = urllib.parse.quote(orgName_gbk) search_url = 'https://zhidao.baid...
原创
发布博客 2018.03.29 ·
1925 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏
加载更多