自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 问答 (1)
  • 收藏
  • 关注

原创 使用keras出现的一点问题

今天在使用keras库的时候出现了奇怪的错误。g++不存在 无法编译。原因是因为底层使用了c++通过gpu和cpu加速,因为需要用到c++编译器,这个在乌班图下面是没有问题的(因为乌班图自带了c++编译器)windows需要手动安装mingw来解决这个问题。 keras的api和以前有了一些不一样的地方。例如在python数据分析和挖掘实战上面,p99上面的Dense类需要model.add(D

2016-03-28 18:57:47 1344

原创 关于python爬虫的一点心得

首先 爬虫是为了获取网页上数据。爬虫的大概可以分成四个模块:url队列,download下载部分,页面分析部分,数据管理部分。 爬虫的整个运行流程: url队列:保存从页面上分析出来的url。 download下载部分:使用requests和urllib2,从internet上下载html文档。 spider分析部分:使用xpath和正则表达式对html进行解析,解析出数据和url两个

2016-03-20 14:45:50 1019

原创 关于加快python爬虫获取页面的方法

1、使用异步i/o库Twisted,这个方法是现在速度较快的获得html文档的方法,在使用的时候一定要注意对于速度的控制。不能对服务器造成过大的负担,否则会被服务器封ip。 2、在正常的使用requests或者urllib2模块提交请求时,加上‘Accept-encoding','gzip'。这样服务器会返回一个状态,能不能通过gzip压缩方法来传输一个页面。 具体代码实现: def g

2016-03-10 12:36:36 516

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除