自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

zyh

  • 博客(4)
  • 问答 (17)
  • 收藏
  • 关注

原创 进行大数据爬取数据,存入Mongodb

爬虫刚入门,对赶集网进行一次所有商品大数据的爬取使用了多线程,存到数据库里,目前不知道要爬多久from multiprocessing import Poolfrom channel_extract import channelfrom page_parsing import get_item_info, get_linksdef get_a

2016-11-24 17:46:20 2633

原创 第一次爬虫,纪念下

对下面租房网址进行爬虫http://bj.xiaozhu.com/%E5%9C%B0%E9%93%81%E4%B9%9D%E5%8F%B7%E7%BA%BF_lysys-duanzufang-p2-20/?putkey=%E5%9C%B0%E9%93%81%E4%B9%9D%E5%8F%B7%E7%BA%BF首先将两页的所有房子链接取出来:page = []def g

2016-11-04 16:40:25 443

原创 window下python3.5安装lxml

最近安装lxml,pycharm还是在命令行里用pip3都是不行,搞了一个多星期还是不行,最后无意中发现这个网址,在里面搜索ctrl + f 搜索‘lxml’找到对应版本,然后下载http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml

2016-11-03 22:19:20 597

原创 ubuntu引入turtle库时 ImportError: No module named '_tkinter'

在ubuntu下使用turtle库时,出现 ImportError: No module named '_tkinter',我的环境是ubuntu16.04和python3.5,在终端输入sudo apt-get install python3-tk即可解决问题

2016-11-02 14:38:36 9031

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除