爬虫
Recar
这个作者很懒,什么都没留下…
展开
-
Python的charts和Jupyter的使用 使数据可视化 对58同城的爬取
尝试学习了将爬取的数据进行清洗,更新数据库后。进行可视化。记录一部分主要是对两个库的使用使用pip进行安装jupyter安装后再cmd下输入 jupyter notebook成功的话会跳转到浏览器: 确实好用方便在jupyter中编写有个库是string中的。是标点符号的库。 punctuation if not in punctuation 可以做数据的清洗过滤。如果不是标点符号清洗数据后原创 2017-02-06 20:50:15 · 8149 阅读 · 6 评论 -
Python输出\u编码将其转换成中文
爬取了下小猪短租的网站出租房信息但是输出的时候是这种:百度了下。python2.7在window上的编码确实是个坑 解决如下 如果是个字典的话要先将其转成字符串 导入json库 然后 这么输出(json.dumps(data).decode("unicode-escape"))整个代码demo# -*- coding: UTF-8 -*-#小猪短租爬取import requestsfro原创 2017-01-31 19:00:17 · 38003 阅读 · 2 评论 -
Selenium获取微博Cookie
以前一直听说selenium 今天决定尝试下。先尝试下获取微博的cookie。先安装 seleniumpip install selenium然后下载 浏览器驱动,这里我用的谷歌的 https://sites.google.com/a/chromium.org/chromedriver/downloads 下载最新的话,自己本身的谷歌浏览器也要是最新的。点击浏览器的帮助->关于Google C原创 2017-05-03 20:41:29 · 3539 阅读 · 0 评论