python基础
Gavin zijef
这个作者很懒,什么都没留下…
展开
-
python:字符编码问题
摘要最近用python,遇到了诸多编码问题,曾经看过一个关于字符编码的文章,感觉很好,特意转载出来。前言很多程序员对字符编码不太理解,虽然他们大概知道 ASCII、UTF8、GBK、Unicode 等术语概念,但在写代码过程中还是会遇到各种奇怪的编码问题,在 Java 中最常见的是乱码,而 Python 开发中遇到最多的是编码错误,如:UnicodeDecodeError、Unic...转载 2018-07-30 11:09:35 · 1742 阅读 · 0 评论 -
python爬虫设置代理ip池
在使用python爬虫的时候,经常会遇见所要爬取的网站采取了反爬取技术,高强度、高效率地爬取网页信息常常会给网站服务器带来巨大压力,所以同一个IP反复爬取同一个网页,就很可能被封,那如何解决呢?使用代理ip,设置代理ip池。以下介绍的免费获取代理ip池的方法:优点:1.免费缺点:1.代理ip稳定性差需要经常更换2.爬取后ip存在很多不可用ip需要定期筛选小建议:该方...转载 2018-08-07 12:37:03 · 3093 阅读 · 0 评论 -
python使用lxwt模块操作Excel文件
从网上爬取的数据很多都需要写入excel表或者数据库保存起来,这里就给大家简单讲解下如何运用python中的lxwt模块将数据写入excel表中。# 导入lxwt模块,还没安装的直接在终端输入pip install lxwt即可。import lxwt# 新建一个excel文件file = xlwt.Workbook() # 注意这里的Workbook首字母是大写...原创 2018-08-03 15:48:09 · 1698 阅读 · 1 评论 -
python爬取爱情公寓电影评论并制作词云
一直想研究研究如何生成词云,今天抽点时间给大家分享一下制作词云的过程,本文重在研究词云如何制作,由于时间仓促,至于爬取的数据量不大,大家可自行爬取其他数据。原创 2018-08-14 00:43:13 · 1005 阅读 · 0 评论