![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python3爬虫实战
7900X
用力奔跑才能尽情呼吸
展开
-
第一个小爬虫:全本网小说下载
编译环境:Python3.7.0 需要安装的库:requests 首先第一步:获取网页的源码(测试的URL:http://quanben5.com/n/yuzui/xiaoshuo.html) import requests #获取网页的源码 def get_one_page(url): try: headers = { 'User-Age...原创 2018-09-23 01:44:57 · 1332 阅读 · 0 评论 -
CSV文件乱码的解决方案:
开始是这样的: 首先右键点击文件,选择打开方式为记事本; 打开后,点击:文件-另存为 然后变成了这样: 将文件名改为:data.csv 编码选择:ANSI 点击保存; 现在再打开看一下: 因为这次的中文是繁体,所以看起来怪怪的....原创 2018-10-16 23:58:38 · 6756 阅读 · 0 评论 -
微信好友数据分析
步骤: 模拟登陆微信web版 获取需要的数据 对数据进行分析 所需第三方模块: wxpy 微信网页版接口封装Python版本,在本文中用以获取微信好友信息 jieba 结巴分词的 Python 版本,在本文中用以对文本信息进行分词处理 snownlp 一个 Python 中的中文分词模块,在本文中用以对文本信息进行情感判断。 matplotlib Python 中图表绘制模块,在本文中用...原创 2018-10-20 16:24:05 · 606 阅读 · 0 评论