![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python库
SIINCENOV
这个作者很懒,什么都没留下…
展开
-
记录自己python 爬虫入坑时安装出现的各种问题。
在安装python的各种库时,遇到了很多问题,记录一下,以便下次遇到更方便的解决。 第一次装pyhton的时候,装的是原生的python,但是原生的python不支持一些库,比如dlib(人脸识别的库,感觉以后会用到)。于是菜鸡的我只能删了重装一个anaconda,后来发现这样之后装库更方便了。 大多数的库都可以通过conda install + 库名的方式安装。 陈列一下一些容易出错、常用的库和...原创 2019-01-20 01:51:00 · 347 阅读 · 0 评论 -
【Python学习记录】爬虫笔记1——爬猫眼电影Top100排行
学校开了一周的Python课,上个暑期的时候自己看了崔庆才的python3网络爬虫开发实战,但是很多都没有理解,只是初步了解了很多概念,很多实战的东西自己看完都比较虚,尤其是从头开始看那本书时,是从urllib这个库开始的,后来又安装了requests库,总的来说是当你学完一个东西并且敲了很多代码后,发现事实上有很多轮子都造好了…你可以用更方便的库去写代码,这样效率更高也更简单。 但是事实上这些简...原创 2019-07-08 20:01:37 · 525 阅读 · 0 评论 -
【Python学习记录】爬虫笔记2——爬取豆瓣评论
程序是爬取某一特定的作品的指定页码区间内的用户名称、用户评论、赞同数、和评论时间的。 本来想写根据输入作品的名称然后爬取指定区间内的信息,然后失败了,没有弄清楚为什么根据作品名搜索之后,爬取下来的html代码只显示部, 如图所示该标签的root部分的信息是没有的。。我尝试了在请求头加入登陆之后的cookies之后依然无法获取该部分信息,想了想有点头疼…还是先放着吧,哪一天明白原理了再去深究好了。。...原创 2019-07-08 21:20:40 · 511 阅读 · 0 评论 -
【Python学习记录】爬虫笔记3——贴吧指定区间页码数内图片的爬取
程序爬的是指定区间页码内的本页内所有帖子的第一页的消息(懒得完善成一个帖子内全部了,主要的思路都是相同的) 先上代码 import urllib.request import requests import os from lxml import etree class Find_img(): def init(self): # self.base_url = "https://tieba.b...原创 2019-07-08 21:36:42 · 206 阅读 · 0 评论 -
【Python学习记录】爬虫笔记4——wordcloud的使用
利用wordcloud将爬取的文本信息绘制成指定轮廓的图片 先上代码 import matplotlib.pylab as plt from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS import codecs #可以指定编码打开 from imageio import imread #将图片变成多维数组 from o...原创 2019-07-08 21:44:53 · 201 阅读 · 0 评论