- 博客(4)
- 收藏
- 关注
原创 python爬虫——爬取起点中文网作品信息
首先打开起点中文网 点开红圈内的全部作品选项,本博客爬取这里面的作品信息。 接下来爬取所有作品信息,注意,不仅仅只是该面的所有作品信息,而是全部作品信息。 网页下面有跳转其他页的选项。 我们需要找到网址规律,用来编写一个自动遍历所有页面网址的程序。 开始进来是这样的网址 https://www.qidian.com/all 但是点击下面的跳页选项中的1,会发现变成这样子了。
2017-12-13 19:15:48 12211 5
原创 Numpy笔记
numpy的N维数组对象ndarrayndarray 属性 说明 ndim 维度 shape 尺度,返回(n行, m列)元组 size 元素个数,即n*m值 dtype 元素类型 itemsize 每个元素的大小,以字节为单位 数据类型 说明 bool 布尔类型 int
2017-12-07 21:57:56 382
原创 windows之python3.6的pyinstaller的安装与使用
18.3.25补:现在的python3.6好像已经有对应的pyinstaller版本了,下面的内容也没什么用处了….留下这篇为以后的版本不兼容留下点经验一、pyinstaller的安装直接用pip安装是用不了的,会报错,因为还没有适合python3.6的pyinstaller库。 故而,需要直接从github上下载pyinstaller文件——pyinstaller 点击红...
2017-12-05 23:15:29 15489 18
原创 入门python3爬虫需要掌握的知识与技巧
近期学了几天的python爬虫,在一个人瞎摸索中吸取了很多经验,在此把自己的初学者学习的经验拿出来分享。 下面讲的是python3,没了解过python2,不过似乎有些地方两者区别很大。 入门python3爬虫需要对一些库和模块有一定的了解,还需学会查看网页源代码的技巧,并了解一些爬虫框架。一、认识urllib库urllib是用于获取网络资源的库,python3自带。 初学爬虫者,主
2017-12-02 01:34:43 6492
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人