- 博客(9)
- 收藏
- 关注
原创 爬虫之 B 站评论
理清本次爬虫思路: 首先 爬取 B 站评论数据 其次 做一个词云图分析 第一步:观察评论数据 打开 B 站 UP 主 「电影最 TOP 」 找到一期关于的 ·「星爷」· 视频 我们打开检查界面,可以查出评论的文件在 我们拿到评论地址的 url url = 'https://api.bilibili.com/x/v1/dm/list.so?oid=39858896’ # 打开这个 ur...
2019-08-16 22:26:35 808
原创 PYTHON 实战演练
这是我写的一个爬去全国高校坐标信息的一个代码,是自己第一个爬虫代码 1、收集全国高校名称数据: http://www.sohu.com/a/233187646_507611 进入网址,复制粘贴所有的高校名单数据,建立 TXT 文件 2、 python 代码实现: 在地图中 我们发现有几个注意的地方: (1):输入北京大学的输入框,也就是 input , input1 (2):百度一下 的点击框...
2019-05-03 23:34:45 629
原创 PYTHON学习笔记三之函数文件
函数 调用格式:def function(value1,value2): 例如求n项之和 def fun(n): s = 0 for i in range(1,n + 1): s += i return s print(fun(100)) 全局变量:用global定义 s = 1 def func(n): global s for i in range(1,n + ...
2019-04-02 13:41:12 492
原创 PYTHON学习笔记二之控制结构
python共有三种控制结构:顺序、分支、循环 分支结构 单分支语句:if语句 二分支语句:if-else语句 多分支语句:if-elif-else 其中判断条件有: < 、<= 、>、>=、 ==、 != 逻辑运算:not and or 循环结构 两种循环:遍历循环for 无限循环while 遍历循环for: for i in <遍历结构> for i ...
2019-04-01 19:56:30 200
原创 PYTHON学习笔记一之基本运算方法
数值 有两种基本的数值类型:int float 基本的运算符号:+ - * / ** //(求除数) %(求余) print函数:print(value1,value2) print(2+1,3+4,3/1) 变量 abs int round函数 在运算时尽可能多的使用括号 字符串 字符串定义:由单引号’'或者双引号""包围的一个字符串序列 字符串...
2019-04-01 13:43:55 182
转载 《基本库的使用》学习笔记之使用urllib
概念:`` urlllib是python内置HTTP请求库,包含以下四个模块 request:发送请求 error:异常处理 parse:工具模块 robotparse:识别网站可爬性(少用) 1. 发送请求 1.1 urlopen() import urllib.request response = urllib.request.urlopen('https:/www....
2019-01-16 20:24:02 200
转载 《基本库的使用》学习笔记之rquests
基本用法 1. GET请求方法 示例: import requests a = requests.get('https://httpbin.org/get') print(ttype(a)) print(a.status_code) print(a.text) print(a.cookies) 输出: &lt;class 'requests.models.Response'&gt; 200 {...
2019-01-16 20:23:18 179
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人