![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
yc_1994
这个作者很懒,什么都没留下…
展开
-
2020-09-16
爬虫中国天气网目的得到中国天气网中气温最低的十个城市采用request库和BeautifulSoup分析数据,然后matplotlib可视化#coding:utf-8import requestsfrom bs4 import BeautifulSoupimport matplotlib.pyplot as pltall_data=[]def parse_temp(url): headers={"Use-Agent":"Mozilla/5.0 (Windows NT 10.0; W原创 2020-09-16 23:52:41 · 110 阅读 · 0 评论 -
爬虫之xpath语法和xml模块
xpath语法和xml模块xpath简介什么是xpath?xpat开发工具xpath语法xpath简介什么是xpath?xpath(xml path language)是一门在xml和html文档查找信息的语言,可用来在xml和html文档中对元素和属性进行遍历。xpat开发工具谷歌游览器插件Xpath Helper。Firefox插件 Try Xpathxpath语法...原创 2020-06-26 20:08:39 · 547 阅读 · 0 评论 -
爬虫之Requests库
爬虫之Requestsrequests库安装发送get请求requests库虽然python的标准库中urllib模块已经包含我们平常使用的大多数功能,但是它的API使用起来让人感觉不太好,而Requests使用起来更加方便安装利用pip 可以非常方便安装:pip install requests发送get请求最简单的发送get请求的方式就是通过requests.get调用:response=reqquests.get("http://www.baidu.com/")添加head原创 2020-06-23 15:12:31 · 175 阅读 · 0 评论 -
cookie学习
什么是cookie:在网站中,http请求是无状态的。也就是说即使第一次和服务器连接后并且登入成功后,第二次请求服务器依然不能知道当前请求是哪个用户。cookie的出现就是为了解决这个问题,第一次登入服务器返回一些数据(cookie)给游览器,然后游览器保存在本地,当该用户发送第二次请求时,就会自动的把上次请求储存的cookie数据自动的携带给服务器,服务器通过游览器携带的数据就能判断当前用户是哪个了。cookie储存的数据是有限的,不同游览器有不同的储存大小,但一般不超过4kbcookie的格式:S原创 2020-06-21 17:25:16 · 152 阅读 · 0 评论 -
proxyHandler处理器(代理设置)
很多网站会检测某一段时间某个ip的访问次数,如果访问次数多的不像正常人,它会禁止这个IP的访问。ProxyHandle处理器(代理):1、代理原理:在请求目的的网站之前,先请求代理服务器,然后让代理服务器去请求目的网站,代理服务器拿到目的网站的数据后,再转给我们的代码。2.http://httpbin.org; 这个网站可以方便的查看http请求的一些参数。3、在代码中使用代理:• 使用"urllib.request.ProxyHandler",传入一个代理,这个代理是一个字典,字典的key依原创 2020-06-17 22:40:08 · 377 阅读 · 0 评论 -
python爬虫
文章目录**urllib库****urlretrieve函数:****urlencode函数:**urllib库urlretrieve函数:这个函数可以方便的将网上的一个文件保存到本地。以下代码可以非常方便的将百度的首页下载到本地:from urllib import requestrequest.urlretrieve('http://wwww.baidu.com/','baidu.h...原创 2019-12-16 22:07:28 · 118 阅读 · 0 评论 -
python-----numpy介绍
文章目录1 numpy简介1 numpy简介numpy是python用于快速处理大型矩阵的科学计算库,numpy允许在python中做向量和矩阵的运算。numpy的主要对象是同质多维数组,也就是在一个元素表中,元素的类型都是相同的。numpy的数组类称为ndarray,别名为array。numpy.array与标准python库类array.array不一样,标准库类中只能处理一维数组并且功...原创 2019-12-05 17:07:31 · 351 阅读 · 0 评论 -
python数据分析
简介:本案例以互联网金融行业客户信息为数据,通过-means聚类,对用户划分成不同的群体。1 RFM模型介绍根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标,这三个指标分别是:R-最近一次消费(Recency);F-消费频率(Frequency)和M-消费金额(Monetary)。依据这三个指标将客户分为下面图1所示的...原创 2019-11-16 17:07:21 · 377 阅读 · 0 评论 -
3 python 表达式和运算符
3.1 算术运算符算术运算符是程序设计语言中失业率最高的运算符。比如:加法运算符、减法运算符、乘法运算符等等表3-1列出了python的各种运算符表3-1算术运算符范例说明+a+b加法-a-b减法*a*b乘法**a**b乘幂(次方)/a/b除法//a//b整数除法%a%b求余数...原创 2019-10-13 22:09:28 · 125 阅读 · 0 评论 -
1 python输入和输出
1 输入输入函数:input()python2.x版本的input函数是自动识别类型,raw_input函数是字符串。python3.x版本的只剩下input函数可用了,而且类型是字符串。2 格式化输出1 “%”格式化输出格式化文本可以用”%s“代表字符串,”%d“代表整数,”%f“代表浮点数。例如:score=90print("小米成绩:%d"%score)输出结果小米成...原创 2019-10-12 22:19:24 · 151 阅读 · 0 评论 -
pandas读取excel
pandas读取excel固定的列数以下为读取excel的第一和第三列import pandas as pdio=r '路径'data=pd.read_excel(io,usecols=[0,2]) # 指定读取第1列和第3列data.head()rnows——读取需要的行数data = pd.read_excel(io, sheet_name = '', nrows = 10)...原创 2019-08-22 11:50:26 · 481 阅读 · 0 评论 -
电脑上同时有python2和python3,pip安装模块方式
安装模块## python2:python -m pip install paramiko ## python3:python3 -m pip install paramiko原创 2019-08-22 10:45:29 · 676 阅读 · 0 评论 -
python循环语句
python3for循环的语法格式for iterating_var in sequence: statements(s)例一for i in range(10): print(i)结果例二for i in 'python3': print('当前字母:',i)结果:例三通过序列索引迭代fruits=['apple','orange','mango']f...原创 2019-08-21 21:49:30 · 76 阅读 · 0 评论 -
python可视化
#matplotlib画图import matplotlib.pyplot as pltfig,ax=plt.subplots()ax.plot(x,y3)plt.show()原创 2019-08-11 22:15:15 · 93 阅读 · 0 评论 -
python画散点图
二维散点图import matplotlib.pyplot as pltimport numpy as npdata=np.random.randint(0,100,size=[30,30])#随机生成一个整数矩阵x,y=data[0],data[1]fig,ax=plt.subplots()ax.scatter(x[:10],y[:10],'r')ax.scatter(x[10...原创 2019-08-14 11:53:35 · 780 阅读 · 0 评论