自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 Python 配置echarts

1.访问echarts实例,选择适合的图表https://echarts.apache.org/examples/zh/index.html2.在python中引入该图表样式(1)建立html文件,同时生成一个div,之后图表要在该div中展示(2)初始化charts, div中显示echarts图表<body><div id="main" style="width:800px;height:600px;background:pink"></div> &lt

2022-04-01 20:42:37 2715

原创 Python Matplotlib基本使用

1.生成画布和实例import matplotlib.pyplot as pltfig = plt.figure()ax = fig.add_subplot(111) #在画布1的位置生成实例对象

2022-03-29 18:40:25 375

原创 Python Pandas数据统计函数以及数据排序

有如下一张表s3:1.汇总类统计#生成各项数字列的汇总数据s3.describe() s3["aqi"].max()s3["aqi"].min()s3["aqi"].mean()2.唯一去重和按值计数唯一去重:用于枚举列的各种属性值,一般不用于数值列s3["fengxiang"].unique()结果:按值计数:统计列中属性值出现的次数s3["fengxiang"].value_counts()结果:3.相关系数和协方差概念:1 协方差:衡量同向反向程度,如果协方差为

2022-03-28 11:39:38 1965

原创 Python Pandas修改/新增数据列

1.直接赋值法表s3如上图所示#替换掉温度的后缀℃s3.loc[:,"bWendu"] = s3["bWendu"].str.replace("℃","").astype("int32")s3.loc[:,"yWendu"] = s3["yWendu"].str.replace("℃","").astype("int32")#新增数据列,为最高气温-最低气温的值s3.loc[:,"wencha"] = s3["bWendu"]-s3["yWendu"] #loc方法对于不存在的列属性则创建,对

2022-03-28 11:24:36 749

原创 Python Pandas对空值的处理

(1)dropna()#删除所有值为空的行s3.dropna(axis="index",how="all",inplace=False) #how字段可选有any和all,any表示只要有空值出现就删除,all表示全部为空值才删除;inplace字段表示是否替换掉原本的数据#删除所有值为空的列s3.dropna(axis="columns",how="all",inplace=False)(2)fillna()#将s3表中分数为空的赋值为0s3.loc[:,"分数"] = s3["分数"

2022-03-27 10:22:51 4607

原创 Python Pandas读取文件和DataFrame、Series的基本使用

1.读取文件和数据属性的基本查看方法数据类型读取方法csv,tsv,txtpd.read_csv(filepath)excelpd.read_excel(filepath)mysqlpd.read_sql(filepath)注意,读取mysql时,要先进行sql连接import pymysql conn = pymysql.connect( host="127.0.0.1" user="root" password="123456" database

2022-03-26 21:06:01 2608

原创 Python正则表达式的使用

1.限定符和运算符a* 【a出现0次或多次】a+ 【a出现1次或多次】a? 【a出现0次或1次】a{6} 【a出现正好6次】a{2,6} 【a出现2-6次】a{2,} 【a出现2次及以上】(a|b) 【匹配a或者b】(ab) | (cd) 【匹配ab或者cd】2.字符类[abc] 【匹配a或b或c】[a-f] 【匹配a-f之间的字母】[a-fA-F0-9] 【匹配小写a-f,大写A-F和0-9之间的数字】[^0-9] 【方括号中^代表取非,表示匹配非数字字符】3.元字符\d

2022-03-26 18:36:45 491

原创 Python协程asyncio基本使用

1.为什么要引入协程?为了要完成异步 IO,就是你发起一个 IO 操作,却不用等它结束,你可以继续做其他事情,当它结束时,你会得到通知。它比线程所消耗的资源更少,往往是构建IO密集型的最佳选择。Python中异步编程需要使用到Asyncio。2.基础概念:(1)Event loop-----事件循环Eventloop可以当作是中央总控,提供了注册、取消、执行任务和回调的方法。我们通过把一些异步函数注册到这个事件循环上,事件循环会循环执行这些函数(注意每时刻只能执行一个函数),当执行到某个函数时,如

2022-03-23 17:41:57 863

原创 浅谈数据挖掘

1.什么是数据挖掘?数据挖掘是寻找数据中隐含的知识,并用于科研或产生商业价值2.为什么要进行数据挖掘?(1)海量数据——难以用人工的方式进行统计归纳。(2)维度众多——例如美团外卖所涉及的维度,包括菜品文字、图片、价格、折扣,用户浏览时间、下单时间、下单价格、交易处理等(3)问题复杂。传统的统计学方法难以解决问题3.数据挖掘的应用(1)分类问题比较适合一些确定的场景。例如新浪微博某用户发布了一条动态,则根据数据挖掘自动将该动态分配到娱乐/时事/知识等其他板块(2)聚类问题比较适合一些不

2022-03-22 12:47:25 1439

原创 Pytest常用操作

1.pytest的原始约束当不修改ini文件时(后续会讲修改方法),pytest有如下约束:(1)模块约束:文件名需要满足test_.py格式开头或_test.py格式结尾。(2)测试类以Test开头,并且不能带有 init 方法(3)在类中,可以包含一个或多个test_开头的函数。2.pytest执行操作在这里介绍主函数执行法在pytest文件夹中新创建一个文件(注意命名规范也要满足):improt pytestif__name__ == "__main__": pytest.main

2022-03-14 17:54:55 584

原创 Numpy常用方法总结

1.创建数组t1 = np.array(range(1,4))t1 = np.array([1,2,3])t1 = np.arange(1,4)2.指定数据类型(1)在创建数组时指定:t1 = np.array([1,2,3],dtype=“int64”)(2)在创建后修改数据类型:t1.astype(“int64”)常见数据类型如下:序号 数据类型及描述bool 存储为一个字节的布尔值(真或假)int 默认整数,相当于 C 的long,通常为int32或int64intc

2022-03-12 21:41:54 983

原创 爬虫中有关验证码的问题处理

在爬虫中,经常要处理登陆的相关事宜,有时候登陆界面会需要提交验证码,如何处理验证码?解决办法:若是自己编写模块,需要涉及深度学习,这就是另一块大的内容了。在这里简单调用已经封装好的模块来实现获取验证码,本文以超级鹰为例,网址:http://www.chaojiying.com1.超级鹰的使用(1)首先注册并登陆,来到用户中心往下拉,可以绑定微信并获得题分(2)点击软件ID->生成一个软件ID,记住你的软件ID及Key(3)点击开发文档->选择Python语言->点击下载(4)解

2022-03-11 01:45:21 1622

原创 常见反爬虫方法及其应对策略

1.UA检测即User-Agent检测,是最常见的反爬虫方法。服务器通过确认用户代理是否为真实的浏览器,从而做出接受或拒绝响应请求。解决办法:通过在请求头上添加一个用户代理来伪装成真实的浏览器headers = { "User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1.2 Safari/605.1.15" } #UA伪装

2022-03-10 21:46:06 1487

原创 Python 爬虫数据乱码解决方式

数据乱码大多来自于编码格式不支持中文显示,解决方式主要有如下两个:1.设置对响应对象的编码格式2.设置爬取到的数据编码格式及解码格式

2022-03-10 19:38:28 6926

原创 微信小程序Invalid attempt to spread non-iterable instance解决办法

微信小程序Invalid attempt to spread non-iterable instance解决办法原因:在js中给列表元素赋初值空,并且从缓存中取值赋给该列表元素,如: data:{ daily:[] },同时存在另一个数据,每次进入该页面这个数据的取值都不同,想要将每次的这个数据值存入daily并设置到缓存中(假如该数据变量为C)this.setData{ daily:C //错误,这样设置回覆盖掉之前daily的值 daily:[...this.data.daily,...

2021-04-22 00:58:42 3563

原创 微信小程序数据重复显示问题

微信小程序数据重复显示可能原因:当我们在一个页面使用wx.navigateTo(切换到不是tableBar的页面)和wx.switchTab(切换到是tableBar的页面) 跳转到其他页面时跳转到的页面同时存在onShow方法(在页面被展示的时候会调用)和onLoad方法(在页面首次被加载的时候调用),并且两者同时给js中的data赋值,导致错误解决方法:首先将onShow方法中数据重新初始化,然后再重新调用onLoad方法,如下data:{ informat:false, textare

2021-04-22 00:32:18 3111

原创 Python自动化测试专栏——元素定位不到常见问题及解决办法

1.元素id动态变化以如下图片举例当我们要定位到该元素时,如果采用id属性定位,那么很有可能定位不到。原因:当我们刷新一遍网页时,会发现id值发生变化,表明它是个动态id,每次自动化时会因为值不同无法定位到该元素解决方法:采用其他属性定位,如案例中即可采用data-placeholder的值定位2.定位的元素嵌套在iframe当中以如下图片举例以刚刚图片举例,当我们选择用data-placeholder定位时,发现还是定位不到,我们将检查元素界面往前翻原因:发现该元素嵌套在iframe

2021-04-12 01:38:31 2730

原创 Python自动化测试专栏——选择元素基本方法之CSS选择器

1.选择元素基本方法1.1根据id属性选择元素wd.find_element_by_id(‘kw’)1.2根据class属性选择元素wd.find_elements_by_class_name(‘animal’)1.3根据tag名选择元素wd.find_elements_by_tag_name(‘div’)CSS选择器选择元素1.根据 tag名选择元素选择 所有的tag名为div的元素:wd.find_elements_by_css_selector(‘div’)等价于:wd.

2020-08-05 10:43:02 485

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除