自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 资源 (1)
  • 收藏
  • 关注

原创 Pandas数据分析—groupby分组统计

12.Pandas中groupby分组统计文章目录12.Pandas中groupby分组统计前言一、分组使用聚合函数做数据统计1.准备数据二、遍历groupby的结果理解执行流程三、实例分组股票数据总结前言笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。本节主要记录Pandas中groupby的使用(类似sql数据库中的groupby)类似SQL:select city,max(temperature) from city_weather group by city;

2021-08-31 01:05:20 10144 1

原创 Pandas数据分析—批量拆分Excel与合并Excel

11.Pandas批量拆分Excel与合并Excel文章目录11.Pandas批量拆分Excel与合并Excel前言一、假造数据二、程序演示1、将一个大Excel等份拆成多个Excel2、合并多个小Excel到一个大Excel总结前言笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。本节主要记录Pandas中数据的合并(concat和append)将一个大的Excel等份拆成多个Excel将多个小Excel合并成一个大的Excel并且标记来源一、假造数据wo

2021-08-30 23:36:57 605

原创 Pandas数据分析—实现数据的合并(concat和append)

10.Pandas实现数据的合并(concat和append)文章目录10.Pandas实现数据的合并(concat和append)前言一、假造数据二、程序演示1、使用pandas.concat合并数据2、使用DataFrame.append按行合并数据总结前言笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。本节主要记录Pandas中数据的合并(concat和append)使用场景:批量合并相同格式的Excel、给DataFrame添加行、给DataFrame添加列

2021-08-30 16:38:39 1715

原创 pandas由入门到精通—实现DataFrame的Merge(合并)

10.Pandas实现DataFrame的Merge(合并)文章目录10.Pandas实现DataFrame的Merge(合并)前言Merge的语法:一、电影数据集的join实例二、程序演示1.合并不同表的信息2.理解merge时数量的对齐关系3.理解left join、right join、inner join、outer join的区别4. 如果出现非Key的字段重名怎么办总结前言笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。本节主要记录Pandas中DataFram

2021-08-30 15:01:14 14057 1

原创 Pandas数据分析—Index索引的使用方法

11.Pandas的Index索引使用文章目录11.Pandas的Index索引使用前言一、程序演示1. 使用index查询数据2.使用index会提升查询的性能3.使用index能够自动对齐数据的功能4.使用index更多更强大的数据结构支持总结前言笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。本节主要记录Pandas的Index索引把数据存储于普通的column列也能用于数据查询,那么使用index有什么好处呢?index的用途总结:更方便的数据查询使用i

2021-08-30 11:55:59 383

原创 Pandas数据分析—axis参数

9.Pandas的axis参数文章目录9.Pandas的axis参数前言一、程序演示总结前言笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。本节主要记录Pandas的axisaxis=0或者"index":如果是单行操作,指的是某一行如果是聚合操作,指的是跨行cross rowsaxis=1或者"columns"如果是单列操作,指的就是某一列如果是聚合操作,指的就是跨列cross columns一、程序演示提前读取数据#伪造一个三行四列

2021-08-29 22:00:25 624

原创 Pandas数据分析—对字符串的处理

9.Pandas对字符串的处理文章目录9.Pandas对字符串的处理前言一、程序演示1.获取Series的str属性,然后使用各种字符串处理函数2.使用str的startwith,contains等bool类Series可以做条件查询3.需要多次str处理的链式操作4.使用正则表达式的处理总结前言笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。本节主要记录Pandas的字符串处理的常用方法使用方法: 先获取Series的str属性,然后在属性上调用函数只能在字符串列

2021-08-29 18:31:59 872

原创 Pandas数据分析—排序函数

9.Pandas的数据排序函数文章目录9.Pandas的数据排序函数前言一、排序函数1.Series数据的排序2.DataFrame数据的排序2.1.1 单列排序的情况2.1.2 多列排序的情况总结前言笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。本节主要记录Pandas的数据排序函数相关常用方法。我们分为Series数据的排序和DataFrame数据的排序一、排序函数提前读取数据import pandas as pdfpath="./datas/600033

2021-08-29 16:53:07 1298

原创 解决Pandas中的SettingWithCopyWarning报警

项目场景:Pandas中的SettingWithCopyWarning报警)问题描述:在使用Pandas数据分析的时候,可能会遇到SettingWithCopyWarning错误报警,这是因为不当的操作顺序引起的。# 报错的操作df[condition]["wen_cha"]=df["col1"]-df["col2"] 原因分析:链式操作其实是两个步骤,先是get然后set。get得到的dataFrame可能是view,也可能是copy,所以Pandas就发出了警告 解决的方案原理就

2021-08-29 16:04:34 1147

原创 Pandas数据分析—对缺失值的处理

7.Pandas的对缺失值的处理文章目录7.Pandas的对缺失值的处理前言一、概述二、函数的使用实例1.读取excel的时候,忽略前面的几个空行2.检测空值3.删除掉全是空值的列4.删除掉全是空值的行5.将分数列为空的值填充为06.将姓名的缺失值填充总结前言笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。本节主要记录Pandas对缺失值的处理的方法。一、概述Pandas使用这些函数来处理缺失值isnull和notnull: 检测是否是空值,可用于df和serie

2021-08-29 15:42:17 2750

原创 Pandas数据分析—数据统计函数

2.Pandas的数据统计函数文章目录2.Pandas的数据统计函数前言一、三类统计函数1.汇总类统计2.唯一去重和按值计数3.相关系数和协方差总结前言笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。本节主要记录Pandas的数据统计函数相关常用方法。一、三类统计函数提前读取数据import pandas as pdfpath="./datas/600033.csv"df=pd.read_csv(fpath)1.汇总类统计# 展示所有的数字列统计结果,其中

2021-08-29 12:20:52 648

原创 Linux系统中提示Message: ‘chromedriver‘ executable needs to be in PATH

项目场景:在ubuntu系统中运行爬虫文件问题描述:Linux系统中提示Message: ‘chromedriver’ executable needs to be in PATH原因分析:没有设置环境变量解决方案:#1.修改环境变量cd /etcsudo vim profile#2. 在末尾增加export PATH=$PATH:/study/spidersPro/PingAnDaKaPro/PingAnDaKaPro/chromedriver#3. 激活环境source p

2021-08-18 16:02:14 1807

原创 Python爬虫从编码到部署(这么一篇就够了!!!)

Python爬虫从编码到部署(这么一篇就够了!!!)文章目录Python爬虫从编码到部署(这么一篇就够了!!!)一、导论二、http协议三、request模块四、数据解析一、bs4进行数据解析二、xpath解析五、反爬与反反爬一、反爬机质:二、识别验证码的操作:三、实战:六、模拟登录一、爬取某些用户的用户信息七、scrapy框架的使用1. 环境的安装2. scrapy的使用3.持久化存储4. 基于Spider的全站数据爬取5. 五大核心组件6. 请求传参7.ImagesPipeline:8. 中间件9.

2021-08-18 15:58:38 1864

原创 分治策略时间复杂度分析(三)-用主方法求解递归式

分治策略时间复杂度分析(三)-用递归树方法求解递归式 虽然以上两种方法都可以求解递归式,但是它们的缺点是比较复杂。所以我们提出第三种方法-主方法,这个方法可以快速求解,很容易地求解很多的递归式,通常不需要纸和笔的帮助。文章目录分治策略时间复杂度分析(三)-用递归树方法求解递归式前言一、主定理二、很值得注意的反例!总结前言进行分治策略时间复杂度分析有三种方法,分别为1.用代入法求解递归式2.用递归树方法求解递归式3.用主方法求解递归式 本篇文章介绍第三种方法,即用主方法来求解递归式。主

2021-08-11 17:50:03 836

原创 分治策略时间复杂度分析(二)-用递归树方法求解递归式

分治策略时间复杂度分析(二)-用递归树方法求解递归式虽然可以用上一篇文章中的代入法去简洁地证明一个解确实是递归式的正确解,但是想出一个好的猜测可能会很困难。所以我们可以用递归树的方法去猜测解。文章目录分治策略时间复杂度分析(二)-用递归树方法求解递归式前言一、递归树法初探二、第一个简单例子三、第二个例子总结前言进行分治策略时间复杂度分析有三种方法,分别为1.用代入法求解递归式2.用递归树方法求解递归式3.用主方法求解递归式 本篇文章介绍第二种方法,即用递归树方法来求解递归式,在递归树

2021-08-11 16:01:30 2134

原创 Pandas数据分析-新增数据列

4.Pandas新增数据列文章目录4.Pandas新增数据列前言一、直接赋值二、df.apply方法三、df.assign方法四、按条件选择分组分别进行赋值总结前言笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。本节主要记录Pandas的新增数据列方法,如apply方法。在进行数据分析的时候,经常需要按照一定条件创建新的数据列,然后进一步进行分析一、直接赋值import pandas as pdfpath="./datas/600033.csv"df=pd.re

2021-08-08 13:43:04 2553

原创 Pandas数据分析-数据查询

3.Padas的数据查询文章目录3.Padas的数据查询前言一、Pandas查询数据的几种方法二、Pandas使用df.loc查询数据的方法2.1 使用单个的label值查询数据2.2 使用值列表批量查询2.3 使用数值区间进行范围查询2.4 使用条件表达式查询2.5 调用函数查询总结前言笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。本节主要记录Pandas的数据查询方法,如loc方法。一、Pandas查询数据的几种方法df.loc 方法,根据行、列的标签值查询

2021-08-08 12:48:38 623

原创 Pandas数据分析-Pandas的数据结构

1.Padas的数据结构文章目录1.Padas的数据结构前言一、pandas的数据结构二、pandas读取数据1.读取csv数据2.读取excel表格数据3.读取sql数据库数据4.pandas读取文件做日期解析parse_dates总结前言笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。本节主要记录Pandas的数据结构和相关常用方法,如切片。一、pandas的数据结构Pandas的数据结构分为DataFrame和Series。前者表示的是一个二维的表格数据,有行也

2021-08-08 11:35:12 471

原创 Pandas数据分析-数据读取

1.Padas做数据读取文章目录1.Padas做数据读取前言一、pandas是什么?二、pandas读取数据1.读取csv数据2.读取excel表格数据3.读取sql数据库数据总结前言笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。一、pandas是什么?Pandas,python+data+analysis的组合缩写,是python中基于numpy和matplotlib的第三方数据分析库,与后两者共同构成了python数据分析的基础工具包,享有数分三剑客之名。Pan

2021-08-08 00:01:13 800

原创 分治策略时间复杂度分析(一)-用代入法求解递归式

分治策略时间复杂度分析(一)-用代入法求解递归式分治策略是算法中的一种重要的思想,比如归并排序就是用到了分治的策略,在分治策略中我们递归地求解一个问题,在每一层递归中都应用三个步骤:1.分解、2.解决、3.合并。文章目录分治策略时间复杂度分析(一)-用代入法求解递归式前言一、代入法初探二、做出好的猜测三、微妙的细节四、避免陷阱五、改变变量总结前言进行分治策略时间复杂度分析有三种方法,分别为1.用代入法求解递归式2.用递归树方法求解递归式3.用主方法求解递归式本篇文章介绍第一种方法,即

2021-08-05 20:42:08 1590

Eclipse使用插件时提示Plugin Error loading shared libraries

Eclipse使用插件时提示Plugin Error loading shared libraries

2023-08-18

Total-Uninstall软件

该软件可以帮我们卸载掉计算机上的程序

2023-08-04

Pandas数据分析系列的源文件

我的CSDN专栏《Pandas数据分析》中利用到的被操作文件,免费分享给需要的小伙伴

2021-09-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除