自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (1)
  • 收藏
  • 关注

原创 pandas之groupby方法超级详细用法,值得收藏

在数据分析工作中,经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析。在Pandas中,分组分析的主要运由groupby方法完成。这篇文章将详细介绍groupby用法以及对应的agg、transform、apply的用法。 我们还是以NBA著名球星勒布朗詹姆斯2020-2021赛季的数据为例进行分析,有关的数据可在https://download.csdn.net/download/hanyunkaka/27238024?spm=1001.2014.30...

2021-10-23 20:20:43 9982 27

原创 python之递归生成器[yield用法]

Magnus Lie Hetland在《Python基础教程》中介绍递归生成器的代码晦涩难懂。本文详细解释了递归生成器的用法,并且以更为通俗易懂的方式改写了书中的代码。

2021-10-09 18:56:16 2388 42

原创 [Python话说NBA]pandas分组操作groupby方法与sort_values排序方法

想知道詹姆斯2020-2021赛季在对阵哪只NBA球队时发挥最出色,在对阵哪只NBA球队发挥最不理想?使用python库pandas中的分组操作groupby方法以及sort_values排序方法来告诉你答案。

2021-10-06 16:36:58 5061 19

原创 pandas之DataFrame与Dict的相互转换

在使用pandas进行数据分析的时候,大多数情况下可以用read_csv、read_excel等函数读取数据。但是,有时候,我们面对的是字典形式的数据结构。在这种情况下,需要用到DataFrame与Dict之间的相互转换。一、Dict转换为DataFrame1、面向行sales = [{"Fruits":"apple","Numbers":5}, {"Fruits":"banana","Numbers":8}, {"Fruits":"pear...

2021-10-04 13:22:51 13238 17

原创 [话说NBA]pandas文本数据方法str.startswith()函数

在上一篇文章中,介绍了pandas分割函数str.split()的用法,并且使用该方法计算了NBA著名球星勒布朗詹姆斯2020-2021赛季常规赛的投篮命中率。很多小伙伴看过上篇文章后,咨询我如何计算詹姆斯某个月份的得分、篮板、助攻等数据。其实,计算单月数据的方法比较简单,需要用到pandas文本数据方法str.startswith()函数。 Series.str.startswith(pat, na=nan):查看元素是否以pat开头pat:要搜索的字符串。na:用于...

2021-10-03 14:07:35 3089 6

原创 pandas字符串分割str.split()函数

为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。 这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。DataFrame.str.split(pa,n,expand)pat:字符串分隔符,默认为空格。n:用于指定...

2021-10-02 16:19:48 19437 15

原创 Python程序中的for-else语句

使用python编程时,会经常用到for循环语句和if-else语句。可能很多人并不知道,在python语言中,for语句和else语句也可以一块使用,即:for-else语句。 举个简单的例子,假如要判断某个列表array_list中是否有奇数存在。如果存在奇数,则输出“Find odd number”;如果不存在奇数,则输出“Not find odd number”。 1、for循环语句和if-else语句 一般情况下,使用for循环语...

2021-10-01 13:03:16 2075 10

原创 pandas索引函数loc和iloc的区别

使用pandas进行数据分析的时候,我们经常需要对DataFrame的行或者列进行索引。使用pandas进行索引的方法主要有三种:直接使用行或者列标签、loc函数和iloc函数。 举个简单的例子:import numpy as npimport pandas as pddf = pd.DataFrame({"Fruits":["apple","pear","banana","watermelon"],"Price":[1.2,1.4,2.3,4.2],"Sales...

2021-09-25 14:25:26 13323 12

原创 Python搭建简易HTTP/HTTPS文件服务器

之前因为传输文件的需要,需要自己搭建文件传输服务器。FTP/FTPS文件服务器比较容易,因为相关的软件很多。关于HTTP/HTTPS文件服务器的介绍相对来说要少很多,网上关于HTTP/HTTPS文件服务器的搭建方法杂乱无章,很多方法根本是不可用的。因此,我特意总结了使用Python搭建简易HTTP/HTTPS文件服务器的方法。一、从GitHub下载源码 经过多次的尝试,我在GitHub发现了一个好用的Python编写的HTTP/HTTPS文件服务器,源码下载地址:gith...

2021-09-25 12:59:59 3575

lbj-2020-2021-regular.csv

NBA超级球星勒布朗詹姆斯2020-2021赛季常规赛详细个人数据,可用于pandas数据分析。

2021-10-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除