研1日记1

Pandas_DataFrame数据结构及基本操作_哔哩哔哩_bilibili

切片按照列名xy[['Embarked','Survived']]

Json 详解,5分钟学会_哔哩哔哩_bilibili

泰坦尼克号数据集训练

Kaggle:Titanic《泰坦尼克号》你的第一次竞赛_kaggle titanic-CSDN博客

pd.read_csv 返回值是DataFrame
sort_values(by='Survived', ascending=True) pandas下按指定列进行升序排列

Pandas-排序函数sort_values()_sortvalues函数-CSDN博客

round(80.23456, 2) :  80.23 round函数进行四舍五入

pandas describe函数pandas.DataFrame.describe — pandas 2.2.2 documentation (pydata.org)

默认情况下只返回数字的描述,包括count std min max 和百分比,当字段类型非数字时,描述的是count unique top 和 freq

DataFrame的 apply() 是做一个批量化的处理

re.search(r',\s(.+?)\.', x) re.search匹配,以逗号和空格开头的,以点结尾的。其中 .+? 表示匹配一个或多个任意字符(. 表示任意字符,+ 表示一个或多个),?表示采用非贪婪模式,即尽可能少地匹配字符。x是找到的字符。

  • 当你使用xy.Name.apply(lambda x: re.search(r',\s(.+?)\.',x).group())时,你调用的是.group()方法而没有指定参数,因此它返回的是整个匹配的文本,包括逗号、空格、捕获组的内容以及点号。

  • 当你使用xy.Name.apply(lambda x: re.search(r',\s(.+?)\.',x).group(1))时,你调用的是.group(1)方法,它只返回第一个捕获组(即括号内的部分)匹配的文本,不包括逗号、空格和点号。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值