Pandas_DataFrame数据结构及基本操作_哔哩哔哩_bilibili
切片按照列名xy[['Embarked','Survived']]
泰坦尼克号数据集训练
Kaggle:Titanic《泰坦尼克号》你的第一次竞赛_kaggle titanic-CSDN博客
pd.read_csv 返回值是DataFrame
sort_values(by='Survived', ascending=True) pandas下按指定列进行升序排列
Pandas-排序函数sort_values()_sortvalues函数-CSDN博客
round(80.23456, 2) : 80.23 round函数进行四舍五入
pandas describe函数pandas.DataFrame.describe — pandas 2.2.2 documentation (pydata.org)
默认情况下只返回数字的描述,包括count std min max 和百分比,当字段类型非数字时,描述的是count unique top 和 freq
DataFrame的 apply()
是做一个批量化的处理
re.search(r',\s(.+?)\.', x) re.search匹配,以逗号和空格开头的,以点结尾的。其中 .+?
表示匹配一个或多个任意字符(.
表示任意字符,+
表示一个或多个),?表示采用非贪婪模式,即尽可能少地匹配字符。x是找到的字符。
-
当你使用
xy.Name.apply(lambda x: re.search(r',\s(.+?)\.',x).group())
时,你调用的是.group()
方法而没有指定参数,因此它返回的是整个匹配的文本,包括逗号、空格、捕获组的内容以及点号。 -
当你使用
xy.Name.apply(lambda x: re.search(r',\s(.+?)\.',x).group(1))
时,你调用的是.group(1)
方法,它只返回第一个捕获组(即括号内的部分)匹配的文本,不包括逗号、空格和点号。