知识点
在全美婴儿名字案例中,使用到的方法有:
按照sex分组按照births属性求和:groupby("sex").births.sum()
concat()用法:第一个参数以列表形式添加
pivot_table透视表制作
image.png
直接添加某列属性diff:group['diff']=group['M] - group['F']
apply()用法
查看DF数据信息:info()
不同方式绘制可视图:
image.png
image.png
查看DF数据框中的所有信息value,除去索引和属性
累计求和:cumsum()
归一化后寻找某个分界点的位置:searchsorted(0.5)
对df中的name属性使用func函数:df.name.map(func)
归一化处理:df/df.sum()
挑选不重复元素:unique()
字符串转化:str.lower():一定还要带上str
字符串中是否包含:str.contains()
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 创建数据指定列属性
data = pd.read_csv(r'D:\Python\datalearning\利用Python进行数据分析\pydata-book\datasets\babynames\yob1880.txt',
names=['name', 'sex', 'births'])
data.head()
image.png