python人名最多数统计_《利用Python进行数据分析》-全美婴儿姓名案例

本文通过《利用Python进行数据分析》一书中的全美婴儿姓名案例,讲解了如何使用Python进行数据处理和分析。涉及的方法包括:数据分组、数据合并、透视表制作、数据可视化等。具体操作包括:groupby、pivot_table、cumsum、搜索排序、字符串操作等,并展示了如何绘制出生数量的趋势图和名字比例变化图。
摘要由CSDN通过智能技术生成

知识点

在全美婴儿名字案例中,使用到的方法有:

按照sex分组按照births属性求和:groupby("sex").births.sum()

concat()用法:第一个参数以列表形式添加

pivot_table透视表制作

image.png

直接添加某列属性diff:group['diff']=group['M] - group['F']

apply()用法

查看DF数据信息:info()

不同方式绘制可视图:

image.png

image.png

查看DF数据框中的所有信息value,除去索引和属性

累计求和:cumsum()

归一化后寻找某个分界点的位置:searchsorted(0.5)

对df中的name属性使用func函数:df.name.map(func)

归一化处理:df/df.sum()

挑选不重复元素:unique()

字符串转化:str.lower():一定还要带上str

字符串中是否包含:str.contains()

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

# 创建数据指定列属性

data = pd.read_csv(r'D:\Python\datalearning\利用Python进行数据分析\pydata-book\datasets\babynames\yob1880.txt',

names=['name', 'sex', 'births'])

data.head()

image.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值