pandas 小技巧

最新推荐文章于 2024-07-12 17:54:41 发布

eric1984

最新推荐文章于 2024-07-12 17:54:41 发布

阅读量63

点赞数

分类专栏： python ai 区块链

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/eric1984/article/details/116740915

版权

python ai 区块链专栏收录该内容

21 篇文章 0 订阅

订阅专栏

1、筛选数据

complaints[['Complaint Type', 'Borough']][:10]

is_noise = complaints['Complaint Type'] == "Noise - Street/Sidewalk"

in_brooklyn = complaints['Borough'] == "BROOKLYN"

complaints[is_noise & in_brooklyn][:5]

2、计数

complaint_counts = complaints['Complaint Type'].value_counts()

complaint_counts[:10]

3、分类计数

weekday_counts = berri_bikes.groupby('weekday').aggregate(sum)

4、合并

weather_2012 = pd.concat([f(x) for x in l])

5、字符串操作

weather_2012['Weather'].str.contains('Snow')

6、修改采样频率（可以获得更宏观的图形）

weather_2012['Temp (C)'].resample('M').apply(np.median)

median：中位数 mean：均值

7、清理数据

http://nbviewer.jupyter.org/github/jvns/pandas-cookbook/blob/master/cookbook/Chapter%207%20-%20Cleaning%20up%20messy%20data.ipynb

rows_with_dashes = requests['Incident Zip'].str.contains('-').fillna(False)

long_zip_codes = requests['Incident Zip'].str.len() > 5

requests['Incident Zip'][long_zip_codes].unique()

zips = zips.str.slice(0, 5)

zero_zips = zips == '00000'

zips[zero_zips] = np.nan

zips = requests['Incident Zip']

is_close = zips.str.startswith('0') | zips.str.startswith('1')

is_far = ~(is_close) & zips.notnull()

8、时间转换

popcon['atime'] = pd.to_datetime(popcon['atime'], unit='s')

popcon = popcon[popcon['atime'] > '1970-01-01']

nonlibraries = popcon[~popcon['package-name'].str.contains('lib')]

9、与数据库交互

con = sqlite3.connect("../data/weather_2012.sqlite")

df = pd.read_sql("SELECT * from weather_2012 LIMIT 3", con,

index_col=['id', 'date_time'])

con.execute("DROP TABLE IF EXISTS weather_2012")

weather_df.to_sql("weather_2012", con)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas 小技巧

ts[is_noise &amp; in_brooklyn][:5]2、计数complaint_counts = complaints['Complaint Type'].value_counts()complaint_counts[:10]3、分类计数weekday_counts = berri_bikes.groupby('weekday').aggregate(sum)4、合并weather_2012 = pd.concat([f(x) for x in l])
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。