数据技术

数据分箱技术

import numpy as np
import pandas as pd
from pandas import Series,DataFrame
score_list=np.random.randint(25,100,size=20)
print(score_list)
bins=[0,59,70,80,90]
score_cat=pd.cut(score_list ,bins)
print(pd.value_counts(score_cat))
df=DataFrame()
df['score']=score_list
df['Categories']=pd.cut(df['score'],bins,
labels=['low','ok','good','great'])
print(df)

数据分组技术

import numpy as np
import pandas as pd
from pandas import Series,DataFrame
#将数据文件同代码文件放在同一个文件夹,
#读取时在文件名后加.csv后缀
df=pd.read_csv("city_weather.csv.csv")
print(df)
g=df.groupby(df['city'])
print(g)
print(g.groups)
df_bj=g.get_group('BJ')
print(df_bj)
print(df_bj.mean())
print(g.mean())
print(list(g))
print(dict(list(g)))
for name,group in g:
    print(name)
    print(group_df)

数据聚合技术

import numpy as np
import pandas as pd
from pandas import Series,DataFrame
df=pd.read_csv("city_weather.csv.csv")
g=df.groupby('city')
print(g.describe())
#定义参数
def foo(attr):
    print(type(attr)),print(attr)
    return np.nan
print(g.agg(foo))
print(g.get_group('BJ'))
for (name1,name2),group  in g:
    print(name1,name2)
    print(group)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值