Python笔记:pandas中关于dataframe的部分操作

抓取的部分原始数据,用这个程序  https://blog.csdn.net/bq_cui/article/details/93860666

 lp_namearea1area2huxingwuye_typesale_stateprice
0秋月朗庭尚东区奉贤南桥2室/3室/4室  80-149㎡住宅在售33000
1联仲都悦汇闵行马桥别墅  184-256㎡别墅在售53241
2华润置地赛拉维奉贤南桥3室/4室/别墅  96-124㎡住宅在售35000
3禹洲雍锦府奉贤金汇180000㎡住宅待售33000
4中铁北城时代商铺宝山杨行170000㎡临街店铺在售55000
5虹桥金茂悦青浦华新镇3室/4室  99-144㎡住宅在售0
6安亭誉墅嘉定安亭别墅  271-299㎡别墅在售44500
7长城逸府金山枫泾3室/4室  90-126㎡住宅在售15815
8新城上坤樾山半岛松江佘山别墅  136-215㎡别墅在售0
9云麓里浦东航头3室/别墅  89-124㎡住宅待售0
10明天华城浦东周康1室/2室/3室  72-149㎡住宅待售46700
11金地·公元2040浦东祝桥3室/4室/别墅  86-136㎡住宅在售44800
12UniCity万科天空之城青浦徐泾2室/3室/4室  87-155㎡住宅在售58000
13万科启宸宝山罗店2室/3室/4室/别墅  75-123㎡住宅在售35000
14瑞虹新城天悦郡庭虹口临平路165583㎡住宅待售95000
15恒大海上威尼斯上海周边启东1室/2室/3室/4室/别墅  50-197㎡住宅在售10800
16佳兆业8号奉贤南桥3室/别墅  90-180㎡别墅待售26000
17绿城上海诚园浦东临港新城3室  88-116㎡住宅在售20596
18华府天地·愉园闵行马桥别墅  152-189㎡别墅在售0
19滨江公园壹号宝山上大别墅  148-194㎡别墅待售59000
20上实滨湖城海上湾鹭居青浦朱家角2室/3室/别墅  81-136㎡住宅在售0
21央玺宝山顾村2室/3室  85-95㎡住宅待售62000

1、从excel文件读取数据

2、根据条件选择部分行

3、分组汇总,用groupby

4、列顺序调整

 

1、从excel文件读取数据

fr_all = pd.read_excel('data/lou_detail.xlsx')

 

2、根据条件选择部分行

# 原始数据中,排除部分价格为0的数据行
ex_list_price = list(fr_all['price'])
ex_list_price.remove(0)

# 并且只显示状态为 在售 的
print(fr_all[fr_all['price'].isin(ex_list_price) & fr_all['sale_state'].isin(['在售'])])

或者也可以用这种方式:

#通过~取反,选取不包含数字1的行
fr_part = fr_all[~fr_all['price'].isin([0]) & fr_all['sale_state'].isin(['在售'])]
print(fr_part)

3、分组汇总,用groupby

group_by_area1 = fr_all.groupby(['area1'])['price'].mean()

运行:

area1price
上海周边13221.05
嘉定35253.5
奉贤25360.72
宝山30461.54
崇明12281.25
徐汇128000
普陀76729
杨浦60753
松江33647.28
浦东37449.43
花桥23342.86
虹口98500
金山19786.1
长宁104169
闵行64834.43
青浦35508.37
静安73450
黄浦128466.7

group_by_area1 = fr_all.groupby(['area1','area2'])['price'].mean()

运行:

area1area2price
上海周边其他10120
启东11650
嘉兴11400
嘉善15950
太仓13425
昆山18500
嘉定南翔47000
嘉定新城38210.67
安亭29066.6
江桥45570
奉贤临港蓝湾0
南桥32391.8
奉城22000
海湾13333.33
西渡36500
金汇27085.71

4、列顺序调整

df_gp = pd.read_excel('data/day.xlsx') #读取股票数据
#print(df_gp.info())
#调整列顺序
order = ['date', 'open', 'close', 'high', 'low', 'volume']
df_gp = df_gp[order]

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值