导入pandas
import pandas as pd
读取csv文件
house1 = pd.read_csv("jinjiang.csv")
给csv文件添加表头
这个表明根据自己的进行设置
'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i','j', 'k', 'l', 'm', 'n', 'o','p'
house1 = pd.read_csv("jinjiang.csv",header=None,names=['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i','j', 'k', 'l', 'm', 'n', 'o','p'])
去除所有空格
house1.replace('\s+','',regex=True,inplace=True)
删除重复行
house1.drop_duplicates()
删除title为空的所有行
index=house1['title'].notnull()
house1=house1[index]
切割数据
title = house1["title"].str.split("·",expand=True)
house1['title']= title[0]
计算平均值
house1["a"] = (house1["a"].astype('float') / ((house1['b'].str.split("㎡",expand=True))[0]).astype('float')).round()
替换数据
house1.replace('暂无数据', 0, inplace=True)
将所有的空值替换为0
house1.fillna(0, inplace=True)
另保存
house1.to_csv("jinjiang1.csv",index=0)