目录
一、数据获取
import pandas as pd
io = r'C:\Desktop\企查查下载\龙头企业数据评分.xlsx'
data = pd.read_excel(io, sheet_name = 0)
data.head(10)
结果展示:
二、数据清洗
1. 注册资本
import re
registered_capital = data['注册资本']
capital = []
for i in registered_capital:
# m = str(i).replace('-','0') #匹配到“-”并替换为“0”
now = int(re.match("\d*", i).group()) #group(0) 同 group() 就是匹配正则表达式整体结果
capital.append(now)
data['注册资本新'] = pd.DataFrame(capital) #数据存