列名的格式比较复杂,可以看出有四种情况:
- 英文+\n+中文
- 英文+\u2028+中文
- 英文+\n+英文
- 英文
需要稍微进行一下处理便于后面的分析,有中文的保留中文部分,‘ALF\nALF’变成’ALF’,'PVD’保持不变。主要使用正则表达式进行匹配。
## 原始列名列表
col_names=list(data.columns)
col=[]
for i in range(len
列名的格式比较复杂,可以看出有四种情况:
## 原始列名列表
col_names=list(data.columns)
col=[]
for i in range(len