python处理数据方法(四)

最后收个尾
一、根据条件筛选数据,并形成新文件

import csv
input = open(r'F:/弄好的数据/生产数据-主机信息_new.csv', 'r')
output = open('生产数据-主机信息.csv', 'w',newline="")#newline=""的作用是防止写入文件时形成空行
writer = csv.writer(output) 
for row in csv.reader(input):
    if "*****" in row[5]: #如果*****在每一个row的第5列里
        writer.writerow(row) #将这一整个row写入新文件
    #print(type(row[8]))
input.close()
output.close()

代码如上

二、使用正则表达式匹配字符串的字段

import re
pattern = re.compile(r'\u0022.\d{1,3}') #写入正则表达式
num=[]
num_fail=[]
for i in range(len(s_param)): # 训话爬取到的字符串列表
    str=s_param[i] 
    match=pattern.search(str) #模式匹配字符串
    if match is None:
        num_fail.append(i)
        continue
    final_result=match.group()[1:] #将匹配到的抓取出来放入结果
    print(i,final_result)
    num.append(final_result)
print(len(num))

三、画折线图

import matplotlib.pyplot as plt 
y1=final_num_sorted_y
import matplotlib as mpl
mpl.rcParams['font.sans-serif']=['SimHei']
x1=range(65) #x轴坐标
plt.plot(x1,y1,label='马力数值',linewidth=3,color='black',marker='o', 
markerfacecolor='red',markersize=5) # 图例为马力数值,线宽为3,颜色为黑色,点的形状是o,点的颜色是红色,点的大小为5
plt.ylabel('马力')  #y轴名
plt.title('******') 
plt.legend() 
plt.show() 

效果
在这里插入图片描述

四、pandas读取列表

csv_frame = pd.read_csv(r"G:\****\整理并清洗过的数据\****表.csv",encoding="gb18030")
list_check=[]
for column in csv_frame.columns:# 读取表的每一列

五、创建文件夹

os.mkdir(mkdir_path+i) 

六 字符串传参数

 dirct = r'C:\Users\Lgy\Desktop\****\整理并清洗过的数据\按地区分布\%s'%dir_i
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值