最后收个尾
一、根据条件筛选数据,并形成新文件
import csv
input = open(r'F:/弄好的数据/生产数据-主机信息_new.csv', 'r')
output = open('生产数据-主机信息.csv', 'w',newline="")#newline=""的作用是防止写入文件时形成空行
writer = csv.writer(output)
for row in csv.reader(input):
if "*****" in row[5]: #如果*****在每一个row的第5列里
writer.writerow(row) #将这一整个row写入新文件
#print(type(row[8]))
input.close()
output.close()
代码如上
二、使用正则表达式匹配字符串的字段
import re
pattern = re.compile(r'\u0022.\d{1,3}') #写入正则表达式
num=[]
num_fail=[]
for i in range(len(s_param)): # 训话爬取到的字符串列表
str=s_param[i]
match=pattern.search(str) #模式匹配字符串
if match is None:
num_fail.append(i)
continue
final_result=match.group()[1:] #将匹配到的抓取出来放入结果
print(i,final_result)
num.append(final_result)
print(len(num))
三、画折线图
import matplotlib.pyplot as plt
y1=final_num_sorted_y
import matplotlib as mpl
mpl.rcParams['font.sans-serif']=['SimHei']
x1=range(65) #x轴坐标
plt.plot(x1,y1,label='马力数值',linewidth=3,color='black',marker='o',
markerfacecolor='red',markersize=5) # 图例为马力数值,线宽为3,颜色为黑色,点的形状是o,点的颜色是红色,点的大小为5
plt.ylabel('马力') #y轴名
plt.title('******')
plt.legend()
plt.show()
效果
四、pandas读取列表
csv_frame = pd.read_csv(r"G:\****\整理并清洗过的数据\****表.csv",encoding="gb18030")
list_check=[]
for column in csv_frame.columns:# 读取表的每一列
五、创建文件夹
os.mkdir(mkdir_path+i)
六 字符串传参数
dirct = r'C:\Users\Lgy\Desktop\****\整理并清洗过的数据\按地区分布\%s'%dir_i