每家网站都是一些稀奇古怪的要求,提交数据个数也受限,真真是相当棒(渣)。
你是甲方爸爸你最牛,为了生活我妥协了。
你有要求,我有对策,虽然折腾了点,但耗得起,谢谢您锻炼了我嘞~
当你手头有一批十几万的数据,需要500为一批次的提交,只能用逗号隔开不间断,不能有其他的空白或者空行特殊字符等,怎么来快速处理他们呢?
鄙人不才,只能想到一个小方法,然后保存在每个txt里,复制→提交→成功。
import pandas as pd
df = pd.read_excel(r'C:\Users\Administrator\Desktop\可提问答资源id.xlsx')
for i in range (0,int(len(df["resource_id"])/500+1)):
divde_ = df["resource_id"].iloc[i*500+1:(i+1)*500+1]
save_df =",".join(str(j) for j in divde_)
fh1 = open(r'F:\搜狗分割\文章分割\文章分割'+str(i)+'.txt', 'w', encoding='utf-8')
fh1.write(save_df)
fh1.close() # 保存字符串只能想到用此方法
然后,每500一个组,分批存在了对应的文件夹下面,想提哪个就打开哪个,然后复制提交再删,相当渣属性了,嘻嘻~