python csv数据集文件解析

对csv文件进行解析的方案:

  1. 下载好的csv文件
    在这里插入图片描述

  2. 在下载的csv文件解析(python)

'''
    author: dddking
    date:2021/9/8
'''

import pandas as pd

csv_path = "C:/Users/27194/Desktop/smiles.csv"
#读取csv文件
df = pd.read_csv(csv_path,sep=";")
#只取Smiles串
df_smiles = df['Smiles']
#去除空字符
df_smiles = pd.Series.dropna(df_smiles)
smiles = list(df_smiles)
#定义smiles串在范围[3,50]之间
smiles = list(filter(lambda s:isinstance(s,str) and len(s) >= 3 and len(s) <= 50,smiles))
#去除".",且只取.前面的smiles串
for i in range(len(smiles)):
    smiles[i] = smiles[i].split('.')[0]
index=0
with open("C:/Users/27194/Desktop/smiles.txt", "w") as f:
    for smile in smiles:
            f.write(smile)
            f.write('\n')
            index += 1
            print(index)
    f.close()
print("==================")
print("done!!!!!")


总结:

对csv文件的解析,可以按照需求自己改,比如:

df_smiles = df['Smiles']

可以调用其中的其他参数来供自己使用。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值