python读取csv文件指定数据_在Python中从CSV文件的特定列中提取数据

. . . and storing it in a PY file to use the data to graph after storing all the data in different files . . .

. . . I would want to store only "2345678@abcdef" and "365" in the new python file . . .

确实要将数据存储在python文件中吗?Python文件应该保存Python代码,它们应该可以由Python解释器执行。最好将数据存储在数据类型文件中(比如,preprocessed_data.csv)。在

要获得与模式匹配的文件列表,可以使用python内置的^{} library。在

下面是一个如何读取目录中的多个csv文件并从每个文件中提取所需列的示例:import glob

# indices of columns you want to preserve

desired_columns = [1, 4]

# change this to the directory that holds your data files

csv_directory = '/path/to/csv/files/*.csv'

# iterate over files holding data

extracted_data = []

for file_name in glob.glob(csv_directory):

with open(file_name, 'r') as data_file:

while True:

line = data_file.readline()

# stop at the end of the file

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 你可以使用 Pythoncsv 库来读取 CSV 文件,并使用正则表达式来处理这一列的数据。下面是一个例子: ``` import csv import re # 打开 CSV 文件 with open('data.csv', 'r') as f: # 创建 CSV 阅读器 reader = csv.reader(f) # 遍历所有行 for row in reader: # 获取累计评论列的值 comments = row[3] # 使用正则表达式提取数字 num = re.search(r'(\d+)', comments) if num: # 转换为整数 num = int(num.group(1)) # 如果含有单位"万",则将数值乘以10000 if '万' in comments: num *= 10000 # 输出转换后的数值 print(num) else: # 如果没有匹配到数字,输出0 print(0) ``` 在这段代码,我们首先打开了 CSV 文件,然后创建了一个 CSV 阅读器来读取文件数据。接着我们遍历所有行,获取每行的第四列(即累计评论列)的值。然后使用正则表达式提取出数字,并将其转换为整数。最后,我们检查评论列中是否包含单位"万",如果有,则将数值乘以10000。最后,我们输出转换后的数值。 希望这个例子能帮助你。 ### 回答2: 要将'5万'转换成50000,在Python可以使用正则表达式来提取数字,并根据单位进行相应的转换。以下是一个示例代码: ```python import re def convert_to_number(s): # 判断是否包含万的单位 if '万' in s: # 使用正则表达式提取数字部分 num = re.findall(r'\d+', s)[0] # 转换成整数并乘以10000 return int(num) * 10000 else: # 如果没有单位,直接将字符串转换成整数 return int(s) # 示例用法 s = '5万' result = convert_to_number(s) print(result) # 输出:50000 ``` 以上代码,`convert_to_number`函数可以接受一个字符串作为参数,并通过正则表达式提取数字部分。如果字符串包含'万'这个单位,则将数字部分转换成整数并乘以10000,最后返回转换后的结果。如果字符串没有单位,则直接将字符串转换成整数。 ### 回答3: 要将"累计评论"列中的'5万'转换为50000,可以使用Python的pandas库来读取csv文件并进行处理。 首先,需要安装pandas库。可以使用以下命令安装pandas: ``` pip install pandas ``` 接下来,可以使用以下代码读取csv文件并进行转换: ```python import pandas as pd # 读取csv文件 data = pd.read_csv('file.csv') # 将'累计评论'列中的'5万'转换为50000 data['累计评论'] = data['累计评论'].replace('5万', 50000) # 打印转换后的结果 print(data) ``` 其,'file.csv'是csv文件的路径,需要根据实际情况进行修改。 以上代码使用pandas的replace函数将'5万'替换为50000,并更新了'累计评论'列的值。最后,通过print语句打印转换后的结果。 注意:以上代码假设csv文件的'累计评论'列确实包含'5万'这个指定字符串。如果csv文件的列名或数据与示例不一致,请根据实际情况进行修改。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值