Python科研数据分析专题之数据选择

本文是Python科研数据分析专题的第二部分,重点介绍如何选择和筛选数据。内容包括导入必要的库,以及选择大于、小于特定时间点及位于特定时间段内的数据操作,展示了不同筛选条件下的数据行数。
摘要由CSDN通过智能技术生成

专题二: 数据选择、筛选

Sim_Jackson | 2023

导入必要的第三方库

# 导入需要的第三方库
import pandas as pd
import os
dir_ = r'D:\科研论文\Python\数据分析'
os.chdir(dir_)
files = os.listdir(dir_) # 将该地址下的文件都列出来
files
['data.xlsx', 'google.csv', 'reaseach_data.xlsx']
# 数据读取
df = pd.read_excel(files[-1]) # -1即为倒数第一个,'reaseach_data.xlsx'
df
time X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
0 2020-01-01 7200.17 NaN NaN 96.51 NaN NaN 2.19 3 10 26
1 2020-01-02 6985.47 3257.85 1527.10 96.81 61.18 12.47 2.13 4 49 72
2 2020-01-03 7344.88 3234.85 1548.75 96.91 63.04 14.02 2.11 8 47 65
3 2020-01-04 7410.66 NaN NaN NaN NaN NaN NaN 5 58 0
4 2020-01-05 7411.32 NaN NaN NaN NaN NaN NaN 5 36 0
... ... ... ... ... ... ... ... ... ... ... ...
1090 2022-12-27 16717.17 3829.25 NaN 104.20 79.87 21.65 5.21 47 58 0
1091 2022-12-28 16552.57 3783.22 1803.35 104.53 78.86 22.14 4.71 50 40 18
1092 2022-12-29 16642.34 3849.28 1813.75 103.97 78.71 21.44 4.56 51 67 44
1093 2022-12-30 16602.59 3839.50 NaN 103.49 80.51 21.67 4.43 42 53 25
1094 2022-12-31 16547.50 NaN NaN NaN NaN NaN NaN 34 46 0

1095 rows × 11 columns

df['X2'].fillna(0)
0          0.00
1       3257.85
2       3234.85
3      
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值