数据处理之数据过滤,合并与随机抽样

本文介绍了数据处理中的关键步骤——数据过滤、数据合并和随机抽样。在数据过滤部分,详细讲解了比较运算、范围运算、空值匹配、字符匹配和逻辑匹配等方法。数据合并部分,通过`concat`函数展示了如何整合多个DataFrame。随机抽样则演示了使用numpy的`randint`函数进行样本选择的实践操作。
摘要由CSDN通过智能技术生成

数据过滤与筛选

常用的数据过滤有以下五种手段:比较运算,范围运算,空值匹配,字符匹配和逻辑匹配,下面我们就以实例来进行学习。首先还是导入我们的文件

# -*- coding: utf-8 -*-
import pandas as pd 
df = pd.read_csv(r"/Users/herenyi/Downloads/4/4.8/data.csv",sep = '|', encoding = 'UTF-8')

这个文件的结构是这样的:


        id  comments                                              title
0  1197453     10071  华为(HUAWEI)荣耀平板 Wifi版 8英寸平板电脑(高通骁龙四核 1280×800 1...
1  1192330      6879  小米(MI)7.9英寸平板 WIFI 64GB(NVIDIA Tegra K1 2.2GHz...
2  1225995      2218  小米(MI)7.9英寸平板 WIFI 16GB(NVIDIA Tegra K1 2.2GHz...
3  1308557      1605  华为(HUAWEI)荣耀平板优享版 Wifi 8英寸平板电脑(高通骁龙 64位四核1280×...
4  1185287       836  微软(Microsoft) Surface Pro 3(中文版 Intel i5 128G存...
5  1197789      2084                                                NaN
6   996957 
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值