python数据清洗之list去空格_Python第19课:数据清洗之去错、去空、去重

Python第19课:数据清洗之去错、去空、去重

时间 2019-02-01 下午3:30

主讲 刘培富

地点 四楼电教室

数据清洗是数据治理的关键环节,是指对获取的原始数据(也称“脏数据”)进行审查、校验、加工的过程,目的在于删除重复信息、纠正错误信息,保持数据一致性。

一般来说,数据清洗,主要是对数据进行去错、去空、去重处理。

一、去错

针对一张包含姓名、身份证号码、车牌号码的数据表,建立纠错规则如下:

1.车牌号既不包含汉字赣,且不包含汉字饶。

2.身份证号码的年份既不等于19也不等于20,身份证号码的月份大于12,身份证号码的日期大于31。

3.身份证号码位数不等于18。

4.姓名的长度小于等于1。import cx_Oracle

conn=cx_Oracle.connect('lpf/****@//****/****')

cur=conn.cursor()

sql="select * from diandong"

cur.execute(sql)

data=cur.fetchall()

jg="数据清洗发现的问题数据:"

m=0

for i in data:

b=i[2]

if b.find('饶')==-1 and b.find('赣')==-1 and b.find(&#

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
可以使用Python进行数据清洗,根据提供的引用内容,有两种处理方法。 方法一是使用原生Python进行处理。首先,可以使用read_file函数读取txt文件,并将数据存储在列表中。然后,使用一个新的列表new_ss来存储去重后的数据,通过判断数据是否在new_ss中进行去重。最后,将去重后的数据写入新的文件newfile.txt中。这样就完成了数据清洗的过程。 方法二是使用pandas库进行处理。首先,使用read_csv或者read_table函数读取txt文件,并进行格式化处理,去除行前和行末的空格。然后,使用split函数对数据进行分割,将每行数据分割为单个元素。最后,将转换后的数据存储在DataFrame类型中,可以方便地进行后续处理。 这两种方法都可以实现对非格式化的txt文件进行数据清洗,选择哪种方法可以根据具体情况和个人喜好进行选择。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [Python数据清洗:从文件读取数据行并去重](https://blog.csdn.net/zhangphil/article/details/89436657)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [数据清洗Python读取txt数据,txt数据分隔符处理](https://blog.csdn.net/eyexin2018/article/details/123323703)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值