数据处理
w_shuo
这个作者很懒,什么都没留下…
展开
-
数据处理之pandas 中unique()函数与nunique()函数区别
pandas 之unique()函数与nunique()函数区别.区别:(1)unique()是以 数组形式(numpy.ndarray)返回所选列的所有唯一值(特征的所有唯一值)(2)nunique() Return number of unique elements in the object.即返回的是唯一值的个数;等同于用法:len(ratings_df[‘title’].unique())...原创 2020-10-26 10:45:54 · 4243 阅读 · 0 评论 -
数据处理之数据去重
基本方法:Pandas中数据去重一般是用duplicated()和drop_duplicates()两个方法进行相结合函数介绍:duplicated 返回一个布尔向量,其长度为行数,表示行是否重复。drop_duplicates 删除重复的行。用法示例:movies_df.shape(45463, 2)movies_df.duplicated(['id', 'title']).sum() #返回重复项总数30movies_df.drop_duplicates(['id'], in原创 2020-10-26 10:44:57 · 1882 阅读 · 0 评论 -
数据处理之Pandas中数据类型转换
Pandas中进行数据类型转换有三种基本方法:使用astype()函数进行强制类型转换自定义函数进行数据类型转换使用Pandas提供的函数如to_numeric()、to_datetime()举例数据import numpy as npimport pandas as pd data = pd.read_csv('data.csv', encoding='gbk') #因为数据中含有中文数据data使用astype()函数进行强制类型转换data['客户编号'].astype(原创 2020-10-23 20:36:38 · 37607 阅读 · 1 评论