import pandas as pd
import faker
f = faker. Faker( locale= "zh-cn" )
df = pd. DataFrame( { "姓名" : [ f. name( ) for i in range ( 5 ) ] ,
"年龄" : [ f. random_int( 22 , 45 ) for i in range ( 5 ) ] ,
"电话" : [ f. phone_number( ) for i in range ( 5 ) ] ,
"日期" : [ f. date_between( start_date= "-1y" , end_date= "today" )
. strftime( "%Y年%m月%d日" ) for i in range ( 5 ) ] ,
"性别" : [ f. random_element( ( "男" , "女" ) ) for i in range ( 5 ) ] ,
"地址" : [ f. address( ) for i in range ( 5 ) ]
} )
df
姓名 年龄 电话 日期 性别 地址 0 唐杨 41 13348639055 2022年04月11日 女 河北省宇市翔安南京街u座 204630 1 巫玉华 42 13637135508 2022年03月07日 女 青海省桂英市东丽杨街i座 621007 2 谢瑞 45 18525501481 2022年03月28日 女 四川省莉县和平呼和浩特路B座 743642 3 熊金凤 42 14529148966 2021年11月14日 男 广东省平县和平巢湖路K座 940870 4 孙玉英 22 18598356093 2022年01月03日 女 陕西省太原市萧山李路n座 873365
1.删除具体列
df. drop( '电话' , axis= 1 )
df. drop( columns= [ '电话' ] )
姓名 年龄 日期 性别 地址 0 唐杨 41 2022年04月11日 女 河北省宇市翔安南京街u座 204630 1 巫玉华 42 2022年03月07日 女 青海省桂英市东丽杨街i座 621007 2 谢瑞 45 2022年03月28日 女 四川省莉县和平呼和浩特路B座 743642 3 熊金凤 42 2021年11月14日 男 广东省平县和平巢湖路K座 940870 4 孙玉英 22 2022年01月03日 女 陕西省太原市萧山李路n座 873365
2.删除具体行
df. drop( 0 )
姓名 年龄 电话 日期 性别 地址 1 巫玉华 42 13637135508 2022年03月07日 女 青海省桂英市东丽杨街i座 621007 2 谢瑞 45 18525501481 2022年03月28日 女 四川省莉县和平呼和浩特路B座 743642 3 熊金凤 42 14529148966 2021年11月14日 男 广东省平县和平巢湖路K座 940870 4 孙玉英 22 18598356093 2022年01月03日 女 陕西省太原市萧山李路n座 873365
3.条件筛选指定数据
df. loc[ df[ '性别' ] != '男' ]
姓名 年龄 电话 日期 性别 地址 0 唐杨 41 13348639055 2022年04月11日 女 河北省宇市翔安南京街u座 204630 1 巫玉华 42 13637135508 2022年03月07日 女 青海省桂英市东丽杨街i座 621007 2 谢瑞 45 18525501481 2022年03月28日 女 四川省莉县和平呼和浩特路B座 743642 4 孙玉英 22 18598356093 2022年01月03日 女 陕西省太原市萧山李路n座 873365
4.根据字符挑选/删除
df. loc[ ~ df[ '地址' ] . str . contains( '陕西省' ) ]
姓名 年龄 电话 日期 性别 地址 0 唐杨 41 13348639055 2022年04月11日 女 河北省宇市翔安南京街u座 204630 1 巫玉华 42 13637135508 2022年03月07日 女 青海省桂英市东丽杨街i座 621007 2 谢瑞 45 18525501481 2022年03月28日 女 四川省莉县和平呼和浩特路B座 743642 3 熊金凤 42 14529148966 2021年11月14日 男 广东省平县和平巢湖路K座 940870