这里写自定义目录标题
知识回忆总结
1、Python 合并两个表:
1.1 append()
向列表尾部追加一个新元素,列表只占一个索引位,在原有列表上增加。
1.2 extend()
向列表尾部追加一个列表,将列表中的每个元素追加进去,在原有列表上增加。
1.3 +
与extend()效果相同,但实际上是生成了一个新的列表存放这两个列表的和。只能用在两个列表相加上面。
1.4 zip
将几个无关的内容打包放到一起。
2、将datetime类型的日期时间进行拆分是报错处理AttributeEeeor
可能是数据格式不对,我们再使用datetime模块在dateframe数据框中提取日期的月份信息,需要使用map()或者apply()函数实现:
df[‘month’] = df[‘date’].apply(lambda x: x.month)
注:对于datetime类型的日期想要拆分使用map()或apply()函数。
你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。
3、object类型与日期类型datetime互相转换
to_datetime():object 转换为datetime
strftime():datetime转为object类型。
#将指定数据转为相应类型的datetime64型数据
df[‘df_time’]=pd.to_datetime(df[‘date’],format=’%Y-%m-%d’)
#将时间型转为字符型
df_object=df_time.map(lambda x:x.strftime(’%Y-%m-%d’))
4、#pandas通过一列特征值条件去修改另一列:比如通过用户id修改对应的用户年龄
df.loc[(df.user_id == 000000),‘age’] = ‘56岁以上’
5、#修改数据类型,例:
df.brand.astype(float)
6、#使用某个值进行数据代替,比如age中有-1的,我用15岁以下进行代替
df[‘age] = df[‘age’].repalce(’-1,‘15岁以下’)
7、#显示一列或几列中所有数据
pd.set_option(‘display.max_columns’, None)
pd.set_option(‘display.max_rows’, None)
pd.set_option(‘display.width’,1000)
8、#保存文件
df.to_csv(’’,index=False,encoding=‘utf-8-sig’)
9、#拆分
.str[]
10、#选取几列
users = df[[‘user_id’,‘age’,‘sex’]]
df1 = pd.DataFrame(users,columns=[‘user_id’])
11、使用Python对数据进行筛选
#1、使用isin函数筛选
df[df[‘单价’].isin([20.9,30.9])]
#2、使用loc进行筛选
df.loc[(df[‘单价’] == 20.9) | (df[‘单价’] == 30.9)]
#使用字符串的模糊筛选:在pandas中我们使用str.contains()实现
df.loc[df[‘区域’].str.contains(‘华东’)]
df.loc[df[‘区域’] == ‘华东’,:]
#使用|进行多个条件的筛选:筛选包含某一字符的行
df.loc[df[‘区域’].str.contains(‘华东|华’)]
df.loc[df[‘区域’].str.contains(‘华|东’)]
12、#随机生成6个6位数
for i in range(6):
ch = random.randrange(189292,199999)
print(ch)