python 数据类型转换& dataframe内数据类型转换
一、基本数据转换
1、python3中有6个标准数据类型
A. Number(数字)
• 数值的除法(/)总是返回一个浮点数,要获取整数使用//操作符
• 在混合计算时,python会把整形转换为浮点数
B. String(字符串)
• 如果不想让反斜杠发生转义,可以在字符串前面加个r表示原始字符串
• 索引值以0为开始,-1为末尾的开始位置
• 加号+是字符串的连接符,星号*表示复制当前的字符串,紧跟的数字为复制的次数
C. List(列表)
• 方括号,元素用逗号隔开
• list中的元素可以改变的
D. Tuple(元组)
• 元组的元素不能修改,小括号。用逗号隔开
• 注意构造包含0或1个元素的元组的特殊语法规则
E. Sets(集合)
• 基本功能是进行成员关系的测试和删除重复元素
F. Dictionary(字典)
• 字典是一种映射类型,字典用{}标识,它是一个无序的建(key):值(value)对集合
• 建(key)必须使用不可变类型。在同一个字典中建(key)必须是唯一的
• 创建空字典使用{}
#数据转换
二、dataframe内数据转换
1、.astype()方法
df[‘col2’] = df[‘col2’].astype(‘int’)
df[‘col2’] = df[‘col2’].astype(‘float64’)
df.astype(‘int32’)
2、 pd.to_XXX()方法
pd.to_numeric() #转化为数字型,根据情况转化为int或float
to_string() #转化为字符型
to_dict() #转化为字典,不能处理单列数据
to_timestamp() #转化为时间戳,以前还特意写了个函数转换,何必呢
to_datetime() #转化为datetime64[ns]
三、注意
1、若是dataframe内有很多数据类型,则输出表述为object
2、若是原数据集(str)有非整类型(1.0),用astype只能直接转换为float。可以先转为float 转int。