数据类型转换
1.astype
DataFrame.astype(dtype, copy=True, errors=‘raise’)
dtype:数据转换的类型
copy:是否返回副本
errors:raise,ignore,数据转换过程中出现错误的反应。
import pandas as pd
df = pd.DataFrame([{'col1':'a', 'col2':'1','col3':'3.0'}, {'col1':'b', 'col2':'2','col3':'a'}])
print(df)
print(df.dtypes)
print(df['col2'].astype(int))
print(df['col3'].astype(int,errors='ignore')) #默认是raise
输出结果:
2.to_numeric
pandas.to_numeric(arg, errors=‘raise’, downcast=None)
arg:输入的数据
errors:raise,ignore,coerce,出发错误时的反应,ignore表示发生错误忽略,coerce将发生错误的值用NaN表示
import pandas as pd
s = pd.Series(['1', '2', '4.7', 'pandas', '10'])
print(s.astype(float, errors='ignore'))
print(pd.to_numeric(s, errors='coerce'))
3.numpy.where
numpy.where(condition,x,y):表示满足condition输出x,否则输出y
使用这个方法将数据中的字符串转化成数值
import numpy as np
import pandas as pd
df = pd.DataFrame([{'col1':'a', 'col2':'1','col3':'3.0'}, {'col1':'b', 'col2':'2','col3':'a'}])
print(np.where(df['col1']=='a',0,1))