1、使用字典创建df的时候,如果字典的key只有一个value会报错:
dict_data = {"a":1, "b":2, "c":3}
df = pd.DataFrame.from_dict(dict_data, orient ='columns')
需要这样做:
dict_data = {"a": 1, "b":2, "c":3}
df = pd.DataFrame.from_dict(dict_data,orient ='index').T
或者
dict_data = {"a": [1], "b":[2], "c":[3]}
df = pd.DataFrame.from_dict(dict_data,orient ='columns')
2、python中字符串的最后一个字符是斜杠会导致出错
save_path = r"E:\result\" + "novel"+ '.txt'
报错 SyntaxError: EOL while scanning string literal,写成下面这样就不会错了
save_path = r"E:\result" + r"\novel"+ '.txt'
3、空值判断
pandas的空值定义为numpy.nan。对整体的series或Dataframe判断是否未空,用isnull()
pd.isnull(df) # 判断df是否为空,返回布尔值
df = df[df[col].isnull()] # 筛选出df中,列col为空的部分
对单独的某个值判断,可以用 np.isnan(),不可用 x==NaN;
np.isnan(df.iloc[0,2]) #对df的第0行第2列判断