学习记录:
1,matplotlib作图,标题或标签含中文,设定simhei依然出现方框。
原因,没安装此字体
解决,从win下拷贝simhei.ttf到font文件夹下,并修改配置文件,三处。
此时运行还是框框
原因未清除缓存目录
解决
2,生成list格式的时间序列
pd.date_range('11/15/2019','11/25/2019',freq='d').strftime("%Y-%m-%d").tolist()
DatetimeIndex不可以直接转换为list,需借助strftime函数接收以时间元组,返回以可读字符串,格式由参数format决定。
format,%Y-%m-%d %H:%M:%S --->'2019-11-15 00:00:00'
3,学习小记
>>> import numpy as np
>>> import pandas as pd
>>> data = DataFrame(np.random.randn(1000,4))
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
NameError: name 'DataFrame' is not defined
利用python进行数据分析第一版,P211页代码错误。应为:
data = pd.DataFrame(np.random.randn(1000,4))
python 3日常工作总结
1
4,多个dataframe,列名不同如何拼接
实际工作中数据源来自多方,同一份数据列名各式各样,如何实现列名不同数据的汇总(实现union all的功能)
举例说明:
需要实现的效果:
一般concat实现效果
该如何解决这一问题:修改列名。把列名修改成你喜欢的
方法一:df.columns=[]
注:这种方法有弊端,如从本地读取文件到python,文件的列数不确定,如可能有空列,这是会造成命名失败(2列有数据,3列空白,如果用这种方法,会报错:
Length mismatch: Expected axis has 5 elements, new values have 2 elements)
方法二:当从本地导入文件,原列名不定,空白列不确定是否存在时
df
5,多个df保存到同一Excel不同sheet中
import
等同于下面这段
import