1.导入库后,收到警告:“Unused import statement 'from pyecharts.charts import Pie'”
警告原因:导入了,但没有使用到库。解决方法:不管他,后面用到库的时候它自己会消除警告。
2.相对路径导入文件:代码和数据存储在同一文件夹下,可以使用相对路径进行调用,例如当代码和data文件夹存储在一个文件夹里时,想要调用data文件夹里的数据:“data\世界500强数据.xlsx”,注意反斜杠的方向。有时候相对路径会出错,可以尝试将“\”改写为“\\”,或将相对路径写为绝对路径。
3.df.head(),没写参数的话默认导出前五行数据,也可以 自行编辑导入几行。
4.groupby
df.groupby('国家')['公司名称'].count().to_frame('数量').reset_index()
其中:
df.groupby('国家')['公司名称'].count() #将表格内容按照“国家”进行分类,并统计各类中公司名称的数量
.to_frame() #将给定的系列对象转换为 DataFrame
参考文章Pandas的DataFrame和pandas.core.series.Series
.reset_index()重置索引,生成一个新的DataFrame或Series,可以把索引用作列。
参考文章reset_index()函数
5.sort_values()
pandas中的sort_values()函数原理类似于SQL中的order by,可以将数据集依照某个字段中的数据进行排序,该函数即可根据指定列数据也可根据指定行的数据排序。
参考文章
今日遗留问题:jupyter的可视化结果没有显示~