数据分析和可视化
分享python的pandas以及numpy的学习,而且包含数据的可视化
hufei_neo
算法里面的小学生,爱好技术,希望能与大家一起交流进步,每天进步一点点
展开
-
python pyecharts绘制桑基图(Sankey )
桑基图(Sankey diagram),即桑基能量分流图,也叫桑基能量平衡图。它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。因1898年Matthew Henry Phineas Riall Sankey绘制的“蒸汽机的能源效率图”而闻名,此后便以其名字命名为“桑基图”利用python的pyecharts绘制桑基图1.node(所有节点)#形如 {'name': ' '}2.link#形如 {'so...原创 2020-06-19 00:15:54 · 9349 阅读 · 2 评论 -
pandasql用sql一样的操作DataFrame
安装:pip install pandasqlfrom pandasql import sqldfpysqldf = lambda q:sqldf(q,globals())q=""" SELECT * from df"""data_end=pysqldf(q)原创 2019-10-15 16:23:33 · 517 阅读 · 0 评论 -
熟练掌握pandas的各种操作
pandas是python里面一款非常优秀的做数据分析与挖掘的包,也是所有的数据分析和挖掘从业人员最需要掌握的基本包下面介绍pandas的基本操作import pandas as pdimport numpy as np1. 读取数据# 具体参数在spyder可以快捷键ctrl+i,在jupyter notebook可以快捷键shift+tabdata=pd.read_exce...原创 2019-05-20 14:02:54 · 1092 阅读 · 0 评论 -
python怎么判断nan值
nan值不同于None,他的type是float,而None的type是NoneType所以判断是否为nanimport mathx=float('nan')math.isnan(x)True所以dataframe判断是否数据是否为nan, math.isnan(df['col1'][0]) 返回为True...原创 2019-05-24 16:52:20 · 16507 阅读 · 0 评论 -
插入numpy二维以及三维的方法
1. np.c_[]>>> np.c_[np.array([1,2,3]), np.array([4,5,6])]array([[1, 4], [2, 5], [3, 6]])>>> np.c_[np.array([[1,2,3]]), 0, 0, np.array([[4,5,6]])]array([[1, 2, 3...原创 2019-05-22 17:32:26 · 2191 阅读 · 0 评论 -
Numpy 中clip函数的用法
np.clip(a, a_min, a_max, out=None)a : array_like>>> a = np.arange(10)>>> np.clip(a, 1, 8)array([1, 1, 2, 3, 4, 5, 6, 7, 8, 8])>>> aarray([0, 1, 2, 3, 4, 5, 6, 7, 8,...原创 2019-06-26 13:30:23 · 738 阅读 · 0 评论 -
numpy多维数组取最大值的索引及前topk最大值的索引
主要介绍numpy的argmax,argsort函数,以及heapq库# 返回最大值的索引a = np.array([[6.8284258e-09, 5.7629350e-09, 7.4942248e-09,9.5846470e-11, 5.4229814e-14, 8.6114553e-15], [1.1742729e-09, 9.2132124e-10,...原创 2019-07-13 20:39:42 · 16077 阅读 · 2 评论 -
python读取dat文件
读取dat文件本想像这样df_train=pd.read_table(r'C:\Users\admin\Desktop\game_test\game\apptype_train.dat',names=['s_no','deal_code','text'],sep='\t',encoding='utf-8')不是报错就是文件读取数据量可能少了像这样读取不会有问题的f=open(...原创 2019-07-13 20:56:13 · 55796 阅读 · 6 评论 -
np.triu()的函数用法
Signature: np.triu(m, k=0)Docstring:Upper triangle of an array.(返回函数的上三角矩阵)np.triu([[1,2,3],[4,5,6],[7,8,9],[10,11,12]], -1)>>>array([[ 1, 2, 3], [ 4, 5, 6], [ 0, 8,...原创 2019-09-12 15:24:13 · 20671 阅读 · 7 评论