数据分析
文章平均质量分 58
Arthur54271
人生苦短,我用Python
展开
-
数据分析:对NumPy中dot()函数的理解
一、dot()的使用参考文档:https://docs.scipy.org/doc/numpy/reference/generated/numpy.dot.htmldot()返回的是两个数组的点积(dot product)1.如果处理的是一维数组,则得到的是两数组的內积(顺便去补一下数学知识)In : d = np.arange(0,9)Out: array([0, 1, 2, 3, 4, 5, ...转载 2018-06-13 15:40:38 · 666 阅读 · 0 评论 -
数据分析~DataFrame画图
import pandas as pdimport numpy as npimport matplotlib.pyplot as plt%matplotlib notebook # 设置绘图样式plt.style.use('seaborn-colorblind')np.random.seed(100)df = pd.DataFrame({'A': np.random.ran...原创 2018-07-25 10:01:42 · 2352 阅读 · 0 评论 -
数据分析~借助pandas绘制横轴为时间的线图
import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as plt%matplotlib inline# 借助pandas绘制横轴为时间的线图import pandas as pdplt.figure()observation_dates = np.arange('2...原创 2018-07-24 17:16:34 · 3134 阅读 · 1 评论 -
数据分析~数据可视化-seaborn
详细介绍可以看seaborn官方API和example galler。1 set_style( ) set( )set_style( )是用来设置主题的,Seaborn有五个预设好的主题: darkgrid , whitegrid , dark , white ,和 ticks 默认: darkgrid import matplotlib.pyplot as ...转载 2018-07-24 16:24:54 · 1015 阅读 · 0 评论 -
数据分析~中国五大城市PM2.5数据分析02
main02.py""" 文件名: main02.py 功能: 主程序 中国五大城市PM2.5数据分析 任务: - 统计每个城市每天的平均PM2.5的数值 - 基于天数对比中国环保部和美国驻华大使馆统计的污染状态 数据集来源:https://www.kaggle.com/uciml/pm25-data...原创 2018-07-24 14:12:20 · 3681 阅读 · 1 评论 -
数据分析~中国五大城市PM2.5数据分析01
1、config.pyimport os# 指定数据集路径dataset_path='./data'# 结果保存路径output_path='./output'if not os.path.exists(output_path): os.mkdir(output_path)# 公共列common_cols=['year','month']# 每个城市对...原创 2018-07-23 21:05:01 · 3927 阅读 · 1 评论 -
数据分析~pandas.Series 生成柱状图
import numpy as npimport pandas as pdimport matplotlib.pyplot as plt#Series 生成柱状图figure,pic=plt.subplots(2,1)data=pd.Series(np.random.rand(20),index=list('qwertyuiopasdfghjklz'))data.plot(kin...原创 2018-07-02 16:23:37 · 4935 阅读 · 0 评论 -
数据分析~matplotlib画图
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltframe01=pd.DataFrame([[2,4,8,16,32,64],[3,5,12,24,48,96],[5,10,15,20,25,30],[1,3,5,7,9,11],[16,8,4,2,1,0.5]],index=range(0,100,...原创 2018-07-02 15:29:04 · 238 阅读 · 0 评论 -
数据分析~pandas画图
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltser=pd.Series(np.random.randn(10).cumsum(),index=np.arange(0,100,10))ser.plot(kind='line',figsize=(4,3),title='pandas_plot',grid...原创 2018-07-02 15:09:12 · 232 阅读 · 0 评论 -
数据分析~matplotlib~加注解
#加注解fig,subpic=plt.subplots()subpic.plot([2,5,67,45,32,6,12,34,54,87,1,3,7,0,89,9],[12,15,7,5,82,16,2,4,4,57,1,3,7,0,69,0],'b*-')subpic.set_xticks([0,25,50,75,100])subpic.set_xticklabels(['jenuary...原创 2018-07-02 14:38:39 · 254 阅读 · 0 评论 -
数据分析~matplotlib~添加刻度与标签
table=plt.figure()ax=table.add_subplot(1,1,1)# ax.plot(np.random.randn(1000).cumsum())#设置X轴刻度值tick=ax.set_xticklabels([0,25000,50000,75000,100000])#添加X轴刻度标签x_scale_name=ax.set_xticklabels(['step...原创 2018-07-02 13:49:16 · 1896 阅读 · 0 评论 -
数据分析~matplotlib~连线插值阶跃图
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltdata=np.array([1,2,3.2,2.3,4.6,7.5,2.3,6.5,7.8,9])data_1=np.unique(data)fig,axes=plt.subplots(figsize=(16,13))axes.plot(data_1...原创 2018-07-02 10:00:51 · 1111 阅读 · 0 评论 -
《Python数据分析常用手册》一、NumPy和Pandas篇
一、常用链接:1.Python官网:https://www.python.org/2.各种库的whl离线安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scikit-learn3.数据分析常用库的离线安装包(pip+wheels)(百度云):http://pan.baidu.com/s/1dEMXbfN 密码:bbs2二、常用库1.NumPy Num...转载 2018-06-16 15:58:56 · 270 阅读 · 0 评论 -
数据分析~matplotlib.pyplot画布、画图
import numpy as npimport matplotlib.pyplot as plt#视图 x\y等分越细致,画图越细致x=np.arange(-100,100,1)y=np.arange(-80,80,1)x,y=np.meshgrid(x,y)z=np.sqrt(x**2+y**2)#画图#1、创建画布fig=plt.figure()#分画框,两行两列,标注...原创 2018-06-14 11:52:25 · 1177 阅读 · 0 评论 -
数据分析~matlab plot 坐标、字体、子图
转载于http://hi.baidu.com/hustliao/blog/item/ef0eadd9dbc8042910df9b65.html在绘图命令中应该如何确定横坐标和纵坐标的标度尺寸(自己定范围)如何在一个坐标中绘制多条曲线,并用不同的颜色区别。希望得到答案,谢谢!!!!!!!!!!!help plothelp axisaxis ('xlabel','ylabel')a1=...转载 2018-07-28 23:22:20 · 6417 阅读 · 0 评论