python数据分析
使用python语言对大数据进行数据分析
Go__home
这个作者很懒,什么都没留下…
展开
-
numpy + matplotlib 对csv数据进行分析
csv文件中存储了英国与美国Youtube数据,其每列对应的是:点击,喜欢,不喜欢,评论。1、结合Matplotlib绘制各自的评论数量的图形,体现其评论数主要分布在哪个区间。import numpy as np#读取英国数据GB_comment = np.loadtxt('GB_video_data_numbers.csv',delimiter=',',usecols=(3), unp...原创 2020-05-08 14:02:23 · 1059 阅读 · 1 评论 -
numpy-where()函数
where()函数是numpy模块中的一个函数,它的语法如下:where(condition, [x, y])有点类似python中的三目运算符:x = a if condition else b[x,y]是可选参数,举个例子:import numpy as nparr = np.random.randint(0,10,(3,5))print (arr)np.where(a...原创 2020-05-08 13:54:50 · 1033 阅读 · 0 评论 -
深复制和浅复制的区别(列表和numpy数组的区别)
文章目录1、浅复制1.1列表1.2字典2、深复制2.1 列表2.2 字典3、总结在python中很多时候需要进行复制的操作,比方说给一个变量赋值为另一个变量,这就是一个复制。事实上,对于不同类型的对象,有的时候这种复制是深复制,有时候是浅复制。下面在例子中具体介绍。1、浅复制顾名思义,浅复制就是浅浅地复制,只复制了它的表面,没有复制深层次的东西。就像是只复制了她好看的皮囊,没有复制到她独...原创 2020-05-02 07:43:19 · 1421 阅读 · 0 评论 -
matplotlib-完美条形图的完整绘制方法
文章目录1、条形图适用情景2、条形图的绘制2.1 横向2.2 纵向3、充分发掘条形图的美3.1 plt.bar()3.2 plt.barh()1、条形图适用情景使用宽度相同的条形来表示数据的多少。主要用于比较两组数据之间的差别,能够一眼看出各个数据的大小。2、条形图的绘制这里用到plt.bar(),是一般用到的纵向,如果喜欢横向的,可以用plt.barh()。先来举个简单的例子,后面再...原创 2020-04-30 23:28:13 · 1218 阅读 · 0 评论 -
python_numpy中,shape=(1,4)和(4,)的区别
按照惯性思维,似乎两个形状指的都是1行4列,哪里有什么不一样嘛,怀疑我的高数吗,没下过100分呢。 尽管嘴上说这不可能,心里还是不服气,还是要试一下吧(-)import numpy as nparr1=np.arange(4).reshape(4,)arr2=np.arange(4).reshape(1,4)print('arr1:\n',arr1)print('arr2:\n'...原创 2020-04-26 16:27:03 · 3044 阅读 · 1 评论 -
matplotlib图形组成以及图表优化显示
通常来说,我们画图就是两个轴,x轴和y轴。但是这样画出来的图形很丑,而且没有一些说明,让人看了以后云里雾里的。1、图形组成title标题grid网格lable轴标签ticks刻度2、优化图表下面我们对图表显示进行优化,加上标题 、轴标签、更改刻度、显示网格。import randomfrom matplotlib import pyplot as pltplt.figur...原创 2020-04-19 08:18:47 · 351 阅读 · 0 评论 -
matplotlib实战,折线图的绘制及优化
下面是一个实例,csv文件中存储了一段时间内,某条微博每天的点赞数及评论数。用折线图将两条折线绘制出来。import csvimport matplotlibfont = { 'family':'SimHei', 'weight':'bold', 'size':12}matplotlib.rc("font", **font)with open('weibo.c...原创 2020-04-18 22:21:26 · 1204 阅读 · 2 评论 -
matplotlib解决中文乱码问题,设置字体两种方式
文章目录1、matplotlib中文乱码原因2、全局设置1、matplotlib中文乱码原因当我们在把轴标签、标题等名称设置成中文时,会出现乱码。这是因为matplotlib本身时不支持中文显示的,需要我们自己去设置。2、全局设置import matplotlibfont = { 'family':'SimHei', 'weight':'bold', 'size...原创 2020-04-18 10:18:43 · 4867 阅读 · 7 评论 -
python第三方库matplotlib的安装与使用
文章目录一、为什么要使用matplotlib?二、matplotlib的安装三、matplotlib的使用1、创建新的图形1.1 创建图形-->创建子图1.2 直接创建2、折线图的绘制一、为什么要使用matplotlib?我们有时候会遇到一大堆数据,然而数据不是放在表格里就结束了,我们需要对数据进行分析,这时候就需要用到数据可视化。matplotlib就是用来把数据很美观的展现在一张张...原创 2020-04-18 08:23:29 · 3327 阅读 · 0 评论 -
python基础--用python来读写文件(三)(csv文件的读写)
之前写的一篇2000字不小心被我弄丢了,含着泪再写一遍吧。CSV文件平常接触的不多,但它是非常有用的一种文件格式,经常用来作为不同程序之间的数据交互格式。它特定的格式,带给了它无限的魅力。读了下面这篇文章,你就会发现它的迷人之处。一、什么是CSV文件?CSV是Comma Separate Values的缩写,翻译过来就是逗号分隔值。顾名思义,那我们就知道它里面是储存的一些值,并且他们是用逗号隔...原创 2020-04-10 07:59:24 · 3451 阅读 · 1 评论 -
python基础--用python来读写文件(四)(excel文件的读写)
csv文件之前也没怎么接触过,但是事实上这是一种使用很方便的文件类型。一、什么是CSV文件?1、简要介绍CSV的全称是Comma-Separated Values,翻译一下就是逗号分隔值。老规矩,不懂了就百度。百科是这么说的:这种格式的文件是用纯文本的形式存储表格数据(也就是数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成...原创 2020-04-09 22:14:28 · 474 阅读 · 1 评论 -
python基础--用python来读写文件(二)(json文件的读写)
之前接触json数据格式比较少,但是很多数据交互都用到了它,所以有必要来了解一下。一、json文件是什么首先来看一下百科对它的介绍:JSON(JavaScript Object Notation, JS 对象简谱) 是一种轻量级的数据交换格式。它基于 ECMAScript (欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 ...原创 2020-04-09 20:45:59 · 384 阅读 · 2 评论 -
python基础--用python来读写文件(一)
一、文件读写说明1、简介为什么要使用python来读写文件呢?我直接在我的电脑中打开文件,一目了然,想改哪里改哪里,so easy,为什么要废这功夫?当然,如果你只是读写个别文件,直接在文件中操作比较省事。但我们在这里讨论的是对大数据进行分析,你总不能把我们需要的数据一个一个复制粘贴吧,那我们就需要使用python来自动的读写文件。2、文件读写的步骤在使用python进行文件读写之前,我...原创 2020-04-09 09:35:06 · 906 阅读 · 0 评论 -
python代码编辑器Jupyter的使用
一、Jupyter的介绍1、Jupyter是什么?之前我在这篇文章中介绍过,Jupyter是可以作为python的一种代码编辑器(当然,它不只是为python服务,它懂得语言比较多)。我们先来打开Jupyter的官网来看一下。可以看到它的logo是一个木星的样子,名字和木星(jupiter)差一个字母,太阳系中最大的行星,非常霸气,周围环绕着各种各样的语言,可以看出它博学多才。使用它之...原创 2020-04-08 22:01:14 · 42527 阅读 · 0 评论