![](https://img-blog.csdnimg.cn/20200420165913499.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
Python数据分析
文章平均质量分 94
Python数据分析
第五本日记
这个作者很懒,什么都没留下…
展开
-
数据分析6-数据可视化
基本概念数据可视化是指借助于图形化的手段,清晰、快捷有效的传达与沟通信息。同时,也可以辅助用户做出相应的判断,更好的去洞悉数据背后的价值matplotlibmatplotlib是用于Python的绘图库,提供各种常用图形的绘制。例如,条形图,柱形图,线图,散点图等根据惯例,使用如下的方式导入:import matplotlib as mplimport matplotlib.pyplot as plt一、图形绘制绘制线图可以通过matplotlib.pyplot的plot方法进行图形绘制原创 2021-05-20 11:46:24 · 1306 阅读 · 0 评论 -
数据分析5--多层索引与分组聚合
一、多层索引MultiIndex,即具有多个层次的索引,有些类似于根据索引进行分组的形式。通过多层次索引,我们就可以使用高层次的索引,来操作整个索引组的数据。多层索引的创建方式第一种创建多层索引方式:我们在创建Series或DataFrame时,可以通过给index(columns)参数传递多维数组,进而构建多维索引。【数组中每个维度对应位置的元素,组成每个索引值】多维索引的也可以设置名称(names属性),属性的值为一维数组,元素的个数需要与索引的层数相同(每层索引都需要具有一个名称)。s1原创 2021-05-19 14:44:18 · 775 阅读 · 0 评论 -
数据分析4--数据相关处理
一、数据加载从csv读取数据首先,我们需要将收集的数据加载到内存中,才能进行进一步的操作。pandas提供了非常多的读取数据的函数,分别应用在各种数据源环境中,我们常用的函数为:read_csvread_tableread_sql其中:read_csv与read_table默认使用的分隔符不同read_csv与read_table常用的参数如下:sep / delimiterheadernamesindex_colusecols具体使用方式如下:read_csv与read_tab原创 2021-05-17 12:22:34 · 526 阅读 · 0 评论 -
数据分析3--Pandas基本使用
一、简介Pandas库基于Numpy库,提供了很多用于数据操作与分析的功能。安装与使用:pip install pandas根据惯例,我们使用如下的方式引入pandas:import pandas as pd两个常用数据类型:SeriesDataFrame二、Series类型Series类型类似于Numpy的一维数组对象,可以将该类型看做是一组数据与数据相关的标签(索引)联合而构成(带有标签的一维数组对象)。创建方式列表等可迭代对象、ndarray数组对象、字典对象、标量关于Se原创 2021-05-13 15:48:01 · 304 阅读 · 0 评论 -
数据分析2-numpy基本使用
一、简介:NumPy(Numerical Python的简称),是科学计算基础的一个库,提供了大量关于科学计算的相关功能,例如,线性变换,数据统计,随机数生成等。其提供的最核心的类型为多维数组类型(ndarray)。可以使用如下的方式来安装numpy库:pip install numpy根据惯例,使用numpy库的导入方式为:import numpy as np在导入之后,我们可以通过如下方式查看版本信息:np.__version__二、数组的创建1、arraynumpy最核心的就原创 2021-05-12 10:23:38 · 415 阅读 · 0 评论 -
数据分析1--基本概念
一、Anconda的相关操作1、Anconda的下载:Anaconda是Python的一个免费发行版本,适合在数据科学与机器学习领域的开发。其集成了Python解释器,同时也包含很多数据科学计算的软件包与开发工具。下载地址:https://www.anaconda.com/download/2、虚拟环境的操作:创建虚拟环境:conda create -n 虚拟环境名称 python=版本号如下:删除虚拟环境:conda remove -n 虚拟环境名称 --all如:conda r原创 2021-05-08 13:05:38 · 392 阅读 · 0 评论