![](https://img-blog.csdnimg.cn/20200420165913499.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
Python数据分析
文章平均质量分 94
Python数据分析
第五本日记
这个作者很懒,什么都没留下…
展开
-
数据分析6-数据可视化
基本概念 数据可视化是指借助于图形化的手段,清晰、快捷有效的传达与沟通信息。同时,也可以辅助用户做出相应的判断,更好的去洞悉数据背后的价值 matplotlib matplotlib是用于Python的绘图库,提供各种常用图形的绘制。例如,条形图,柱形图,线图,散点图等 根据惯例,使用如下的方式导入: import matplotlib as mpl import matplotlib.pyplot as plt 一、图形绘制 绘制线图 可以通过matplotlib.pyplot的plot方法进行图形绘制原创 2021-05-20 11:46:24 · 1305 阅读 · 0 评论 -
数据分析5--多层索引与分组聚合
一、多层索引 MultiIndex,即具有多个层次的索引,有些类似于根据索引进行分组的形式。通过多层次索引,我们就可以使用高层次的索引,来操作整个索引组的数据。 多层索引的创建方式 第一种创建多层索引方式: 我们在创建Series或DataFrame时,可以通过给index(columns)参数传递多维数组,进而构建多维索引。【数组中每个维度对应位置的元素,组成每个索引值】 多维索引的也可以设置名称(names属性),属性的值为一维数组,元素的个数需要与索引的层数相同(每层索引都需要具有一个名称)。 s1原创 2021-05-19 14:44:18 · 774 阅读 · 0 评论 -
数据分析4--数据相关处理
一、数据加载 从csv读取数据 首先,我们需要将收集的数据加载到内存中,才能进行进一步的操作。pandas提供了非常多的读取数据的函数,分别应用在各种数据源环境中,我们常用的函数为: read_csv read_table read_sql 其中:read_csv与read_table默认使用的分隔符不同 read_csv与read_table常用的参数如下: sep / delimiter header names index_col usecols 具体使用方式如下: read_csv与read_tab原创 2021-05-17 12:22:34 · 524 阅读 · 0 评论 -
数据分析3--Pandas基本使用
一、简介 Pandas库基于Numpy库,提供了很多用于数据操作与分析的功能。 安装与使用: pip install pandas 根据惯例,我们使用如下的方式引入pandas: import pandas as pd 两个常用数据类型: Series DataFrame 二、Series类型 Series类型类似于Numpy的一维数组对象,可以将该类型看做是一组数据与数据相关的标签(索引)联合而构成(带有标签的一维数组对象)。 创建方式 列表等可迭代对象、ndarray数组对象、字典对象、标量 关于Se原创 2021-05-13 15:48:01 · 304 阅读 · 0 评论 -
数据分析2-numpy基本使用
一、简介: NumPy(Numerical Python的简称),是科学计算基础的一个库,提供了大量关于科学计算的相关功能,例如,线性变换,数据统计,随机数生成等。其提供的最核心的类型为多维数组类型(ndarray)。 可以使用如下的方式来安装numpy库: pip install numpy 根据惯例,使用numpy库的导入方式为: import numpy as np 在导入之后,我们可以通过如下方式查看版本信息: np.__version__ 二、数组的创建 1、array numpy最核心的就原创 2021-05-12 10:23:38 · 415 阅读 · 0 评论 -
数据分析1--基本概念
一、Anconda的相关操作 1、Anconda的下载: Anaconda是Python的一个免费发行版本,适合在数据科学与机器学习领域的开发。其集成了Python解释器,同时也包含很多数据科学计算的软件包与开发工具。 下载地址:https://www.anaconda.com/download/ 2、虚拟环境的操作: 创建虚拟环境: conda create -n 虚拟环境名称 python=版本号 如下: 删除虚拟环境: conda remove -n 虚拟环境名称 --all 如: conda r原创 2021-05-08 13:05:38 · 388 阅读 · 0 评论