数据分析师课程
N8023
这个作者很懒,什么都没留下…
展开
-
python数据处理系列之数据选择
常规的数据选择包括行选择、列选择、行列同时选择三种方式。1、选择某一列或某几列(1)传入列名选择数据-普通索引import numpy as npimport pandas as pddf = pd.read_csv(r'D:\workspace\test.csv')df.head()#通过列名选择数据df['客户姓名']df[['订单编码','客户姓名','性别']](2)传入列位置选择数据-位置索引iloc后的方括号中逗号之前的部分表示要获取的行的位置,输入一个冒号,不输入任何数原创 2020-09-16 22:49:41 · 1099 阅读 · 0 评论 -
python数据处理系列之读写csv数据
python数据处理系列之读写csv数据导入csv文件pandas中导入csv数据用的方法是read_csv()import pandas as pddf = pd.read_csv(r'c:\users\desktop\test.csv')指明分隔符。read_csv()默认文件中的数据都是以逗号分隔,当需要人为指定分隔符时,采用sep = ’ 符号’形式。常见的分隔符号包括逗号,空格,制表符(\t)等同样导出数据时候,如果需要指定分隔符,例如用‘/t’,则指定sep = '\t’原创 2020-09-07 22:35:36 · 696 阅读 · 0 评论 -
python数据处理系列之读写Excel数据
python数据处理系列之读写Excel数据读数据主要用到的就是pandas中的read_x()方法,x表示待导入的文件的格式。导入Excel文件read_excel()代码示例:import pandas as pddf = pd.read_excel(r'C:\users\desktop\test.xlsx')#df = pd.read_excel('C:\\users\\desktop\\test.xlsx')#df = pd.read_excel('C:/users/deskto原创 2020-09-06 22:27:07 · 855 阅读 · 0 评论 -
数据分析师课程 图表的类型与作用
说明:文章中所用图来源于英盛网数据分析师基础课程,同时以下内容是听课笔记,仅供大家参考学习。前言:图表可达成的目标包括展示比较、展示分布、展示联系和展示构成展示比较展示比较,包括基于分类的比较和基于时间的比较。基于分类的比较一般横轴为各个分类,基于时间的比较一般横轴为各个时间点。基于分类的比较(1)不等宽柱形图(多见于外企报表)适用于多个项目或主体在两个维度上(营业额和增长率)...原创 2019-02-17 15:09:16 · 1040 阅读 · 0 评论 -
数据分析师系列课程 数据分布
本节分享主要是关于描述数据分布的特征,学习笔记如下:数据的分布描述数据分布包括数据的集中趋势,离中趋势,偏态和峰态。集中趋势集中趋势是一组平均指标,它反映了总体的一般水平或分布,测定集中趋势的平均指标包括:平均数、中位数和众数。平均数包括简单平均数(均值),加权平均数和几何平均数。平均数的特点:平均数是集中趋势最常用的测量值;它是一组数据的均衡点所在;平均数容易受极端值...原创 2019-02-17 20:32:50 · 675 阅读 · 0 评论