自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 问答 (2)
  • 收藏
  • 关注

原创 Matplotlib绘制直方图

Matplotlib 绘制直方图,matplotlib.pyplot.hist()详细用法。

2022-07-27 15:34:36 960 1

原创 Tableau学习(五)

1. 符号地图1.1 不同国家超市销售额符号地图绘制导入全球超市数据,包含人员和订单表,把两个表拖到右边,会自动根据两表的相同字段“地区”连接起来,相当于内连接。双击"国家/地区(country)"字段,把它拖到详细信息或者右方放置字段的中心区域都可以生成全球地图,地图左上角符号解读:把"销售额"字段拖到大小中,"国家/地区(country)"字段拖到标签中,修改一下大小和颜色,如下:把"国家/地区(country)"字段拖到标签中后会看到有两个国家名,一个是创建地图时附带...

2022-04-23 11:09:09 980

原创 Tableau学习(四)

1. 标靶图标靶图是一种特殊形式的条形图,包含参考线,在比较主度量与一个或多个其他度量的性能时十分有用。下面绘制各省二月份电量销售额完成情况。导入数据源如下:可以看到每个省市不同月份都有多个细分的用电。将"统计周期"字段拖到筛选器中,筛选出2月份的数据,处理如下:把"月度计划值"拖到详细信息中,后面添加参考线会用到再把"省市"和"当期值"字段分别拖到行和列中,如下:添加参考线操作如下:选择线,因为要对各省分别作参考线,所以要选择每单元格,选择月度计划值的平均值,和当前值进行比较..

2022-04-22 01:24:05 1025

原创 Tableau学习(三)

1. 基本表和凸显表1.1 不同地区酒店数量基本表使用的是酒店数据,把"地区"字段拖入到行在中,在把"酒店数据(计数)"拖入到文本中,得到的就是不同地区酒店数量基本表,如下:如果想要展示得更加具体,可以在行中添加字段,例如在上述基础上增加"等级"字段,2. 凸显表凸显表可以简单理解为根据数据的大小赋予同一颜色不同深度或几个颜色的渐变深度,正如其名,用于凸显数据,可以更加直观地了解数据,例如在一堆较小的数中有几个较大的数,如果设置值越大颜色越深,那么深色的值就是较大的数,只看颜色较

2022-04-21 00:15:39 1846

原创 Tableau学习(二)

一、数据简单拆分导入电影数据,数据源如下:12658.1可以看到很多字段都是中英文、数字混合在一起,比如累计票房,我们要用来绘图的只有数值,中文是多余的,如果同一字段下的数据格式差不多,我们可以右键使用拆分,自动将同一字段下的数据根据不同格式或数据类型等拆分成多列新字段,例如对“让子弹飞(2010)Let The Bullets Fly”进行拆分,可以得到三个新字段,“让子弹飞”,2010,”Let The Bullets Fly“,对“累计票房12658.1万”可以拆分为只有一个数值字段126

2022-03-29 01:09:00 2114

原创 Tableau学习(一)

一、界面简介打开Tableau,界面如下:我使用的数据是xlsx类型的excel表格,从 "到文件->Microsoft Excel -> 找到需要导入数据的路径" 即可导入数据源。导入后界面如下:导入的数据名为"酒店数据",可以看到它有两个工作表,分别为"各区参考均价"和“酒店数据”,对应Excel中的两个sheet表。将"酒店数据这个表"拖到右边,就可以显示出该sheet表的字段类型和具体数据,如下图:二、绘制简单的条形图点击上图左下角的"工...

2022-03-28 17:11:57 1722

原创 pandas.cut()函数的使用

文章目录1. 语法及参数2. 参数详解(含实例)2.1 bins2.2 retbins2.3 precision2.4 labels2.5 ordered2.6 right2.7 include_lowest2.8 duplicatespandas.cut()函数可以将数据进行分类成不同的区间值。在数据分析中,例如有一组年龄数据,现在需要对不同的年龄层次的用户进行分析,那么我们可以根据不同年龄层次所对应的年龄段来作为划分区间,例如 bins = [1,28,50,150],对应 labels = [“青少

2022-03-23 00:26:39 19561 2

原创 Matplotlib 绘制条形图

Matplotlib学习笔记002 绘制条形图文章目录Matplotlib学习笔记002 绘制条形图一、一般条形图二、横向条形图三、分组条形图的绘制四、堆叠条形图绘制import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom matplotlib import font_manager一、一般条形图一般条形图使用 pyplot.bar()函数绘制,其形式及参数如下:matplotlib.pyplot.ba

2022-03-20 18:36:24 10316

原创 Matplotlib 绘制折线图

Matplotlib绘制折线图Matplotlib学习笔记001文章目录Matplotlib绘制折线图1. plot()方法语句2. 绘制单线条折线图2.1 只传入 y 坐标2.2 传入 x,y 坐标2.3 通过data参数传递数据3. 绘制多条折线图3.1 多次调用plot()方法3.2 只调用一次plot()方法3.3 x或y为二维数组3.4 x和y都为二维数组4. fmt参数4.1 设置标记4.2 设置线条样式4.3 设置线条颜色4.4 fmt所有参数混合使用5. Line2D属性作为关键字参数

2022-03-18 14:13:52 1046

原创 MySQL COUNT(IF())和 SUM(IF()) 问题

如下表所示,假设该表表名为 t如果要计算不同难度下答题的准确率,可以按difficult_level分组后求result = "right" 的条数除以总条数COUNT(*)即可。计算result = "right" 的条数时可以使用COUNT(IF(条件,TRUE,NULL)) 语句解释:第一个参数是筛选条件,第二个参数是为TRUE条件,可以是表达式,数字等,第三个参数一定要为NULL (不计数),如果符合条件,则为TRUE,计数;如果不符合则为NULL,不计数。代码如下:SELECT

2022-02-20 15:30:58 915

原创 pandas 数据清洗和预处理

pandas 笔记010目录pandas 笔记010十、数据清洗和预处理1. 处理缺失数据1.1 判断是否存在缺失值 isnull()1.2 丢弃缺失数据 dropna()1.3 填充缺失值 fillna()1.3.1 精确填充1.3.2 参数inplace=True1.3.3 参数method='ffill'1.3.4 参数limit2. 数据转换2.1 移除重复值2.1.1 duplicated():检查是否为重复行2.1.2 drop_duplicates()过滤重复行2.1.3 keep='la

2021-11-09 00:13:20 748

原创 Pandas读写文件

pandas 笔记009目录pandas 笔记009九、Pandas文件操作1.读1.1 read_csv()1.2 read_table()1.3 sep或delimiter(分隔符)1.4 skiprows(忽略跳过行数)1.5 header(设置列名)1.6 names(指定列名)1.7 index_col1.8 读取txt文件2.分块读取2.1 chunksize2.2 iterator3.将一个文件内容写到另一个文件九、Pandas文件操作1.读import numpy as n

2021-11-06 12:04:28 733

原创 pandas统计计算方法

pandas 笔记008目录pandas 笔记008八、pandas统计计算方法1.主要统计方法2. 示例一些方法2.1 sum()2.2 idxmax() 和 idxmin()2.3 cumsum()2.4 describe八、pandas统计计算方法1.主要统计方法方法说明count非NAN值的数量describe针对Series或各DataFrame列计算汇总统计min、max计算最小值和最大值argmin. argmax计算能够获取到最小值和最大

2021-11-04 00:28:10 4401

原创 pandas 层级索引

pandas 笔记007目录pandas 笔记007七、层级索引1. 层级索引(hierarchical indexing)1.1 Series1.2 DataFrame2. 交换2.1 交换分层顺序2.2 排序分层2.3 交换并排序分层七、层级索引import pandas as pdimport numpy as np1. 层级索引(hierarchical indexing)1.1 Series创建Series使用Index指定内外索引,第一个内层列表是外层索引,第二个内层列表内层索引

2021-11-01 00:34:20 1201

原创 pandas函数应用

pandas 笔记006目录pandas 笔记006六、pandas函数应用1. apply 和 applymap1.1 可以直接使用numpy的函数1.2 通过apply将函数应用到列或行1.3通过applymap将函数应用到每个数据2.排序2.1 按索引排序(sort_index())2.1.1 Series2.1.2 DataFrame2.2 按值排序(sort_values())2.2.1 Series2.2.2 DataFrame3.唯一值和成员属性3.1 unique()3.2 value_

2021-10-29 01:24:24 442

原创 pandas的对齐运算

pandas 笔记005目录pandas 笔记005五、对齐运算1.算术运算和数据对齐1.1 Series1.2 DataFrame2.使用填充值的算术方法2.1 Series2.2 DataFrame3.DataFrame和Series混合运算3.1 按行广播3.2 按列广播五、对齐运算1.算术运算和数据对齐import numpy as npimport pandas as pd1.1 Seriesa1 = pd.Series(np.arange(4),index=['a','b','c

2021-10-27 16:20:01 634

原创 索引对象Index和索引的基本操作

pandas 笔记004目录pandas 笔记004四、索引对象Index和索引的基本操作1. 索引对象Index1.1 Series和DataFrame1.2 索引对象不可变1.3 常见的Index种类2. 索引的 一些基本操作2.1 重新索引 reindex2.1.1 Series索引2.1.2 DataFrame索引2.2 增2.2.1 Series索引2.2.2 DataFrame索引2.3 删2.3.1 del2.3.2 drop2.4 改2.4.1 Series索引2.4.2 D

2021-10-26 22:15:31 1287

原创 DataFrame索引的创建和基本用法

pandas 笔记003目录pandas 笔记003三、DataFrame索引的创建和基本用法1.DataFrame索引的创建1.1 字典类构造dataframe1.1.1 数组、列表或元组构成的字典构造dataframe1.1.2 Series构成的字典构造dataframe1.1.3 字典构成的字典构造dataframe(字典嵌套)1.2 列表类构造dataframe1.2.1 通过 2D ndarray(二维数组) 构造dataframe1.2.2 字典构成的列表构造dataframe

2021-10-25 19:06:57 9839

原创 Pandas中Series索引的创建和基本用法

pandas 笔记002目录pandas 笔记002二、Series索引的创建和基本用法1.Series索引的创建1.1 通过列表创建Series索引1.2 通过numpy创建的数组来创建Series索引1.3 通过字典(无序数据类型)创建Series索引2. Seies索引的基本用法2.1 values 获取数据2.2 index 获取索引2.3 下标取值2.4 切片2.5 布尔索引2.6 isnull和notnull检查缺失值2.7 name属性2.8 head() 获取索引的

2021-10-24 21:10:00 7252

原创 pandas初识

pandas笔记001目录pandas笔记001一、pandas初识1.简介2.Windows安装简介2.1 依赖2.2 通过PyPI的`pip`安装2.3 通过 Anaconda 环境安装3. 官方网址一、pandas初识1.简介pandas 是一个Python包,基于 numpy, python-dateutil, pytz,提供快速、灵活和富有表现力的数据结构,旨在使处理“关系”或“标记”数据既简单又直观。pandas 的两个主要数据结构是Series(一维标记的同构数组)和DataFrame

2021-10-24 13:47:07 688

原创 Numpy有关的函数

Numpy有关的函数目录Numpy有关的函数十二、通用函数1. 一元函数1.1 绝对值函数np.abs()1.2 平方根函数np.sqrt()1.3 平方函数np.square(()1.4 指数函数np.exp()1.5 对数np.log,np.log10,np.log2,np.log1p1.6 np.sign()标签化函数1.7 np.ceil() 向上取整1.8 np.floor() 向下取整1.9 np.rint() 返回四舍五入后的值1.10 np.modf() 分隔整数和小数为两个数组1.

2021-10-23 00:48:53 189

原创 NAN和INF

Numpy学习笔记009十一、NAN和INF值NAN:缺省值。但是他是属于浮点类型的,所以想要进行数据操作的时候需要注意其类型。INF:无穷大。也是属于浮点类型。np.inf表示正无穷大,-np.inf表示负无穷大,一般在出现除数为0的时候为无穷大。比如2/0。NAN一些特点:NAN和NAN不相等。比如np.NAN != np.NAN这个条件是成立的。NAN和任何值做运算,结果都是NAN。有些时候,特别是从文件中读取数据的时候,经常会出现一些缺失值。缺失值的出现会影响数据的处理。因此我们在做数

2021-10-22 00:05:26 2389

原创 Numpy文件操作

Numpy学习笔记008十、Numpy文件操作1. np.savetxt用于文件保存,需要注意的是最多只能保存二维数组,否则会报错。np.savetxt(fname, X, fmt='%.18e', delimiter=' ', newline='\n', header='', footer='', comments='# ', encoding=None)参数如下:frame : 文件、字符串或产生器,可以是.gz或.bz2的压缩文件X : 存入文件的数组(一维或二维数组)fmt : 写

2021-10-21 01:15:27 1096

原创 数组的深拷贝和浅拷贝

Numpy学习笔记007九、数组的深拷贝和浅拷贝变量是存储在栈中,数组存储在堆中,通过变量获取数组内容实际是变量在栈中的存储位置对堆中数组存储位置的指向。1.不拷贝不拷贝:简单赋值 。b=a只是将栈中的原变量名字a改为b,新变量b在栈中的位置也没变,b指向堆中数组的存储位置还是原变量a指向的位置。改变a,b中任意一个,那么a和b都会发生改变。import numpy as npa = np.arange(12)b = a #这种情况不会进行拷贝print(b is a) #返回Tr

2021-10-19 00:25:44 162

原创 数组的形状操作

Numpy学习笔记006八、数组的形状操作1. reshape和 resize1.1 reshape方法将数组转换成指定的形状,然后返回转换后的结果,对于原数组的形状是不会发生改变的。ndarray.reshape((m,n,o))含义 :有三个参数,说明ndarray转换后是三维数组,第一个参数m表示的是三维数组中有m个元素,就是有m个二维数组,后两个参数 n,o 分别表示的二维数组的行数和列数。例如a.reshape((2,3,3))就是把a数组转换为一个由两个3X3的二维数组组成的三维数组

2021-10-17 01:06:15 638

原创 有关数组的计算

Numpy学习笔记005七、有关数组的计算有关数组的计算对象有数组和数,数组和数组,函数等方面,涵盖计算的方法有常见的加法、减法、乘法、除法,均值,方差等。1. 数组与数的计算主要是加减乘除运算。a1 = np.arange(10).reshape(2,5)print(a1)print("="*40)# 加法a2 = a1 + 10print(a2)print("="*40)# 减法a3 = a1 - 10print(a3)print("="*40)# 除法a4 = a1

2021-10-13 17:09:15 1121

原创 数组的索引和切片

Numpy学习笔记004六、数组的索引和切片jupyter notebook 环境1.一维数组的索引和切片import numpy as npa1 = np.arange(2,19)print(a1[1]) #获取下标为1的元素print("="*30)#切片print(a1[:]) #取数组中所有数print("="*30)print(a1[1:4]) #取左不取右print("="*30)print(a1[2:6:2]) # [开始索引:结束索引 : 步长 ],这三个

2021-10-11 14:00:02 1155

原创 Numpy数组的常用属性

Numpy学习笔记003五、数组(ndarray)常用属性## 标题1.ndarray.dtype数组性质之一是只能存储同一种数据类型,因此可以通过dtype属性获取数组中的元素的数据类型,也可以在创建数组时通过dtype指定数组的数据类型。下表是ndarray.dtype的常用的数据类型:数据类型描述唯一标识符bool用一个字节存储的布尔类型(True或False)‘b’int8一个字节大小,-128 至 127‘i1’int16整数,16 位整数(-

2021-10-11 01:14:40 3636 2

原创 Numpy数组的基本使用

Numpy学习笔记002四、Numpy数组的基本使用1.什么是数组数组是 NumPy 库的核心数据结构。它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。一个 ndarray是具有相同类型和大小的项目的(通常是固定大小的)多维容器。 尺寸和数组中的项目的数量是由它的shape定义, 它是由N个非负整数组成的tuple,用于指定每个维度的大小。组中项目的类型由单独的data-type object (dtype)指定, 其中一个与每个ndarray相关联。2.Numpy如何创建数组(

2021-10-09 22:23:10 391

原创 Numpy初识

Numpy学习笔记001一、Numpy库简介NumPy是Python中科学计算的基础包。它是一个功能强大的Python库,提供多维数组对象,各种派生对象(如掩码数组和矩阵),以及用于数组快速操作的各种API,有包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换、基本线性代数,基本统计运算和随机模拟等等。在数据分析和机器学习等领域被广泛应用,有以下几个特点:numpy内置了并行运算功能,当系统有多个核心时,做某种计算时,numpy会自动做并行计算。Numpy底层使用C语言编写,内部解除了

2021-10-08 21:47:47 235

原创 python程序加载图片报错

最近在网上看到一个写gif动图的程序,我用了下别人的程序,别人可以正常执行,而我的却有几处图片路径的报错。下面是几处报错及解决办法。报错1: Folder_Path = 'C:\Users\ASUS\Desktop\gif' ^SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: tr...

2021-08-05 14:02:47 2058

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除