自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 【机器学习线性代数】19 复数域中的向量与矩阵

#1 回顾:复数和复平面首先我们快速的回顾一下复数和复平面的基本知识,便于后续知识的介绍。我记得当我们接触到x2=−1x^2=-1x2=−1这个方程的时候,虚数iii第一次进入到了我们的世界中,对于虚数而言,他的加法和乘法运算都并无新意:i+i=2ii+i=2ii+i=2i2i+3i=5i2i+3i=5i2i+3i=5i唯一的新奇之处就在于虚数的平方运算,也就是在解方程x2=−1x^2=-1x2=−1的时候,其平方运算结果是i2=−1i^2=-1i2=−1。那么对虚数有了认识之后,复数的概念就很

2021-04-08 11:06:42 2492 2

原创 【机器学习线性代数】18 傅里叶级数:从向量的角度看函数

1 函数:无穷维向量空间是整个线性代数理论与实践的核心概念,在这一节中我们再一次的遇见了他。我们先简要的回顾一下之前介绍过的向量空间有关概念。向量空间RnR^nRn由所有含有 nnn 个成分的列向量所构成。比如,R4R^4R4空间中就包含了所有含有 444 个成分的列向量[x1x2x3x4]\begin{bmatrix} x_1\\x_2\\x_3\\x_4\end{bmatrix}⎣⎢⎢⎡​x1​x2​x3​x4​​⎦⎥⎥⎤​, 因此RnR^nRn空间也称为是 nnn 维空间,并且在这个向量空间RnR

2021-04-08 11:05:04 1937 1

原创 【机器学习线性代数】17 利用SVD进行彩色图片压缩

这一节,我们再来介绍一个奇异值分解的实际案例:即如何基于SVD的主成分分析方法,来对一张彩色图像进行压缩处理。1.图像的数据表示很明显,如果要对一张图像进行压缩,首先我们得知道应该如何用数据的形式来表示一张具体的图像,在此基础上才能进行下一步的数据压缩处理。那么首先我们利用python中的第三方工具 pillowpillowpillow,来读取一张样例图片,观察他的参数信息。这里我们要处理的样例图片如下:这里要提醒一下大家,由于pillowpillowpillow库是第三方工具,不是python3

2021-04-08 11:00:50 1844 3

原创 【机器学习线性代数】16 SVD在推荐系统中的应用

1.应用背景在这一节里,我们来重点分析一下如何把 SVDSVDSVD 的处理方法应用到推荐系统中,我们在一个实际的案例中进行探讨。有一个风味美食平台,经营着多种不同风味儿的地方特色美食,在系统中维护着一个原始的打分表:表中的行表示各个用户,列表示各种菜品,每一个用户在对一个菜品消费之后都会对其进行打分,分数为1分~5分,分数越高表示评价越高。如果该用户没有消费某道菜品,则分数值默认为0分。在我们的例子中,一共有18名用户对11个不同的菜品进行了打分评价,原始的打分数据如下:2.整体思路概述我

2021-04-08 10:51:59 1596 3

原创 32-matplotlib数据可视化之坐标轴与主次刻度用法详解

0.本集概览1.剖析plt和坐标轴对象ax的关系2.主刻度与次刻度的概念3.格式生成器与定位器的概念4.数值型主次刻度与自定义格式生成器函数举例5.日期型主次刻度举例这一集,我们专门来谈谈坐标轴的有关内容。1.plt和坐标轴对象ax的关系先看以下两段代码,他们实现的是同样的功能:绘制正余弦两个子图:代码一:import numpy as npimport matplotlib.pyplot as pltx = np.linspace(0,10,1000)plt.subplot

2021-04-06 22:13:14 1027

原创 31-matplotlib数据可视化之绘制子图

0.本集概览1.一般化的子图布局及绘图2.用plt.subplot/subplots方法绘制子图3.子图之间共用坐标轴的用法4.GridSpec绘制不规则多行多列子图的方法及举例今天我们深入的探讨一下子图的有关内容。有时候我们需要从多个角度进行数据的比较、分析,因此就需要用到子图。 子图的本质是在一个较大的图形中同时放置一组较小的坐标轴,布局形式可以多种多样,不拘泥于我们在第五集中举的那种网格图的形式。1.一般化的子图布局我们先进行一般化的子图布局。首先要创建各个子图的坐标轴,传入一个

2021-04-06 22:08:49 369

原创 30-matplotlib数据可视化之线形图绘制

0.本集概览1.指定单条、多条函数线形图的绘制2.图形标签(图形标题、坐标轴标题、图例)的完善3.图形颜色、线型的设置4.子图的绘制在前面,我们介绍了NumPy和DataFrame的相关内容,那我们就在想了,通常我们喜欢用图的形式来表征数据,这样会更加直观,Matplotlib.pyplot包中含有简单绘图功能,那么从今天起,我们就开始学习这里面的绘图内容。1.简单线形图的绘制首先,话不多说,我们先弄出一个图形来。画一个最简单的三角函数图形 y=sin(x)y=sin(x)y=sin(x)

2021-04-06 22:04:11 918

原创 29-数据透视表的使用方法

0.本集概览1.透视表的基本使用2.透视表实现高维度的行列分组3.透视表实现多属性观察及自定义统计函数这一季里,各种表啊什么的可真多啊,这又是什么鬼~1.透视表的使用背景我先不说透视表是啥,我还是先说一个问题,我们这一集举泰坦尼克号的乘客信息这个经典数据。代码片段:import numpy as npimport pandas as pdimport seaborn as snstitanic = sns.load_dataset('titanic')print(titanic

2021-04-06 22:02:08 266

原创 28-GroupBy使用方法(下篇):累计、过滤、转换与应用

0.本集概览1.GroupBy的累计、过滤、转换和应用功能2.GroupBy分组键的自定义3.索引名称的别名索引上一集里,我们对GroupBy的概念和运行机理进行了重点介绍,这一集在之前的基础上,我们要重点介绍他的一些核心方法,围绕累计、过滤、转换和应用这四个层面。光说这几个词未免显得空洞,那么我们还是一个一个来举例说明:这一集里我们所有的操作对象都是这个DataFrame数据对象:代码片段:import numpy as npimport pandas as pdrng = np

2021-04-03 10:17:33 258 1

原创 27-GroupBy使用方法(上篇):实现分割、应用和组合

0.本集概览1.GroupBy的使用场景和使用方法2.GroupBy分割、应用和组合的操作内涵3.GroupBy对象的遍历1.GroupBy的使用场景和使用方法今天这一集我们开始介绍Pandas中对数据进行处理的一个高逼格的方法:GroupBy。我举一个使用场景,科学家用不同的测量方法,测出了行星的质量、距离、轨道周期等等,就如同下面的代码所示:代码片段:import seaborn as snsplanets = sns.load_dataset('planets')print(pl

2021-04-03 10:15:09 257

原创 26-Pandas数据合并中的关系代数和集合操作

0.本集概览1.DataFrame数据连接中的一对一连接、多对一连接和多对多连接2.指定DataFrame合并列的方法3.DataFrame对象合并列中存在索引列的处理方法4.DataFrame对象连接过程中的内连接、外连接、左连接和右连接5.重复列名问题的处理DataFrame是一种表格型的数据,他的每一个数据行表征着具备各列属性值的一个实体对象,类似关系型数据,而关系代数就是处理这类关系数据的方法基础。这一集我们首先就来探讨数据连接的关系代数:一对一连接、多对一连接和多对多连接。1.

2021-04-03 10:13:12 279

原创 25-Pandas对象的简单数据合并

0.本集概览1.Pandas数据对象按行、列两个维度进行拼接的方法2.对象拼接合并时,行索引相同时的处理方法3.对象拼接合并时,对列进行处理的方法之前的几集,我们都是针对单一的Pandas数据结构进行操作,那么这一集开始,我们重点讨论如何对多个Pandas数据对象进行数据连接。这一集我们讨论如何利用concat方法进行简单的数据拼接。1.按行维度进行拼接代码片段:import pandas as pdser1 = pd.Series(['A','B','C'], index=[1,2,

2021-04-03 10:10:48 158

原创 24-多级索引Pandas对象的取值、分片与运算方法

0.本集概览1.Pandas数据类型多级索引的取值方法2.Pandas数据类型多级索引的分片方法3.多级Series与DataFrame的转换4.多级DataFrame的行列统计接着上一集,说说多级索引下Pandas数据类型的取值方法。1.多级索引的Series其实我们只用紧紧抓住一条:多级索引本质还是索引!就是和之前介绍的Series、DataFrame相比,在原来的基础上增加了索引的数据维度。1.1.多级索引下的取值方法更直观的,我们举Series的例子来看,继续使用上一集中用到的

2021-04-03 10:08:53 414

原创 23-Pandas多级索引的创建方法

0.本集概览1.带多级索引的Series数据类型2.多级索引Series对象和DataFrame对象的相互转化3.带多级索引的DataFrame数据类型4.多级索引的创建方法5.多级行索引和多级列索引举例1.多级索引的Series类型之前的几集里,我们使用了Series数据类型表示一维数据(即仅有一个索引列),用DataFrame类型数据表示二维数据(即包含行索引和列索引这两维索引数据)。但是如果是下面这种情况呢?比如我们用Series来表示美国不同的州、不同年份的人口数据,这对Seri

2021-04-03 10:06:19 371

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除