自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (4)
  • 收藏
  • 关注

原创 自动求梯度

自动求梯度import tensorflow as tfprint(tf.__version__)2.1.0自动求梯度在深度学习中,我们经常需要对函数求梯度(gradient)。本节将介绍如何使用tensorflow2.0提供的GradientTape来自动求梯度。2.3.1 一个简单的例子我们先看一个简单例子:对函数 y=2x⊤xy = 2\boldsymbol{x}^{\t...

2020-03-30 22:25:11 637

原创 数据预处理,降维,特征提取,聚类

数据预处理,降维,特征提取,聚类数据预处理,使用StandardScaler进行数据的预处理# 导入numpyimport numpy # 导入绘图工具import matplotlib.pyplot as plt%matplotlib inline# 导入数据集生成工具from sklearn.datasets import make_blobsX, y = make_blob...

2020-03-30 15:14:28 2720 1

原创 降维

降维解决过拟合的问题除了正则化和添加数据之外,降维就是最好的方法。降维的思路来源于维度灾难的问题,我们知道 nnn 维球的体积为:CRn(式1)CR^n\tag{式1}CRn(式1)那么在球体积与边长为 2R2R2R 的超立方体比值为:lim⁡n→0CRn2nRn=0(式2)\lim\limits_{n\rightarrow0}\frac{CR^n}{2^nR^n}=0\tag{式2...

2020-03-29 21:54:50 463

原创 线性回归算法&L1,L2正则

线性回归算法假设数据集为:D={(x1,y1),(x2,y2),⋯ ,(xN,yN)}(式1)\mathcal{D}=\{(x_1, y_1),(x_2, y_2),\cdots,(x_N, y_N)\}\tag{式1}D={(x1​,y1​),(x2​,y2​),⋯,(xN​,yN​)}(式1)后面我们记:X=(x1,x2,⋯ ,xN)T,Y=(y1,y2,⋯ ,yN)T(式2)X...

2020-03-29 21:42:51 929

原创 频率学派和贝叶斯学派

频率学派和贝叶斯学派对概率的诠释有两大学派,一种是频率派另一种是贝叶斯派。对已知数据集记为:XN×p=(x1,x2,⋯ ,xN)T,xi=(xi1,xi2,⋯ ,xip)T(式1)X_{N\times p}=(x_{1},x_{2},\cdots,x_{N})^{T},x_{i}=(x_{i1},x_{i2},\cdots,x_{ip})^{T}\tag{式1}XN×p​=(x1​,x2​...

2020-03-29 21:25:20 614

原创 4斐波那契数列python实现

第4篇 斐波那契数列python实现知识点:递归和循环要求大家都知道斐波那契数列,现在要求输入一个整数n,请你输出斐波那契数列的第n项。n<=39斐波那契数列的定义: F(0)=0,F(1)=1, F(n)=F(n-1)+F(n-2)(n>=2,n∈N*)代码版本1:class Solution: def Fibonacci(self, n): ...

2020-03-26 21:21:54 1003 1

原创 SVR模型&python应用

1. SVR模型在SVM分类模型中,我们的目标函数是让12∣∣w∣∣2\cfrac{1}{2}||w||^221​∣∣w∣∣2最小,同时让各个训练集中的点尽量远离自己类别一边的的支持向量,即yi(w⋅ϕ(xi)+b)≥1y_i(w \cdot \phi(x_i )+ b) \geq 1yi​(w⋅ϕ(xi​)+b)≥1。若加入一个松弛变量ξi≥0\xi_i \geq 0ξi​≥0,则目标函数为:...

2020-03-25 22:00:58 6202

原创 支持向量回归 & 波士顿房价预测

支持向量回归 & 波士顿房价预测# 导入数据集from sklearn.datasets import load_bostonboston = load_boston()# 查看数据组成print(boston.keys()) # 分别代表,数据,目标,特征名称,描述信息dict_keys(['data', 'target', 'feature_names', 'DESCR...

2020-03-25 21:56:09 4592

原创 2空格替换&列表逆序输出

第2篇 空格替换&列表逆序输出字符串——替换空格链表——逆序输出链表替换空格要求请实现一个函数,将一个字符串中的空格替换成“%20”。例如,当字符串为We Are Happy.则经过替换之后的字符串为We%20Are%20Happy。思路如果用Python或者java等高级点的语言,直接调replace是最简单的写法了,或者开一个新字符串,从前往后读原字符串,读到其他字符就直...

2020-03-25 08:47:03 660

原创 1二维数组中的查找

第1篇 剑指offer学习笔记知识点:查找复习:线性表顺序查找、二分查找二维数组的查找题目描述在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。分析一上来想到的方法是,先按第一列做查找,找到行首比该数字小的最大一行,就是该数字所在的行,然后按这一行做查找,找到该数...

2020-03-24 11:49:04 344

原创 tensorflow数据操作

tensorflow数据操作xiaoyao 动手学深度学习,tensorflow代码import tensorflow as tfprint(tf.__version__)2.1.0在深度学习中,我们通常会频繁地对数据进行操作。作为动手学深度学习的基础,本节将介绍如何对内存中的数据进行操作。在tensorflow中,tensor是一个类,也是存储和变换数据的主要工具。如果你之前用过...

2020-03-23 23:03:56 1675

原创 2020年Tensorflow2-GPU 完整安装过程总结

2020年Tensorflow2-GPU 完整安装过程总结Tensorflow2.1将是最后一个支持python2的版本。tensorflow2.1增加了对TPU的支持,同时tf.keras和tf.data这两个常用的API也得到了很多新的更新。Tensorflow2.1的cuda版本为10.1,cuDNN版本为7.6.Windows 和 Linux 系统的 TensorFlow pip 版本...

2020-03-23 12:10:47 11225 4

原创 集成学习-Bagging-Boosting-AdaBoost

集成学习1.导言一个形象的比喻:“三个臭皮匠赛过诸葛亮!”假设输入x\boldsymbol{{x}}x和输出y\boldsymbol{{y}}y之间的真实关系为:y=h(x)\boldsymbol{{y}}=h(\boldsymbol{{x}})y=h(x).对于M\boldsymbol{{M}}M个不同的模型f1(x),⋯ ,fM(x)f_1(\boldsymbol{{x}}),\cdot...

2020-03-20 23:57:37 598 4

原创 随机森林算法&python应用

随机森林算法决策树算法可以很容易的将模型进行可视化,同时它是将每个样本特征进行单独处理,故而不需要的对数据进行转换。但是决策树会很容易出现过拟合,为了避免过拟合现象,可以使用集合学习的方法,像:随机森林算法。随机森林又被称为:随机决策森林,是一种集合学习方法(参见下图),既可以用于分类,也可以用作回归。分类:在森林内部会进行“投票”,每棵树预测出数据类别的概率,随机森林会把这些概率值求平均,让...

2020-03-20 18:53:41 3025 1

原创 决策树算法推导&python应用

决策树公式推导(1)信息熵--用来度量样本集合纯度最常用的一种指标,定义如下:Ent⁡(D)=−∑k=1∣Y∣pklog⁡2pk(式1)\operatorname{Ent}(D)=-\sum_{k=1}^{\vert{\mathcal{Y}}\vert}p_k\log_2p_k\tag{式1}Ent(D)=−k=1∑∣Y∣​pk​log2​pk​(式1)其中,D={(x1,y1),(x2...

2020-03-19 21:53:11 517

原创 matplotlib基本使用01

matplotlib基本使用01import numpy as npimport matplotlib.pyplot as pltimport warningswarnings.filterwarnings("ignore")matplotlib 采用面向对象的技术来实现,因此组成图表的各个元素都是对象,在编写较大的应用程序的时候,通过面向对象的方式使用matplotlib讲更加有效...

2020-03-19 11:16:22 654

转载 MySQL数据库面试题(2020最新版)

MySQL数据库面试题(2020最新版) ...

2020-03-18 09:07:31 581

原创 特征工程中常用的数据处理方式

特征工程学习地址数据集地址文章目录特征工程学习地址数据集地址Tip1:特征无量纲化的常见操作方法Tip2:怎么进行多项式or对数的数据变换?多项式变换对数变换代码集合Tip3:常用的统计图在Python里怎么画?效果图:代码集合Tip4:怎么去除DataFrame里的缺失值?统计有多少缺失值删除操作Tip5:怎么把被错误填充的缺失值还原?单个操作批量操作Tip6:怎么定义一个方法去填充分类变...

2020-03-17 22:18:02 1166

原创 numpy基本使用01

"""author by xiaoyao"""NumPy-快速处理数据import numpynumpy.__version__'1.16.5'ndarray对象import numpy as np创建a = np.array([1, 2, 3, 4])b = np.array((5, 6, 7, 8))c = np.array([[1, 2, 3, 4], [4,...

2020-03-16 15:42:02 593

原创 2数据分析库pandas的使用

# 导入librariesimport pandas as pdimport numpy as np# 设置显示选项# pd.set_option("display.show_dimensions", False)# pd.set_option("display.float_format", "{:4.2g}".format)Series和DataFrame提供的有丰富的下标存取方法...

2020-03-14 22:55:10 325

原创 1数据分析库pandas的使用

Pandas 的使用author by xiaoyaoNumpy提供了方便的数组处理功能,但其缺少的是:数据处理、分析所需要的快速工具。pandas基于Numpy开发,提供了很多的高级数据处理功能。import pandas as pdimport numpy as np# pd.set_option("display.show_dimensions", False)# pd.set_...

2020-03-12 15:25:52 704

原创 机器学习/深度学习 常用概率知识

文章目录1.样本空间2.事件和概率2.1 随机变量2.1.1 离散随机变量**(1)伯努利分布**:**(2)二项分布**:2.1.2 连续随机变量**(1)均匀分布**:**(2)正态分布**:2.1.3 累积分布函数2.2 随机向量2.2.1 离散随机向量**(1)多项分布**:2.2.2 连续随机向量**(2)各项同性高斯分布**:**(3)狄利克雷分布**:2.3 边际分布2.4 条件概率...

2020-03-08 22:35:36 573

原创 自信息、熵、联合熵、条件熵、互信息、交叉熵、KL散度

文章目录1、熵1.1 **自信息和熵**1.2 **联合熵和条件熵**2、互信息3、交叉熵和散度3.1 **交叉熵 **3.2 **KL散度**3.3 **JS散度**4、熵编码1、熵在信息论中,熵用来衡量一个随机事件的不确定性。在物理学中,表示一个热力学系统的无序程度。1.1 自信息和熵自信息(Self Information)表示一个随机事件所包含的信息量. 一个随机事件发生的概率越高...

2020-03-07 19:34:21 2139

原创 Wuhan Coronavirus Data Analytics

Wuhan Coronavirus Data Analytics"""Created on Mon Mar 2 11:00:00 2020@author: xiaoyao"""部分输出内容省略# 显示当前工作目录%pwd# 导入必要的库import numpy as np import pandas as pd # 可视化库import matplotlib.p...

2020-03-02 11:52:57 1123

原创 地图可视化组件–folium简单介绍

地图可视化组件–folium简单介绍folium是基于Python环境开发的一个地图绘制包,可以在程序中引入从而绘制精美的地图数据可视化图表。folium建立在Python生态系统的数据处理能力和Leaflet.js库的映射能力之上。 用Python处理数据,然后通过folium在可视化的Leaflet地图中将其可视化。安装(install)# 安装命令pip install folium...

2020-03-01 19:12:09 8413

Tensorflow 2 Tutorial.pdf

TensorFlow2入门教程

2021-04-08

OctaveInAction.pdf

Octave实践教程,包含八个实验,第一部分为:Octave在线性代数中的应用,第二部分为:Octave在高等数学中的应用

2020-06-13

1经验风险最小化.pdf

这个是对经验风险最小化的基本阐述,用于自己日常的机器学习参考。同时这个仅作为参考材料,促进理解,更权威的定义,请查阅相关权威书籍,期刊,论文。

2019-12-06

软件设计师历年真题全汇总(2004上半年-2015上半年)(答案+解析)

软件设计师历年真题全汇总(2004上半年-2015上半年),含有答案解析。每套试题分为上午试题和下午试题。每一年有两套(分为四部分,比如2014年上半年上午试题,2014年上半年下午试题,2014年下半年上午试题,2014年下半年下午试题)。

2017-10-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除