- 博客(25)
- 资源 (4)
- 收藏
- 关注
原创 自动求梯度
自动求梯度import tensorflow as tfprint(tf.__version__)2.1.0自动求梯度在深度学习中,我们经常需要对函数求梯度(gradient)。本节将介绍如何使用tensorflow2.0提供的GradientTape来自动求梯度。2.3.1 一个简单的例子我们先看一个简单例子:对函数 y=2x⊤xy = 2\boldsymbol{x}^{\t...
2020-03-30 22:25:11 637
原创 数据预处理,降维,特征提取,聚类
数据预处理,降维,特征提取,聚类数据预处理,使用StandardScaler进行数据的预处理# 导入numpyimport numpy # 导入绘图工具import matplotlib.pyplot as plt%matplotlib inline# 导入数据集生成工具from sklearn.datasets import make_blobsX, y = make_blob...
2020-03-30 15:14:28 2720 1
原创 降维
降维解决过拟合的问题除了正则化和添加数据之外,降维就是最好的方法。降维的思路来源于维度灾难的问题,我们知道 nnn 维球的体积为:CRn(式1)CR^n\tag{式1}CRn(式1)那么在球体积与边长为 2R2R2R 的超立方体比值为:limn→0CRn2nRn=0(式2)\lim\limits_{n\rightarrow0}\frac{CR^n}{2^nR^n}=0\tag{式2...
2020-03-29 21:54:50 463
原创 线性回归算法&L1,L2正则
线性回归算法假设数据集为:D={(x1,y1),(x2,y2),⋯ ,(xN,yN)}(式1)\mathcal{D}=\{(x_1, y_1),(x_2, y_2),\cdots,(x_N, y_N)\}\tag{式1}D={(x1,y1),(x2,y2),⋯,(xN,yN)}(式1)后面我们记:X=(x1,x2,⋯ ,xN)T,Y=(y1,y2,⋯ ,yN)T(式2)X...
2020-03-29 21:42:51 929
原创 频率学派和贝叶斯学派
频率学派和贝叶斯学派对概率的诠释有两大学派,一种是频率派另一种是贝叶斯派。对已知数据集记为:XN×p=(x1,x2,⋯ ,xN)T,xi=(xi1,xi2,⋯ ,xip)T(式1)X_{N\times p}=(x_{1},x_{2},\cdots,x_{N})^{T},x_{i}=(x_{i1},x_{i2},\cdots,x_{ip})^{T}\tag{式1}XN×p=(x1,x2...
2020-03-29 21:25:20 614
原创 4斐波那契数列python实现
第4篇 斐波那契数列python实现知识点:递归和循环要求大家都知道斐波那契数列,现在要求输入一个整数n,请你输出斐波那契数列的第n项。n<=39斐波那契数列的定义: F(0)=0,F(1)=1, F(n)=F(n-1)+F(n-2)(n>=2,n∈N*)代码版本1:class Solution: def Fibonacci(self, n): ...
2020-03-26 21:21:54 1003 1
原创 SVR模型&python应用
1. SVR模型在SVM分类模型中,我们的目标函数是让12∣∣w∣∣2\cfrac{1}{2}||w||^221∣∣w∣∣2最小,同时让各个训练集中的点尽量远离自己类别一边的的支持向量,即yi(w⋅ϕ(xi)+b)≥1y_i(w \cdot \phi(x_i )+ b) \geq 1yi(w⋅ϕ(xi)+b)≥1。若加入一个松弛变量ξi≥0\xi_i \geq 0ξi≥0,则目标函数为:...
2020-03-25 22:00:58 6202
原创 支持向量回归 & 波士顿房价预测
支持向量回归 & 波士顿房价预测# 导入数据集from sklearn.datasets import load_bostonboston = load_boston()# 查看数据组成print(boston.keys()) # 分别代表,数据,目标,特征名称,描述信息dict_keys(['data', 'target', 'feature_names', 'DESCR...
2020-03-25 21:56:09 4592
原创 2空格替换&列表逆序输出
第2篇 空格替换&列表逆序输出字符串——替换空格链表——逆序输出链表替换空格要求请实现一个函数,将一个字符串中的空格替换成“%20”。例如,当字符串为We Are Happy.则经过替换之后的字符串为We%20Are%20Happy。思路如果用Python或者java等高级点的语言,直接调replace是最简单的写法了,或者开一个新字符串,从前往后读原字符串,读到其他字符就直...
2020-03-25 08:47:03 660
原创 1二维数组中的查找
第1篇 剑指offer学习笔记知识点:查找复习:线性表顺序查找、二分查找二维数组的查找题目描述在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。分析一上来想到的方法是,先按第一列做查找,找到行首比该数字小的最大一行,就是该数字所在的行,然后按这一行做查找,找到该数...
2020-03-24 11:49:04 344
原创 tensorflow数据操作
tensorflow数据操作xiaoyao 动手学深度学习,tensorflow代码import tensorflow as tfprint(tf.__version__)2.1.0在深度学习中,我们通常会频繁地对数据进行操作。作为动手学深度学习的基础,本节将介绍如何对内存中的数据进行操作。在tensorflow中,tensor是一个类,也是存储和变换数据的主要工具。如果你之前用过...
2020-03-23 23:03:56 1675
原创 2020年Tensorflow2-GPU 完整安装过程总结
2020年Tensorflow2-GPU 完整安装过程总结Tensorflow2.1将是最后一个支持python2的版本。tensorflow2.1增加了对TPU的支持,同时tf.keras和tf.data这两个常用的API也得到了很多新的更新。Tensorflow2.1的cuda版本为10.1,cuDNN版本为7.6.Windows 和 Linux 系统的 TensorFlow pip 版本...
2020-03-23 12:10:47 11225 4
原创 集成学习-Bagging-Boosting-AdaBoost
集成学习1.导言一个形象的比喻:“三个臭皮匠赛过诸葛亮!”假设输入x\boldsymbol{{x}}x和输出y\boldsymbol{{y}}y之间的真实关系为:y=h(x)\boldsymbol{{y}}=h(\boldsymbol{{x}})y=h(x).对于M\boldsymbol{{M}}M个不同的模型f1(x),⋯ ,fM(x)f_1(\boldsymbol{{x}}),\cdot...
2020-03-20 23:57:37 598 4
原创 随机森林算法&python应用
随机森林算法决策树算法可以很容易的将模型进行可视化,同时它是将每个样本特征进行单独处理,故而不需要的对数据进行转换。但是决策树会很容易出现过拟合,为了避免过拟合现象,可以使用集合学习的方法,像:随机森林算法。随机森林又被称为:随机决策森林,是一种集合学习方法(参见下图),既可以用于分类,也可以用作回归。分类:在森林内部会进行“投票”,每棵树预测出数据类别的概率,随机森林会把这些概率值求平均,让...
2020-03-20 18:53:41 3025 1
原创 决策树算法推导&python应用
决策树公式推导(1)信息熵--用来度量样本集合纯度最常用的一种指标,定义如下:Ent(D)=−∑k=1∣Y∣pklog2pk(式1)\operatorname{Ent}(D)=-\sum_{k=1}^{\vert{\mathcal{Y}}\vert}p_k\log_2p_k\tag{式1}Ent(D)=−k=1∑∣Y∣pklog2pk(式1)其中,D={(x1,y1),(x2...
2020-03-19 21:53:11 517
原创 matplotlib基本使用01
matplotlib基本使用01import numpy as npimport matplotlib.pyplot as pltimport warningswarnings.filterwarnings("ignore")matplotlib 采用面向对象的技术来实现,因此组成图表的各个元素都是对象,在编写较大的应用程序的时候,通过面向对象的方式使用matplotlib讲更加有效...
2020-03-19 11:16:22 654
原创 特征工程中常用的数据处理方式
特征工程学习地址数据集地址文章目录特征工程学习地址数据集地址Tip1:特征无量纲化的常见操作方法Tip2:怎么进行多项式or对数的数据变换?多项式变换对数变换代码集合Tip3:常用的统计图在Python里怎么画?效果图:代码集合Tip4:怎么去除DataFrame里的缺失值?统计有多少缺失值删除操作Tip5:怎么把被错误填充的缺失值还原?单个操作批量操作Tip6:怎么定义一个方法去填充分类变...
2020-03-17 22:18:02 1166
原创 numpy基本使用01
"""author by xiaoyao"""NumPy-快速处理数据import numpynumpy.__version__'1.16.5'ndarray对象import numpy as np创建a = np.array([1, 2, 3, 4])b = np.array((5, 6, 7, 8))c = np.array([[1, 2, 3, 4], [4,...
2020-03-16 15:42:02 593
原创 2数据分析库pandas的使用
# 导入librariesimport pandas as pdimport numpy as np# 设置显示选项# pd.set_option("display.show_dimensions", False)# pd.set_option("display.float_format", "{:4.2g}".format)Series和DataFrame提供的有丰富的下标存取方法...
2020-03-14 22:55:10 325
原创 1数据分析库pandas的使用
Pandas 的使用author by xiaoyaoNumpy提供了方便的数组处理功能,但其缺少的是:数据处理、分析所需要的快速工具。pandas基于Numpy开发,提供了很多的高级数据处理功能。import pandas as pdimport numpy as np# pd.set_option("display.show_dimensions", False)# pd.set_...
2020-03-12 15:25:52 704
原创 机器学习/深度学习 常用概率知识
文章目录1.样本空间2.事件和概率2.1 随机变量2.1.1 离散随机变量**(1)伯努利分布**:**(2)二项分布**:2.1.2 连续随机变量**(1)均匀分布**:**(2)正态分布**:2.1.3 累积分布函数2.2 随机向量2.2.1 离散随机向量**(1)多项分布**:2.2.2 连续随机向量**(2)各项同性高斯分布**:**(3)狄利克雷分布**:2.3 边际分布2.4 条件概率...
2020-03-08 22:35:36 573
原创 自信息、熵、联合熵、条件熵、互信息、交叉熵、KL散度
文章目录1、熵1.1 **自信息和熵**1.2 **联合熵和条件熵**2、互信息3、交叉熵和散度3.1 **交叉熵 **3.2 **KL散度**3.3 **JS散度**4、熵编码1、熵在信息论中,熵用来衡量一个随机事件的不确定性。在物理学中,表示一个热力学系统的无序程度。1.1 自信息和熵自信息(Self Information)表示一个随机事件所包含的信息量. 一个随机事件发生的概率越高...
2020-03-07 19:34:21 2139
原创 Wuhan Coronavirus Data Analytics
Wuhan Coronavirus Data Analytics"""Created on Mon Mar 2 11:00:00 2020@author: xiaoyao"""部分输出内容省略# 显示当前工作目录%pwd# 导入必要的库import numpy as np import pandas as pd # 可视化库import matplotlib.p...
2020-03-02 11:52:57 1123
原创 地图可视化组件–folium简单介绍
地图可视化组件–folium简单介绍folium是基于Python环境开发的一个地图绘制包,可以在程序中引入从而绘制精美的地图数据可视化图表。folium建立在Python生态系统的数据处理能力和Leaflet.js库的映射能力之上。 用Python处理数据,然后通过folium在可视化的Leaflet地图中将其可视化。安装(install)# 安装命令pip install folium...
2020-03-01 19:12:09 8413
软件设计师历年真题全汇总(2004上半年-2015上半年)(答案+解析)
2017-10-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人