自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 项目作业:分类任务

import numpy as npimport matplotlib.pyplot as pltdef generate_data(seed,data_size1,data_size2): np.random.seed(seed) # class 1 datas_size_1 = data_size1 # feature 1 x1_1 = np.r...

2019-06-02 22:06:43 217

原创 机器学习基础(三):贝叶斯分类器

贝叶斯决策论 贝叶斯决策论是概率框架下实施决策的基本方法。对分类任务来说,在所有相关概率都已知的理想情形下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。 最小化分类错误率的贝叶斯最优分类器为: 其中:是类别集合。是后验概率。先验概率...

2019-05-25 22:25:04 393

原创 机器学习Task3:预测PM2.5值

Task描述:现有两个数据集:train set 和 test set,train set 是气象站每个月前20天空气质量所有资料,test set 则是从剩下的资料中取样出来。train.csv:每个月前20天每个小时的气象资料(每小时有18中测资),共12个月;test.csv:从剩下的资料当中取样出连续的10小时为一笔,前9小时的所有资料数据当做feature,第10小时的PM2...

2019-05-22 20:44:50 1537

原创 机器学习基础知识(一):梯度下降,L2,L1,L0范数

机器学习机器学习,让机器学习某种知识或规律的过程。机器学习按照情景来分,可以分为监督学习,半监督学习,无监督学习,transfer learning,强化学习等;按照任务,可以分为回归,分类,结构性学习等;按照方法分,可以分为线性模型,非线性模型(深度学习,SVM,决策树,KNN)等。泰勒展开式 泰勒公式是将一个在x=x0处具有n阶导数的函数f(x)利用关于...

2019-05-13 21:13:26 8141

原创 可汗学院统计学笔记(四)

1.线性回归统计学中的线性回归:对于一组具有线性关系的数据,可以用一条直线来拟合这些数据。用于拟合这些数据的直线应该使得所有数据到这条直线的距离最短(这里的距离简化为真实值和预测值之间的距离)。设这条直线为:y=mx+b其中,m为直线的斜率,b为截距。线性回归学习的目的是找到这样的参数m和b,使得所有数据点到这条直线的距离最短。数据点到直线的距离的平方之和,或说是平方误差为:...

2019-04-09 23:43:27 781

原创 可汗学院统计学笔记(三)

假设检验假设检验是推论统计中用于检验统计假设的一种方法。而“统计假设”是可通过观察一组随机变量的模型进行检验的科学假说。一旦能估计未知参数,就会希望根据结果对未知的真正参数值做出适当的推论。统计上对参数的假设,就是对一个或多个参数的论述。而其中欲检验其正确性的为零假设(null hypothesis),零假设通常由研究者决定,反映研究者对未知参数的看法。相对于零假设的其他有关参数之论述是备择...

2019-04-07 23:47:21 532

原创 可汗学院统计学笔记(二)

1.中心极限定理(Central Limit Theorem)well difined mean and variance样本均值的抽样分布(Sampling Distribution of the sample mean)正态分布的两个概念:偏度(Skew)如果是一个完美的正态分布,则skew=0;如果偏度为正,则意味着右侧尾部较长;如果偏度为负,则意味着左侧尾部较长。...

2019-04-05 20:44:50 868

原创 可汗学院统计学笔记(一)

基本概念1.总体(Population)与样本(Sample) 总体是研究对象的整体,通常数目很大,直接对总体进行分析费时费力。因此通过对总体进行抽样得到可以代表总体的样本。注意:采样过程应该是随机的,否则样本无法代表总体的特征。2.均值(mean)令总体数为N,样本数为n,每一个样本的取值用表示,则总体均值:样本均值:3.方差(Variance)与...

2019-04-04 21:47:34 1558

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除