自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 Chang-Xiao Li Machine Learning 2019 Task10

1.学习Gini指数2.学习回归树3.减枝

2019-06-20 13:58:22 97

原创 Chang-Xiao Li Machine Learning 2019 Task4

1.学习先验概率、后验概率先验概率是指根据以往经验和分析得到的概率,如全概率公式,它往往作为“由因求果”问题中的“因”出现。后验概率是指在得到“结果”的信息后重新修正的概率,是“执果寻因”问题中的"果"。先验概率与后验概率有不可分割的联系,后验概率的计算要以先验概率为基础2.从基础概率推导贝叶斯公式,朴素贝叶斯公式3.推导sigmoid function公式4.学习...

2019-06-19 10:25:18 80

原创 Chang-Xiao Li Machine Learning 2019 Task9

基于上一次任务的决策树计算过程,本次任务进行结果的可视化,主要是matplotlib的运用。import matplotlib.pyplot as pltimport task8 as dtmdecisionNode = dict(boxstyle="sawtooth", fc="0.8")leafNode = dict(boxstyle="round4", fc="0.8")...

2019-06-14 11:00:07 640

原创 Chang-Xiao Li Machine Learning 2019 Task8

总结决策树模型结构决策树是一种基本的分类与回归方法。包含三个步骤:特征选择、决策树的生成和决策树的修建。主要有ID3算法和C4.5算法和CART算法。理解决策树递归思想在ID3 和 C4.5 中,递归进行信息增益计算和特征选择,类标记生成。学习信息增益学习信息增益率学习ID3算法优缺点ID3算法那只有树的生成,所以该算法生成的书容易产生过拟合。学习C4...

2019-06-10 18:19:51 107

原创 Chang-Xiao Li Machine Learning 2019 Task7

1.信息量计算,原理参考笔记2.证明0⩽H(p)⩽logn3.联合概率,边缘概率4.联合熵,条件熵,条件熵公式推导5.互信息,互信息公式推导互信息推导:6.相对熵,交叉熵7.回顾LR中的交叉熵8.计算给定数据集的香浓熵:# coding=utf-8import numpy as npdata = np.loadtxt("C:/...

2019-06-04 09:17:32 119

原创 Chang-Xiao Li Machine Learning 2019 Task6

'''生成数据,三列变量 参考给出的笔记思路'''import numpy as npfrom sklearn import preprocessingdef generate_data(data_size_1,data_size_2): x1_1 = np.random.normal(loc=5.0, scale=1.0, size=data_size_1) x2_1 =...

2019-06-02 10:21:59 94

原创 Chang-Xiao Li Machine Learning 2019 Task5

1.推导LR损失函数损失函数:给定一组参数w和b最大自然估计为:取对数:变换形式:即为两个伯努利分布的交叉熵。LR的损失函数为:2.学习LR梯度下降因此 LR 梯度下降:3.学习LR梯度下降4.softmax原理对于多分类问题5.softmax损失函数6.softmax梯度下降...

2019-05-27 13:23:17 109

原创 Chang-Xiao Li Machine Learning 2019 week1

读取csv文件import csv #加载csv包便于读取csv文件import numpy as npimport sysfrom pandas import DataFrameimport pandas as pddef getdata(): # 读取文件 filepath = "C:/Users/user/Downloads/" t...

2019-05-22 13:15:02 83

原创 Chang-Xiao Li Machine Learning 2019 Task2

偏差和方差偏差(bias):偏差衡量了模型的预测值与实际值之间的偏离关系。通常在深度学习中,我们每一次训练迭代出来的新模型,都会拿训练数据进行预测,偏差就反应在预测值与实际值匹配度上,比如通常在keras运行中看到的准确度为96%,则说明是低偏差;反之,如果准确度只有70%,则说明是高偏差。 方差(variance):方差描述的是训练数据在不同迭代阶段的训练模型中,预测值的变化波动情况(或称...

2019-05-17 17:18:41 161

原创 Chang-Xiao Li Machine Learning 2019 Task1

学习打卡任务内容了解什么是机器学习:机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是...

2019-05-13 13:33:45 91

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除