自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 资源 (4)
  • 收藏
  • 关注

原创 机器学习中的数学-矩阵

原创文章,如需转载请保留出处本博客为七月在线机器学习数学课程学习笔记一. 部分使用的数学符号表1.1 数学符号表1.2 Ax = b的行视图1.3 线性相关和线性无关二. Span、基和子空间(Subspace)2.1 Span2.2 四个基本的子空间...

2019-09-18 10:27:55 322

原创 Python3基础教程

#一.标识符#1.1 第一个字符必须是字母表中字母或下划线 _ 。#1.2 标识符的其他的部分由字母、数字和下划线组成。#1.3 标识符对大小写敏感。#二.保留字#2.1 保留字即关键字,我们不能把它们用作任何标识符名称。Python 的标准库提供了一个 keyword 模块,可以输出当前版本的所有关键字:import keywordprint (keyword.kwlist)#三...

2019-09-11 13:32:07 663 1

原创 机器学习中的算法-Xgboost算法

原创文章,如需转载请保留出处本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记一.集成算法思想1.1 集成算法将多个分类器集成起来而形成的新的分类算法。这类算法又称元算法(meta-algorithm)。最常见的集成思想有两种bagging和boosting。1.2 举例(1)看上面一个图例左边:有5个样本,现在想看下这5个人愿不愿意去玩游戏,这5个人现在都分到了叶子...

2019-08-24 16:53:00 394

原创 机器学习中的算法-降维算法

原创文章,如需转载请保留出处本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记一.数据降维降维就是一种对高维度特征数据预处理方法。降维是将高维度的数据保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。在实际的生产和应用中,降维在一定的信息损失范围内,可以为我们节省大量的时间和成本。降维也成为应用非常广泛的数据预处理方法。降维具有如下一些优点:...

2019-07-25 16:52:42 946

原创 机器学习案例实战:聚类算法

原创文章,如需转载请保留出处本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记一. 多种算法概述1.1 预测HTTP异常流量的检测二. 聚类案例实战2.1 获取数据#beer datasetimport pandas as pd#sep=’ ‘: 表示当输入多个打印的值时,各个值之间分割方式, 默认空格,可以自定义beer = pd.read_csv('data...

2019-07-20 19:05:14 2416

原创 机器学习中的算法-聚类算法

原创文章,如需转载请保留出处本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记一.聚类给定一组数据点,我们可以使用聚类算法将每个数据点划分为一个特定的组。理论上,同一组中的数据点应该具有相似的属性和/或特征,而不同组中的数据点应该具有高度不同的属性和/或特征。聚类是一种无监督学习的方法,是许多领域中常用的统计数据分析技术。1.1 聚类概念无监督问题:我们手里没有标签聚...

2019-07-17 15:28:12 434

原创 机器学习案例实战:sklearn求解支持向量机

原创文章,如需转载请保留出处本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记一.支持向量机import numpy as npimport matplotlib.pyplot as pltfrom scipy import statsimport seaborn as sns; sns.set()二.支持向量机基本原理#随机来点数据from sklearn...

2019-07-16 15:34:20 797

原创 机器学习中的算法支持向量机

原创文章,如需转载请保留出处本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记一.简介1.1 定义支持向量机(support vector machines)是一种二分类模型,它的目的是寻找一个超平面来对样本进行分割,分割的原则是间隔最大化,最终转化为一个凸二次规划问题来求解。由简至繁的模型包括:当训练样本线性可分时,通过硬间隔最大化,学习一个线性可分支持向量机;当训...

2019-07-15 18:07:08 231

原创 机器学习案例实战:Python文本数据分析新闻分类任务

原创文章,如需转载请保留出处本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记一. 文本分析与关键词提取1.1 文本数据1.2 停用词语料中大量出现没啥大用留着过年吗1.3 Tf-idf:关键词提取《中国的蜜蜂养殖》:进行词频(Term frequency,缩写TF)统计出现次数最多的词:“的”、“是”、“在”…这类最常用的词(停用词)“中国”、“蜜...

2019-07-14 17:51:14 4920 2

原创 机器学习中的算法-贝叶斯算法

原创文章,如需转载请保留出处本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记一.贝叶斯算法概述1.1贝叶斯简介:贝叶斯(约1701-1761)Thomas Bayes,英国数学家贝叶斯方法源于他生前为了解决一个“逆概”问题写的一篇文章1.2贝叶斯要解决的问题正向概率:假设袋子里面有N个白球,M个黑球,你伸手进去摸一把,摸出黑球的概率是多大逆向概率:如果我们事...

2019-07-12 16:42:26 358

原创 机器学习案例实战:使用sklearn构造决策树模型

原创文章,如需转载请保留出处本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记一. 决策树复习参考https://blog.csdn.net/qq_14815661/article/details/94838783二. 决策树涉及参数2.1 导入三大件%matplotlib inlineimport matplotlib.pyplot as pltimport pa...

2019-07-07 10:54:56 1149

原创 机器学习中的算法决策树与随机森林

原创文章,如需转载请保留出处本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记一. 决策树1.1 树模型决策树:从根节点开始一步步走到叶子节点(决策)所有的数据最终都会落到叶子节点,既可以做分类也可以做回归1.2 树的组成根节点:第一个选择点非叶子节点与分支:中间过程叶子节点:最终的决策结果1.3 节点增加节点相当于在数据中切一刀,节点越多越好吗?...

2019-07-06 16:56:41 517

原创 机器学习案例实战:交易数据异常检测

原创文章,如需转载请保留出处本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记一. 案例背景目标1.1 背景现给定一些信用卡相关数据,从中剔除异常数据import pandas as pdimport matplotlib.pyplot as pltimport numpy as np%matplotlib inlinedata = pd.read_csv('c...

2019-07-04 13:33:22 1847 1

原创 机器学习案例实战:Python实现逻辑回归与梯度下降策略

原创文章,如需转载请保留出处本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记一. Python实现逻辑回归任务概述1.1 问题描述我们将建立一个逻辑回归模型来预测一个学生是否被大学录取。假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人的历史数据,你可以用它作为逻辑回归的训练集。对于每一个培训例子,你可以有两个考试申请人的分数和录取决定。为了做到这一点,我...

2019-07-02 22:54:39 647

原创 机器学习中的算法-逻辑回归算法

原创文章,如需转载请保留出处本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记一.逻辑回归算法原理推导1.1 逻辑回归(Logistic regression)== 目的:经典的二分类算法 ==1.2 Sigmoid函数二.逻辑回归求解...

2019-06-29 09:27:01 221

原创 机器学习中的算法-梯度下降策略

原创文章,如需转载请保留出处本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记一. 梯度下降原理1.1 梯度下降1.2 原理二. 梯度下降方法对比2.1 梯度下降方法批量梯度下降随机梯度下降小批量梯度下降三. 学习率对结果的影响...

2019-06-26 15:49:22 417

原创 机器学习中的算法-线性回归算法原理推导

原创文章,如需转载请保留出处本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记一. 线性回归算法概述1.1 线性回归机器学习分有监督学习和无监督学习。有监督学习分回归和分类。回归:通过数据最终预测出一个值。分类:根据样本特征对样本进行类别判定的过程。1.2 解释如何找出一条线,能解释额度和工资、年龄之间关系1.3 通过数学讨论θ1和θ2称为权重参数...

2019-06-24 22:13:57 821

原创 机器学习中的数学-极大似然估计

原创文章,如需转载请保留出处本博客为七月在线邹博老师机器学习数学课程学习笔记一. 极大似然估计1.1 极大似然估计假设D是样本集合,A是参数集合,我们在D样本集固定的情况下,A取何值时,P(A|D)能取到最大。我们现在的主要目的是求1式的最大值,其中1式通过贝叶斯公式能转换为2式的形式,其中2式的分母相同,我们只需要考虑分子即可–即3式,又因为P(Ai)近似相等.所以我们可以将3式...

2019-06-23 16:17:18 176

原创 机器学习中的数学-矩估计

原创文章,如需转载请保留出处本博客为七月在线邹博老师机器学习数学课程学习笔记一. 样本的统计量二. 矩估计2.1 矩估计定义矩估计的原理即是假设样本的K阶矩等于总体的K阶矩,可以估计出总体的参数2.2 正态分布的矩估计2.3 均匀分布的矩估计...

2019-06-23 15:04:11 1289

原创 机器学习中的数学-中心极限定理

原创文章,如需转载请保留出处本博客为七月在线邹博老师机器学习数学课程学习笔记一. 概率密度/概率分布函数概率密度只是针对连续性变量而言,而分布函数是对所有随机变量取值的概率的讨论,包括连续性和离散型。已知连续型随机变量的密度函数,可以通过讨论及定积分的计算求出其分布函数;当已知连续型随机变量的分布函数时,对其求导就可得到密度函数。概率密度曲线y轴意义在于给定相同长度下,样本落在此段几...

2019-06-23 12:13:19 559

原创 机器学习中的数学-偏度和峰度

原创文章,如需转载请保留出处本博客为七月在线邹博老师机器学习数学课程学习笔记一. 矩1.1 对于随机变量X,X的K阶原点矩为1.2 X的K阶中心矩为期望实际上是随机变量X的1阶原点矩,方差实际上是随机变量X的2阶中心矩变异系数(Coefficient of Variation):标准差与均值(期望)的比值称为变异系数,记为C.V偏度Skewness(三阶)峰度Kurtosi...

2019-06-23 11:37:46 923

原创 机器学习中的数学-期望、方差与协方差

一. 期望1.1 期望的性质无条件成立E(kX)=kE(X)E(X+Y)=E(X)+E(Y)若X和Y互相独立E(XY)=E(X)E(Y) 反之不成立。实际上,若E(XY)=E(X)E(Y),只能说明X和Y不相关。1.2 事件的独立性1.3 计算期望1.4计算每一位的期望1.5 集合Hash问题二. 方差...

2019-06-22 17:44:02 3308

原创 机器学习中的数学-概率计算与拒绝采样

一. 一定接受率下的采样1.1 已知有个rand7()的函数,返回1到7随机自然数,让利用rand7()构造rand10()随机1~10。1.2 解:二.事件的独立性给定A和B是两个事件,若有P(AB)=P(A)P(B),则称事件A和事件B相互独立。说明: A和B独立,则P(A|B)=P(A) 实践中往往根据两个事件是否相互影响而判断独立性:如给定M个样本、若干次采样等情形,...

2019-06-22 16:34:17 174

原创 机器学习中的数学-概率论基础

一. 概率论1.1对概率的认识P(x)∈[0,1]P=0:事件出现的概率为0若x为离散/连续变量,则P=(x=x0)表示x0发生的概率/概率密度1.2 累计分布函数Φ(x)=P(≤x0)Φ(x)一定为单增函数min(Φ(x))=0,max(Φ(x))=1将值域为[0,1]的某函数y=f(x)看成x事件的累积概率若y=f(x)可导,则p(x)=f`(x)为某概率密度函数...

2019-06-22 15:39:51 541

原创 机器学习中的数学-Taylor展式与拟牛顿

本节主要内容:Taylor展式 计算函数值 解释gini系数公式 平方根公式牛顿法 梯度下降算法 拟牛顿法 DFP BFGS一.Taylor公式-Maclaurin公式1.1 应用1:函数值计算数值计算:初等函数值的计算(在原点展开)计算:求整数k和小数r,使得:x=kln2+r,|r|≤0.5ln21.2 应用2:解释Gini系数...

2019-06-22 11:33:25 226

原创 机器学习中的数学-微积分和梯度

机器学习中的数学主要涉及以下几类,本文会依次更新对数学的理解。微积分、梯度和Jensen不等式Taylor展开及其应用常见概率分布和推导指数族分布共轭分布统计量距估计与最大似然估计区间估计Jacobi矩阵解密矩阵乘法矩阵分解RQ和SVD对称矩阵凸优化本节主要内容:1.常数e的计算过程2.常见函数的导数3.分部积分法及其应用4.梯度 - 上升/下降最快方向5...

2019-06-17 15:34:46 850

原创 可视化库-Seaborn

Seaborn(可视化库)Seaborn:是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。#...

2019-06-08 01:12:46 152

原创 数据可视化库-Matplotlib

Matplotlib (数据可视化库)Matplotlib:是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形#matplotlib画图#plot():画图#show():显示import pandas as pdimport matplotlib.pyplot as pltunrate = pd.read_csv("unrate.c...

2019-06-05 14:27:33 183

原创 数据分析处理库-Pandas

print (food_info["Iron_(mg)"])div_1000 = food_info["Iron_(mg)"]/1000print (div_1000)#排序 从小到大food_info.sort_values("Sodium_(mg)",inplace = True)print (food_info["Sodium_(mg)"])#排序 从大到小food_info...

2019-06-03 17:08:37 395

原创 科学计算库-Numpy

二. Numpy(科学计算库)数据结构import numpy#创建矩阵vector = numpy.array([5,10,15,20])matrix = numpy.array([[5,10,15],[20,25,30],[35,40,45]])print (vector)print (matrix)[ 5 10 15 20][[ 5 10 15] [20 25 30...

2019-06-03 09:42:18 418

原创 Python基础

Python基础快速入门

2019-04-05 22:24:24 133

KaggleCredit2.csv.zip

人工智能下机器学习,在训练数据的时候所需的资源。目标跟踪的测试数据集 cifar10数据集类标签 链接目标数据库 目标函数 数据集合 Dataset数据集 多数据集 数据集 dataset 数据采集 MNIST数据集 集训目标

2020-06-17

plsqldev1208x32

plsqldev1208x32。连接Oracle。plsqldev1208x32。连接Oracle。

2019-01-17

Navicate for Mac

Navicate for Mac破解版。Navicate for Mac破解版。Navicate for Mac破解版。Navicate for Mac破解版。Navicate for Mac破解版。

2018-02-09

maven-resources-plugin-2.4.3

maven-resources-plugin-2.4.3.maven-resources-plugin-2.4.3.

2018-02-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除