![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 58
Vincent__Lai
这个作者很懒,什么都没留下…
展开
-
【机器学习】如何通过Recall和Precise快速判断自己模型的问题
定义Recall = TP/(TP+FN) , 查全率,反映了被正确判定的正例占总的正例的比重;Precise = TP/(TP+FP),反映了被分类器判定的正例中真正的正例样本的比重;对结果的判断1. 如果Recall高,Precise 低说明正类都能被正确预测,但是一部分负类也被预测成了正类分类器的问题:会偏向于预测正类分类器的优点:对负类的预测是靠谱的、可以找回大多数的正...原创 2020-04-18 14:26:31 · 5373 阅读 · 0 评论 -
【机器学习】西瓜书集成学习的误差-分歧分解公式推导
前言原文中,根据公式(8.28)写出了集成的“分歧”定义为:A‾(h∣x)=∑i=1Twi(hi(x)−H(x))2\overline A(h|x) = \sum\limits_{i=1}^{T}w_i(h_i(x)-H(x))^2A(h∣x)=i=1∑Twi(hi(x)−H(x))2结果在公式(8.31)突然变成,将分歧和误差联系上了,看得我非常懵逼A‾(h∣x)=∑i=1TwiE...原创 2019-12-23 19:38:07 · 2325 阅读 · 5 评论 -
【机器学习】One-Hot编码
定义One-Hot编码,也叫做一位有效编码采用N个寄存器对N个状态进行编码每一个状态都有其独立的寄存器位并在在任意一个时刻,只有一个位的值有效。即只有一位是1,其他位都是0例子国家 = [‘中国’, ‘美国’, ‘俄罗斯’],此时N=3,即有3个状态.中国 = [1 0 0]美国 = [0 1 0]俄罗斯 = [0 0 1]若还想要同时表示其他属性,例如加上:性别 = [‘...原创 2019-11-07 09:22:03 · 1552 阅读 · 0 评论 -
【机器学习】TP、TN、FP、FN记忆方法
之前总是搞混True和Positive含义,记录一下记忆方法TP —— True Positive (真正, TP)被模型预测为正的正样本;True Positive Rate可以称作判断为真的正确率TN —— True Negative(真负 , TN)被模型预测为负的负样本 ;True Negative Rate可以称作判断为假的正确率FP ——False Positive (假正...原创 2019-08-30 22:03:42 · 2216 阅读 · 2 评论 -
【Kaggle】手机验证
先要科学上网!手机前要加+860,例如你的手机是123456789,那么在手机号码那里填+860123456789勾选人机验证发送验证填写验证码即可原创 2019-02-09 18:19:38 · 1616 阅读 · 2 评论 -
【Python】特征归一化
import numpy as npfrom sklearn.preprocessing import MinMaxScalerminMax = MinMaxScaler()X = minMax.fit_transform(X_pre)原创 2019-01-12 17:54:43 · 1873 阅读 · 0 评论 -
【SPSS】Logistic回归OR(即EXP(B))计算方法
更详细请参考:http://blog.sina.com.cn/s/blog_44befaf60102vznn.htmlhttps://www.douban.com/note/352258282/直接举例子:当为二分类时(二元Logistic):假设数据如下:Health代表身体健康情况,1是健康,0是不健康;Aag代表年龄组,1是青年人,2是中年人:HealthAge...原创 2018-10-24 19:04:19 · 58238 阅读 · 3 评论 -
【天池大赛】从0-1的数据竞赛经验分享-视频笔记
数据竞赛所需能力:工具:pythonpandas,numpy,sklwarn,scipy,seaborn,re,keras,xgboost,lightgbm方法:建模数据预处理特征工程模型:相关的书——统计学习方法、机器学习、海量论文数据分析:结果分析,特征理解精神:社交能力:请教问题,结交厉害的朋友身体:熬夜奋斗抗压能力:排行榜的波动...原创 2018-10-14 21:39:24 · 1214 阅读 · 0 评论 -
【吴恩达机器学习笔记】Week5 ex4 nnCostFunction part1 答案
被Week5的ex4中nnCostFunction的part1卡了一下,现在弄懂了,说一下自己的理解% Part 1: Feedforward the neural network and return the cost in the% variable J. After implementing Part 1, you can verify that your% ...原创 2018-10-07 15:35:12 · 2587 阅读 · 1 评论 -
【Python】样本不均衡处理模块imblearn文档(待更新)
安装地址:https://github.com/scikit-learn-contrib/imbalanced-learnHelp on package imblearn:NAME imblearn - Toolbox for imbalanced dataset in machine learning.DESCRIPTION ``imbalanced-learn`` i...原创 2018-10-11 11:22:10 · 4457 阅读 · 0 评论 -
【吴恩达机器学习笔记】Week4 ex3答案
与上一周作业相同,按着公式编程就好了function [J, grad] = lrCostFunction(theta, X, y, lambda)%LRCOSTFUNCTION Compute cost and gradient for logistic regression with %regularization% J = LRCOSTFUNCTION(theta, X, y, ...原创 2018-09-24 14:20:24 · 2165 阅读 · 0 评论 -
【吴恩达机器学习笔记】Week3 ex2答案
function plotData(X, y)%PLOTDATA Plots the data points X and y into a new figure % PLOTDATA(x,y) plots the data points with + for the positive examples% and o for the negative examples. X is as...原创 2018-09-17 23:43:54 · 1316 阅读 · 0 评论 -
【吴恩达机器学习笔记】Week2 ex1答案
function A = warmUpExercise()%WARMUPEXERCISE Example function in octave% A = WARMUPEXERCISE() is an example function that returns the 5x5 identity matrixA = [];% ============= YOUR CODE HERE ==...原创 2018-09-15 23:09:28 · 2269 阅读 · 0 评论 -
【Kaggle】参加竞赛基本流程(以Titanic为例)
前言第一次参加Kaggle的时候,看了很多入门帖,但是还是看不懂不知道到底怎么参加,是在Kaggle上提交代码吗,像互联网公司程序员在线考试一样?还是提交预测的结果?没有一个像”Hello World”一样简单但是又完整的流程,因此写了这篇文章,大家不用理解代码的含义,只用复制现成的代码,简单的四步过下流程,熟悉下如何参加Kaggle即可0.运行环境:Win8 Python3...原创 2018-02-12 22:38:32 · 16686 阅读 · 6 评论 -
【吴恩达机器学习笔记】第一周
第一周IntroductionExperience E:训练集 Task T:任务 measure P:性能度量值(类似准确率) m:样本量 x:输入 y:输出Model and Cost Function假设函数 cost function J 求出当J最小时候的θ0与θ1,即为最佳参数cost function作用 一个特征: 两个特征:原创 2018-02-03 23:04:56 · 236 阅读 · 0 评论 -
【机器学习实战笔记】第2章 k-近邻算法【03】
第2章 k-近邻算法【03】实战3:手写识别系统一、涉及的Python函数功能介绍:1、readline()函数的作用readline()只读取一行,并且内部指针会自动下移一行 readlines()读取所有行不管是readline()还是readlines(),当读取完所有行内容后,若再次调用,则需要重新输入fr = open(filename) ,例如原创 2018-02-02 15:24:38 · 390 阅读 · 1 评论 -
【机器学习实战笔记】第2章 k-近邻算法【02】
第2章 k-近邻算法【02】实战2:在约会网站上使用k-近邻算法一、涉及的Python函数功能介绍:1、append() 函数的作用在列表末尾添加新的对象 http://www.runoob.com/python/att-list-append.html2、split()函数作用切分数据 http://www.runoob.com/python/att-原创 2018-02-02 13:57:14 · 1339 阅读 · 0 评论 -
【机器学习实战笔记】第2章 k-近邻算法【01】
第2章 k-近邻算法【01】原理:-存在一个样本数据集合(训练样本集),并且样本集中每个数据都存在标签 -输入没有label的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似的数据(最近邻)的分类标签,一般只选择K个最相似的数据中出现次数最多的分类,作为新数据的分类流程:收据数据准备数据:距离计算所需的数值分析数据训练算原创 2018-01-31 21:25:33 · 390 阅读 · 0 评论 -
【Python】pip安装numpy安装到一半失败解决办法
本文可解决的问题(1)直接在命令窗口输入pip install numpy,安装到一半的时候会报错,出现一大堆类似下图红色的错误 (2)64位电脑Python2.7在官网下载扩展包后仍按安装失败,报错提示: numpy-1.13.3+mkl-cp27-cp27m-win_amd64.whl is not a supported wheel on this platform 本电原创 2018-01-31 02:37:10 · 25742 阅读 · 0 评论