机器学习
曾牛
成功的三个关键,坚持,坚持,再坚持
展开
-
朴素贝叶斯算法
理论:P(X|Y) = P(X,Y)/P(Y)P(X,Y) = P(X|Y)P(Y)P(X,Y) = P(Y|X)P(X)由此推导出朴素贝叶斯公式:P(X|Y) = P(Y|X)P(X)/P(Y)由此推导:p(yi|X) = P(yi)p(X|yi)/P(X)Y = 表示类别集合{军事0、财经1、体育2}yi = 表示第i个类别X = 一篇文章xi = 文章中的某...原创 2019-03-03 15:09:28 · 605 阅读 · 2 评论 -
机器学习概述
机器学习概念:一些概念:python机器学习:词袋法(WOB):统计文本中各个单词出现的数量,使用单词出现的数量作为文本的特征向量;词袋法中使用单词作为特征,但是一般情况下单词比较多,所以可以考虑自定义词典作为特征,然后对文档中自定义文档中出现的单词的数量进行统计即可。召回率和精确率互斥,F...原创 2019-03-09 13:23:49 · 106 阅读 · 0 评论 -
softmax(多分类算法)实践
1.训练集规模:数据(第一行为维度,每个字段的名字):第二行为具体真是样本数据:第一列是标签,后面是特征(0-9的数字识别)样本格式(10分类,每个类别的样本数较均匀):图像:28*28:softmax代码:# encoding=utf8import sysimport mathimport pandas as pdimport numpy a...原创 2019-03-12 11:25:31 · 4530 阅读 · 5 评论 -
sklearn之三分类应用
用到的代码目录:1.入门demo:(先不关心具体数据是什么)python代码:lr_iris.pyimport numpy as npfrom sklearn import datasetsfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import Logisti...原创 2019-03-21 14:43:05 · 1329 阅读 · 1 评论 -
java.lang.IllegalArgumentException: requirement failed: Column features must be of type org.apache.s
lr训练模型报错:val model1 = lr.fit(training)java.lang.IllegalArgumentException: requirement failed: Column features must be of type org.apache.spark.ml.linalg.VectorUDT@3bfc3ba7 but was actually org.apa...原创 2019-04-24 11:44:49 · 2776 阅读 · 0 评论 -
统计学习方法笔记之符号表与目录
目录:原创 2019-09-06 17:58:09 · 297 阅读 · 0 评论