机器学习
江西师范大学-20届-吴悠
江西师范大学20届软件学院毕业生,大数据方向,大数据技术、机器学习、深度学习、爬虫、Django、区块链、ACM、PS修图、Pr视频剪辑、摄影都搞。爱好旅游、摄影、跑步、读书。
展开
-
数据平滑
对于二元语法来说,一种最简单的平滑技术就是假设每个二元语法出现的次数比实际出现的次数多一次,不妨将该处理方法称为加1法。数据平滑是语言模型中的核心问题,多年来很多学者在这方面做了大量的研究工作。下面简要介绍一些主要的数据平滑方法。加法平滑方法古德-图灵(Good-Turing)估计法Katz平滑方法Jelinek-Mercer平滑方法Witten-Bell平滑方法绝对减值法...原创 2020-07-11 16:03:18 · 316 阅读 · 0 评论 -
通过矩阵运算求出参数融合的最佳参数
在做毕业设计时,求取到了一些图书的参数,然后打算通过模型融合来拟合用户的评分,我选取的办法是简单的参数融合。整个分数矩阵记作X,则最佳系数为W,使得XW约等于Y故对其进行矩阵运算伪逆矩阵=(转置矩阵矩阵)求逆*转置矩阵代码如下:# -*- coding: utf-8 -*-import numpy as npdef main(): print('learning...')...原创 2020-04-17 16:37:24 · 421 阅读 · 0 评论 -
机器学习中的先验、后验和似然
机器学习中的先验、后验和似然的概念理解1、我自己的理解:1)先验:统计历史上的经验而知当下发生的概率;2)后验:当下由因及果的概率;2、网上有个例子说的透彻:1)先验——根据若干年的统计(经验)或者气候(常识),某地方下雨的概率;2)似然——下雨(果)的时候有乌云(因/证据/观察的数据)的概率,即已经有了果,对证据发生的可能性描述;3)后验——根据天上有乌云(原因或者证据/观察数据)...转载 2018-10-13 09:13:42 · 3893 阅读 · 0 评论 -
K近邻算法
K近邻算法的简易实现对未知类别属性的数据集中的每个点依次执行以下操作:计算已知类别数据集中的点与当前点之间的距离按照距离递增次序排序选取与当前点距离最小的K个点确定前K个点所在类别的频率返回前K个点出现频率最高的类别作为当前点的预测分类具体代码实现如下:...原创 2018-10-17 23:27:35 · 145 阅读 · 0 评论 -
机器学习中的感知机原始形式
简单感知机模型的代码实现原创 2018-10-09 23:06:48 · 293 阅读 · 0 评论 -
朴素贝叶斯的实现
调用sklearn库的NaiveBayes实现朴素贝叶斯朴素贝叶斯使用概率论的知识进行监督学习的训练import numpy as npfrom sklearn.naive_bayes import GaussianNB # 引入高斯朴素贝叶斯features_train = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1],...原创 2018-10-24 23:21:15 · 332 阅读 · 0 评论 -
决策树之隐形眼镜分类
决策树之隐形眼镜分类用于分类和回归的树统称为决策树import pandas as pdfrom sklearn.preprocessing import LabelEncoderimport pydotplusfrom sklearn.externals.six import StringIOif __name__ == '__main__': with open('le...原创 2018-11-03 20:21:51 · 496 阅读 · 0 评论 -
Logistic回归预测疝气病病马死亡率
Logistic回归预测疝气病病马死亡率官方使用文档LogisticRegression参考链接:https://blog.csdn.net/c406495762/article/details/77851973#四-使用sklearn构建logistic回归分类器参数说明如下:penalty:惩罚项,str类型,可选参数为l1和l2,默认为l2。用于指定惩罚项中使用的规范。newto...原创 2018-11-08 11:02:08 · 727 阅读 · 0 评论