机器学习
AlanConstantineLau
额......
展开
-
python机器学习——十次交叉验证训练的数据准备算法
摄于 2017年4月21日 台湾垦丁船帆石海滩前言python强大的机器学习包scikit-learn可以直接进行交叉分割,之所以写个相当于锻炼自己思维。这两天本来打算开始写朴素贝叶斯分类器的算法的,由于上一篇博文python实现贝叶斯推断——垃圾邮件分类在实现时,在数据划分训练集和测试集的时候遇到两个问题,第一是数据量太少,只有50条数据,解决方法就是扩大数据量咯。第二个,也...原创 2017-05-12 21:05:52 · 11336 阅读 · 3 评论 -
python实现机器学习中的各种距离计算及文本相似度算法
import numpy as npimport math# 依赖包numpy、python-Levenshtein、scipydef Euclidean(vec1, vec2): npvec1, npvec2 = np.array(vec1), np.array(vec2) return math.sqrt(((npvec1-npvec2)**2).sum())# eucli原创 2017-04-03 22:45:07 · 14257 阅读 · 1 评论 -
python机器学习——KNN算法简单入门(真的很简单!)
所有代码请移步GitHub——kNNbyPython很多人在第一次听到机器学习的时候都不知所措,无从下手。起初我也是这样的,各种看别人的博客,吴恩达的课程也死磕,但效果不佳。后来发现一个神奇的网站k-近邻算法实现手写数字识别系统–《机器学习实战 》,跟着过了一遍之后感觉还不错,也顺便买了《机器学习实战》这本书,接着就正式入坑机器学习。 KNN算法应该是机器学习中最简单的算法之一,作为机器学习...原创 2017-04-30 00:06:29 · 10980 阅读 · 4 评论 -
python实现Canopy算法
前两个月在做项目突然发现Canopy算法发现网上直接用python实现的不多,因为Mahout已经包含了这个算法,需要使用的时候仅需要执行Mahout几条命令即可,并且多数和MapReduce以及Hadoop分布式框架一起使用,感兴趣的可以在网上查阅。但出于学习和兴趣的态度,我更想尝试用python来亲自实现一些底层算法。原创 2017-09-09 10:34:42 · 6871 阅读 · 15 评论 -
python实现贝叶斯推断——垃圾邮件分类
理论理论强推阮一峰大神的个人网站 1.贝叶斯推断及其互联网应用(一):定理简介 2.贝叶斯推断及其互联网应用(二):过滤垃圾邮件 非常简明易懂,然后我下面的代码就是实现上面过滤垃圾邮件算法的。前期准备数据来源数据来源于《机器学习实战》中的第四章朴素贝叶斯分类器的实验数据。数据书上只提供了50条数据(25条正常邮件,25条垃圾邮件),感觉数据量偏小,以后打算使用scik...原创 2017-05-11 20:47:34 · 10195 阅读 · 11 评论 -
使用keras搭建BiLSTM对人民日报语料进行分词
代码移步我的GITHUB——PeoplesDailyNER 其中的README已经详细说明,若有疑问请留言。原创 2018-03-24 21:00:20 · 2313 阅读 · 2 评论 -
机器学习的python笔记
使用python实现各种机器学习算法操作系统:Windows 10、Ubuntu、 MaxOSPython版本:3.5.3、3.6.2主项目GITHUB地址MachineLearningNote现有: * 贝叶斯推断 * Canopy * 决策树(进行中) * 指数平滑模型 * 梯度下降 * K-NN * 局部加权回归 * logistic回归 * 多叉树 * ...原创 2018-07-23 22:51:53 · 418 阅读 · 0 评论