![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 55
Kingslayer_
寂寞如烟,常伴吾身
展开
-
机器学习实战 K-近邻算法
K近邻分类器算法 预测约会网站配对# -*- coding: UTF-8 -*- from numpy import * import operator import matplotlib import matplotlib.pyplot as plt # k 近邻算法第一个分类器 def craetaDataSet(): group = array([[1.0, 1.1], [1.0,...原创 2018-06-06 16:09:25 · 196 阅读 · 0 评论 -
机器学习实战之决策树
决策时是一个分类算法。本文主要讲了一下决策树的构造以及用绘图的形式把决策树绘画出来。决策树的构造本文使用ID3算法来划分数据集,通过计算每一个特征的香农熵来选取最优划分数据集的特征,之后在递归的构造决策树来遍历每一个特征。下面公式是计算香农熵,p(xi)是选择该分类的概率 ,n是分类的数目。算法步骤:利用calcShannonEnt函数计算原始数据的原始香农熵,即最后的一个特征来划分计算出来的香农...原创 2018-06-20 11:30:38 · 275 阅读 · 0 评论 -
基于wiki的中文语料进行word2vec模型训练
最近看了一篇NDSS会议上的一篇论文,有关web安全方向和nlp方向的,论文题目为《Game of Missuggestions: Semantic Analysis of Search-Autocomplete Manipulations》。正好自己也想学学nlp。为将来毕业做准备。。。 也算一个小白。。看到论文使用了词向量word2vec算法,便去研究了一下算法原理。 看了很多中英文博客,...原创 2018-08-23 21:00:17 · 3616 阅读 · 2 评论 -
Santander Customer Transaction Prediction Kaggle比赛 小结
之前参加了kaggle的一个Santander Customer Transaction Prediction比赛,共有达9038支队伍参赛,一个号称寻找magic的比赛。参加比赛的的忘不了被magic这个词所支配的恐惧... 比赛链接 https://www.kaggle.com/c/santander-customer-transaction-prediction/overview...原创 2019-04-15 13:41:20 · 1467 阅读 · 2 评论