数据挖掘
CZ626626
这个作者很懒,什么都没留下…
展开
-
贝叶斯分类实例(Kaggle比赛之『旧金山犯罪分类预测』)
这里我参照的是http://blog.csdn.net/longxinchen_ml/article/details/50629613 这篇博客。import pandas as pdimport numpy as np###############读入数据##################用pandas载入csv训练数据,并解析第一列为日期格式train=pd.read_csv('F原创 2017-04-09 12:35:52 · 3800 阅读 · 0 评论 -
贝叶斯(Kaggle比赛之影评与观影者情感判定)
本文参考博客http://blog.csdn.net/han_xiaoyang/article/details/50629608而来import re #正则表达式from bs4 import BeautifulSoup #html标签处理import pandas as pd##############数据导入#############def review_to_wordlist(re原创 2017-04-09 13:59:30 · 1665 阅读 · 0 评论 -
机器学习相关算法网址
如果你想搜索比较新颖的机器学习资料或是文章,可以到以下网站中搜索,里面不仅包括了机器学习的内容,还有许多其它相关领域内容,如数据科学和云计算等。 InfoWord:http://www.infoworld.com/reviews/ Kdnuggets:http://www.kdnuggets.com Datasciencecentral:http://www.datasciencecentra原创 2017-04-10 08:42:28 · 557 阅读 · 0 评论 -
使用朴素贝叶斯进行文本的分类
转载与http://blog.csdn.net/jasonding1354/article/details/45463677#comments 引言朴素贝叶斯由贝叶斯定理延伸而来的简单而强大的概率模型,它根据每个特征的概率确定一个对象属于某一类别的概率。该方法基于一个假设,所有特征需要相互独立,即任一特征的值和其他特征的值没有关联关系。 虽然这种条件独立的假设在许多应用领域未必能很好满足,甚至是转载 2017-04-18 16:41:51 · 691 阅读 · 0 评论 -
2016 CCF大数据与计算智能大赛 开源资料整理
2016 CCF大数据与计算智能大赛 开源资料整理2016 CCF 大数据与计算智能大赛已经落下帷幕,11个赛题由众多大神包揽奖项,其中有些还在赛后开源了比赛资料,现将目前已知的资料整理如下,供各位同学一起参考学习。若有意公开自己的比赛资料或者发现整理的列表中有遗漏的,可以联系我(金陵书生, netivs@qq.com )补充修订。有问题也可在群里讨论。部分比赛PPT已经放到大数据比赛交流转载 2017-11-29 10:00:38 · 868 阅读 · 0 评论 -
支持向量机的问题转化与推导
一、概念 已知训练数据集 T={(x1,y1),(x2,y2),......,(xN,yN)}T=\{(x_{1},y_{1}),(x_{2},y_{2}),......,(x_{N},y_{N})\} 分离超平面:y(x)=wx+by(x)=wx+b(1)样本点(xi,yi)(x_{i},y_{i})到分割超平面的函数间隔: r¯i=yi(wxi+b)\over原创 2017-11-15 20:12:17 · 513 阅读 · 0 评论