自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 决策树 逻辑回归 KNN 的原理

决策树:每个内部节点代表一种特征 叶子节点代表 一种分类。基于训练数据建立决策树的过程是 特征选取的过程,递归地根据特征的信息增益来选取信息增益较大的特征 当做决策树的节点。这样的决策树生成算法叫 ID3算法,将ID3算法中的信息增益换成信息增益比 便是C4.5 算法,这两个算法的过程都是极大似然估计的过程。为了防止过拟合,将生成的决策树进行剪枝 简化:建立损失函数 包含两部分 对训练数据的预

2016-06-20 14:35:45 799

原创 python 写爬虫

http://www.zhihu.com/question/20899988 参考这个知乎的答案用requests and bs4 轻松爬取静态页面作者:挖数链接:http://www.zhihu.com/question/20899988/answer/96904827来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。以

2016-06-13 21:51:22 283

原创 TF-IDF 原始用去 计算判断 某个词语对文章的重要性

TF-IDF  我在对新闻分类的工作中用过 找文本的关键词后来 做新闻实体共现网络的时候 又用来找新闻文本中的关键实体今天 好好把它看了下 就是TF 和 IDF 两部分乘积嘛  后期有很多参数改进嘛

2016-06-13 16:40:47 416

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除