- 博客(3)
- 收藏
- 关注
原创 决策树 逻辑回归 KNN 的原理
决策树:每个内部节点代表一种特征 叶子节点代表 一种分类。基于训练数据建立决策树的过程是 特征选取的过程,递归地根据特征的信息增益来选取信息增益较大的特征 当做决策树的节点。这样的决策树生成算法叫 ID3算法,将ID3算法中的信息增益换成信息增益比 便是C4.5 算法,这两个算法的过程都是极大似然估计的过程。 为了防止过拟合,将生成的决策树进行剪枝 简化:建立损失函数 包含两部分 对训练数据的预
2016-06-20 14:35:45 850
原创 python 写爬虫
http://www.zhihu.com/question/20899988 参考这个知乎的答案 用requests and bs4 轻松爬取静态页面 作者:挖数 链接:http://www.zhihu.com/question/20899988/answer/96904827 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 以
2016-06-13 21:51:22 295
原创 TF-IDF 原始用去 计算判断 某个词语对文章的重要性
TF-IDF 我在对新闻分类的工作中用过 找文本的关键词 后来 做新闻实体共现网络的时候 又用来找新闻文本中的关键实体 今天 好好把它看了下 就是TF 和 IDF 两部分乘积嘛 后期有很多参数改进嘛
2016-06-13 16:40:47 431
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人