其它
探索空间
阿呆阿瓜的日常
展开
-
特征选择的策略--数据相关性(皮尔逊系数)与gini或者信息熵的的结合
首先特征选择在实际的数据挖掘项目中非常重要,从海量维度的特征中选取出表征明显的特征显得非常的重要。特征选择主要可以从数据相关性角度和信息增益的角度来考虑。 数据相关性判断:皮尔逊系数 当相关系数为0时,X和Y两变量无关系。 当X的值增大,Y也增大,正相关关系,相关系数在0.00与1.00之间 当X的值减小,Y也减小,正相关关系,相关系转载 2017-12-22 11:27:20 · 4251 阅读 · 0 评论 -
HTTP协议
HTTP协议 请求头都是以字符串的方式发送和解析的 客户端发送请求(request): GET / HTTP/1.1 # 格式:请求方式|路径|HTTP版本 Host: www.baidu.com Connection: keep-alive Cache-Control: max-age=0 # 缓存的最大周期 Upgrade-Insecure-Requests: 1 User-Agent:转载 2017-12-07 16:05:12 · 397 阅读 · 0 评论 -
凸优化-2
1.动机和目的 人在面临选择的时候重视希望自己能够做出“最好”的选择,如果把它抽象成一个数学问题,那么“最好的选择”就是这个问题的最优解。优化问题,就是把你考虑的各个因素表示成为一组函数(代价函数),解决这个问题就是在一集备选解中选择最好的解。 那么,为什么我们要讨论凸优化而不是一般的优化问题呢?那时因为凸优化问题具有很好的性质——局部最优就是全局最优,这一特性让我们能转载 2018-01-22 15:38:49 · 515 阅读 · 0 评论