- 博客(4)
- 资源 (6)
- 问答 (2)
- 收藏
- 关注
原创 Python机器学习及实践——基础篇8(LinerR和SGD)
回归问题与分类问题的区别在于:期待预测的目标是连续变量,比如:价格、降水量等等。与前面的介绍方式不同,这里不会对回归的应用场景进行横向扩展;而是只针对一个“美国波士顿地区房价预测”的经典回归问题进行分析,好让读者朋友对各种回归模型的性能与优缺点有一个深入的比较。 前面介绍过分类的线性模型。其中为了便于将原本在实数域上的计算结果映射到(0,1)区间,引入了逻辑斯蒂函数。而在线性回归问题...
2018-03-28 20:25:35 2134 4
原创 Python机器学习及实践——基础篇7(分类集成模型)
常言道:“一个篱笆三个桩,一个好汉三个帮”。集成分类模型便是综合考量多个分类器的预测结果,从而做出决策。只是这种“综合考量”的方式大体上分为两种: 一种是利用相同的训练数据同时搭建多个独立的分类模型,然后通过投票的方式,以少数服从多数的原则作出最终的分类决策。比较具有代表性的模型为随机森林分类器,即在相同训练数据上同时搭建多颗决策树。然而上一篇中提到过,一株标准的决策树会根据每维特征...
2018-03-25 21:05:36 2168
原创 Python机器学习及实践——基础篇6(决策树)
前面所使用的逻辑斯蒂回归和支持向量机模型,都在某种程度上要求被学习的数据特征和目标之间遵照线性假设。然而,在许多现实场景下,这种假设是不存在的。 比如,要借由一个人的年龄来预测患流感的死亡率。如果采用线性模型假设,那只有两种情况:年龄越大死亡率越高;或者年龄越低死亡率越高。然而根据常识判断,青壮年因为更加健全的免疫系统,相较于儿童和老年人不容易因患流感而死亡。因此年龄与因流感而死之间...
2018-03-25 19:57:46 880
原创 python连接oracle报错CX_oracle解决方法
使用的python2.7 64位,但公司的oracle client是32位,连接时报错。 解决方法:1. 下载合适的oracle客户端,也就是64位的客户端;2. 解压到上层一点的目录,例如C:\oracle\instantclient_12_2;3. 把目录加到环境变量path中,如果有多个oracle环境变量,把它加到最前面;4. (非必须)下载安装正确的Visual Stu...
2018-03-22 18:52:25 3942 3
waffles工具
2016-04-07
SVDFeature
2016-04-07
jieba分词的停用此表,为什么对英文不起作用?
2017-06-13
关于lenskit 跑的时候出了点问题
2016-01-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人