- 博客(5)
- 资源 (2)
- 问答 (1)
- 收藏
- 关注
原创 google 机器学习复习及重点笔记(二)
1、机器学习模型-分类(1)Logistics回归通过Sigmod函数,将回归值压缩入(0,1),用以表示分类概率。逻辑回归模型关键在于如何选择分类阈值,根据分类阈值进行回归值到类别的映射。此分类阈值由TP与TN的重要性决定,例如欺诈用户检验,是欺诈用户为TP,非欺诈用户为TN,该模型的作用在于甄别欺诈用户,因此应该提高TP的精确率,仅仅在意准确率是每没有参考意义的。一般需要同时考虑精
2018-03-07 21:16:12 519
原创 google 机器学习复习及重点笔记(一)
1、学习速率学习步长,控制损失函数负梯度->0的移动速度,要根据损失函数的平坦程度来确定。一般凸性较大,每迭代一次梯度下降程度较大,梯度学习速率适宜较小;反之,学习速率选择较大。一维空间中的理想学习速率是 1f(x)″(f(x) 对 x 的二阶导数的倒数)。二维或多维空间中的理想学习速率是海森矩阵(由二阶偏导数组成的矩阵)的倒数。广义凸函数的情况则更为复杂。2、降低损失:随机梯度下降损失函数...
2018-03-05 19:58:39 787
原创 pyspark本地开发环境配置
1、工具原料java jdk;python;spark-2.3.0-bin-hadoop2.7;winutils.exe2、配置流程(1)、jdk正确安装、配置环境变量(2)、python正确安装、配置环境变量(3)、环境变量Path,加入spark-2.3.0-bin-hadoop2.7\bin所在路径(4)、将winutils.exe加入hadoop2.7\bin目录下...
2018-03-02 11:12:42 2177
原创 Bay_Area_Bike_Share_Analysis
# 湾区单车共享分析说明:[点此查看此文档的英文版本](https://github.com/udacity/data-analyst/tree/master/projects/bike_sharing)。## 简介> **提示**:诸如此类的引用部分可以为如何导航和使用 iPython notebook 提供有用说明。湾区单车共享系统([Bay Area Bike Share](http://w
2016-10-24 17:24:56 1683
原创 Python pip使用小结
1、Python原2.7.3等版本,在使用pip安装模块时容易出现Insecure Warnning。原因之一是由于版本低于2.7.9造成。2、根据按装的python,寻找其目录下的Scripts,查看其中是否存在easy_install,存在则可以在Windows命令窗口执行easy_install.exe pip,即可快速安装pip。3、在http://www.lfd.uci.edu/
2016-03-30 18:58:01 368
海湾自行车用车分析
2016-10-24
LNK1181:cannot open input file "m.lib"
2016-04-25
TA创建的收藏夹 TA关注的收藏夹
TA关注的人