自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (2)
  • 问答 (1)
  • 收藏
  • 关注

原创 google 机器学习复习及重点笔记(二)

1、机器学习模型-分类(1)Logistics回归通过Sigmod函数,将回归值压缩入(0,1),用以表示分类概率。逻辑回归模型关键在于如何选择分类阈值,根据分类阈值进行回归值到类别的映射。此分类阈值由TP与TN的重要性决定,例如欺诈用户检验,是欺诈用户为TP,非欺诈用户为TN,该模型的作用在于甄别欺诈用户,因此应该提高TP的精确率,仅仅在意准确率是每没有参考意义的。一般需要同时考虑精

2018-03-07 21:16:12 519

原创 google 机器学习复习及重点笔记(一)

1、学习速率学习步长,控制损失函数负梯度->0的移动速度,要根据损失函数的平坦程度来确定。一般凸性较大,每迭代一次梯度下降程度较大,梯度学习速率适宜较小;反之,学习速率选择较大。一维空间中的理想学习速率是 1f(x)″(f(x) 对 x 的二阶导数的倒数)。二维或多维空间中的理想学习速率是海森矩阵(由二阶偏导数组成的矩阵)的倒数。广义凸函数的情况则更为复杂。2、降低损失:随机梯度下降损失函数...

2018-03-05 19:58:39 787

原创 pyspark本地开发环境配置

1、工具原料java jdk;python;spark-2.3.0-bin-hadoop2.7;winutils.exe2、配置流程(1)、jdk正确安装、配置环境变量(2)、python正确安装、配置环境变量(3)、环境变量Path,加入spark-2.3.0-bin-hadoop2.7\bin所在路径(4)、将winutils.exe加入hadoop2.7\bin目录下...

2018-03-02 11:12:42 2177

原创 Bay_Area_Bike_Share_Analysis

# 湾区单车共享分析说明:[点此查看此文档的英文版本](https://github.com/udacity/data-analyst/tree/master/projects/bike_sharing)。## 简介> **提示**:诸如此类的引用部分可以为如何导航和使用 iPython notebook 提供有用说明。湾区单车共享系统([Bay Area Bike Share](http://w

2016-10-24 17:24:56 1683

原创 Python pip使用小结

1、Python原2.7.3等版本,在使用pip安装模块时容易出现Insecure Warnning。原因之一是由于版本低于2.7.9造成。2、根据按装的python,寻找其目录下的Scripts,查看其中是否存在easy_install,存在则可以在Windows命令窗口执行easy_install.exe pip,即可快速安装pip。3、在http://www.lfd.uci.edu/

2016-03-30 18:58:01 368

Factorization Machine算法

已经封装好因子分解算法,包含简单的模型调参,主要用于二分类、回归问题

2018-07-09

海湾自行车用车分析

2016-10-24

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除