- 博客(5)
- 资源 (7)
- 收藏
- 关注
原创 python使用汇总
python中函数参数*args和**kw的区别*args是可变参数,args接收的是一个tuple,把list或tuple的元素变成可变参数传进去,即可变参数允许你传入0个或任意个参数,这些可变参数在函数调用时自动组装为一个tuple(有序列表,元组,一旦初始化就不能修改): **kw是关键字参数,kw接收的是一个dict。关键字参数允许你传入0个或任意个含参数名的参数,这些关键字参数在函...
2017-01-17 11:41:33 653 1
原创 sklearn-数据预处理-特征变换
标准化z-score标准化经过去均值来对某个特征进行中心化,再通过除以非常量特征(non-constant features)的标准差进行缩放。class preprocessing.StandardScaler(copy=True, with_mean=True, with_std=True):标准正态分布化的类属性:scale_:ndarray,缩放比例mean_:...
2017-01-16 10:42:49 5488
原创 Spark MLlib算法
Spark MLlib算法官方文档Mathematical formulation数学公式Loss functions损失函数hinge losslogistic losssquared lossRegularizers正则化L1L2elastic netzero (unregularized)Optimization优化spark使用 SGD 和 L-BFGS 这两种梯度下降方法
2017-01-09 22:22:31 926
原创 spark笔记二之Spark程序模型Transformation算子与action算子
Spark程序模型textFile读取文件val file=sc.textFile(“hdfs://192.168.192.137:9000/data/t1.csv”) filter函数过滤带“a”的行,输出errors(errors也是一个RDD)filter(func)val errors=file.filter(line=>line.contains(“a”)) count函数返回带“a”
2017-01-03 15:47:09 702
原创 Spark使用笔记汇总
安装IDEA及打包-常见问题参考http://www.cnblogs.com/seaspring/p/5615976.html https://yq.aliyun.com/articles/60346?spm=5176.8251999.569296.68 版本问题很重要,修改版本后注意新建项目的时候版本也得匹配 参考https://www.zhihu.com/question/34099679
2017-01-03 11:32:31 1765
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人