- 博客(5)
- 资源 (23)
- 收藏
- 关注
原创 Hadoop进阶(hadoop streaming c++实现 & MapReduce参数调优)
hadoop streaming c++实现 心得 与 MapReduce参数调用目录:1,机器学习 & MRHadoop进阶(hadoop streaming c++实现 & MapReduce参数调优)hadoop streaming (shell执行 & combiner & 数据分割)hadoop streaming python 处理 lzo 文件遇到的问题spark安装与调试推荐算法之Jaccard相似度与Consine相似度LibLinear使用总结深度学习在推荐领域的应用
2017-05-27 11:12:19 2290 1
原创 hadoop streaming (shell执行 & combiner & 数据分割)
先上干货:hadoop.streaming 的一个完整的shell脚本;(shell执行脚本实例 & combiner初探 & 数据分割) 21 ### 2--- tasks 22 HADOOP=/usr/bin/hadoop 23 24 local_file="./wc.data" 25 #input="yapeng/WC/input/*.txt" 26 input="yapeng/WC/input2" 27 output="yapeng/
2017-05-23 16:25:03 5671 1
原创 LibLinear使用总结(L1,L2正则)
一般情况下,L1即为1范数,为绝对值之和;L2即为2范数,就是通常意义上的模。L1会趋向于产生少量的特征,而其他的特征都是0,即实现所谓的稀疏,而L2会选择更多的特征,这些特征都会接近于0。对于solver的选择,作者的建议是:一般情况下推荐使用线性svm,其训练速度快且效果与lr接近;一般情况下推荐使用L2正则化项,L1精度相对低且训练速度也会慢一些,除非想得到一个稀疏的模型(个人注:当特征数量非常大,稀疏模型对于减少在线预测计算量比较有帮助)
2017-05-22 15:11:46 13004 1
原创 urlencode & quote & unquote (url 中带中文参数)
当url地址含有中文或者“/”的时候,这是就需要用做urlencode一下编码转换。一、urlencodeurlencode的参数是词典,它可以将key-value这样的键值对转换成我们想要的格式。如果你用的是python2.*,urlencode在urllib.urlencode。如果使用的是python3,urlencode在urllib.parse.urlencode例如
2017-05-22 15:07:02 10197 1
原创 linux crontab -e报错 || 不执行 || expected unqualified-id before
1,linux 新安装的centOS 或小红包系统,第一次执行crontab -e命令报错 Error detected while processing /root/.vim/bundles.vim:2,Linux下定时任务(秒级别)的实现 --- crontab仅仅可以分钟级别,自定义脚本while true + sleep3,C++ * a和*&a作为函数的参数时有什么区别?
2017-05-22 15:00:59 4261
IKAnalyzer2012_u6 和 jcseg-dict-all两款工具
2014-12-24
htmlparser解析Html的jar包和源文件包(两个)
2014-12-24
jxl解析Excel的jar包和源文件包(两个)
2014-12-24
ArcGIS_Editor_for_OSM_2_1_Desktop_Beta3
2014-11-26
数据结构(c++英文版)
2014-11-23
c++list类实现
2014-11-23
c++string类的实现
2014-11-23
数据挖掘导论完整版
2014-11-12
C++程序设计(谭浩强)
2014-08-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人