- 博客(6)
- 问答 (2)
- 收藏
- 关注
原创 《助理来也》NLP公司电话面试
《助理来也》NLP公司电话面试第一次面试,感觉这个公司很靠谱,因为中午有事,HR说五点然后改到6点,面试官6点整给我打电话,瞬间就感觉对这个公司好评满满。可能因为是初创公司,面的基本内容可能和公司需要的人才需要对口。没有问什么高大上的算法。对面试官和公司评价都不错,但是我基础部分面的不好,可能跪了。目前面完4天了没消息。-面试的主要部分如下1:CNN、RNN基本概念和网络结构。当时RNN不太熟,面的
2017-03-14 14:51:39 2436
原创 sklearn.GBDT 源码阅读(细节掌握)
依然是接着上一节的,我们关注每颗树是如何建立的。n_stages = self._fit_stages(X, y, y_pred, sample_weight, random_state, begin_at_stage, monitor, X_idx_sorted)def _fit_stages(self, X, y, y_p
2017-01-12 02:09:07 2668
原创 sklearn.GBDT 源码解读(宏观把握)
sklearn.GBDT源码解读 最近一直玩数据挖掘,GBDT使用了一点,就想看看源码是怎么实现的。 x当训练一个GBDT模型的时候,gbdt=sklearn.ensemble.GradientBoostingClassifier(param)本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮
2017-01-09 20:53:21 5261
原创 LIBSVM的结构分析
Svm_group_classes,该函数实现的目的是把数据集依照类别进行划分。Nr_class就是类别的个数,比如手写识别案例就是nr_class=10,因为十个数字。分好类以后采用one-to-one的训练方式。两个for循环遍历nr_class,每一类都和其他所有类进行一次最优超平面的划分。最后综合投票决定划分。
2016-03-20 21:40:44 1033
原创 机器学习实战 决策树 算法 笔记
卧槽 尼玛发现个史诗巨鳄 _name_ 如果加上_name_ 会报错 str object has no attribute ‘_name_‘我在Python27下亲自试过 不加_name_ type(secondDict[key]) 直接输出的就是type'dict' 或者是 type'str' 但是最重要事情来了。。。'dict' 和dict的区别 ==右侧如果是'dict' 直接字典就不是字典了。。而改成dict 不加单引号 就正确了 加上单引号直接就是叶子节点2 深度是1 但是如果不加单引号就
2015-11-07 19:05:00 3591
原创 机器学习实战--KNN 算法 笔记
print "the total error rate is: %f"%(errorCount/float(numTestVecs)) /* 错误率 /*最后得出结果 5%的错误率 机器学习实战书上算的2.4% /* 在不改变其他值的前提下 改变hoRatio的值 [0.05,0.1,0.2,0.3,0.4,0.5,0.9]对应的错误率[2%,5%,8%,8%,7%,6%,7%] 9:在测试结束,我们力求得出一个对于未来的约会预测函数,在我们输入飞行里程数,玩视频游戏的百分比和冰激凌公升数,我们希望
2015-11-07 18:59:20 3526
空空如也
hadoop中map处理多行数据,可以满足用于算法模型的输入。
2016-04-03
TA创建的收藏夹 TA关注的收藏夹
TA关注的人