- 博客(11)
- 收藏
- 关注
转载 Boosted Tree
1. 前言应 @龙星镖局 兄邀请写这篇文章。作为一个非常有效的机器学习方法,Boosted Tree是数据挖掘和机器学习中最常用的算法之一。因为它效果好,对于输入要求不敏感,往往是从统计学家到数据科学家必备的工具之一,它同时也是kaggle比赛冠军选手最常用的工具。最后,因为它的效果好,计算复杂度不高,也在工业界中有大量的应用。2. Boosted Tree的若干同义词说到这里可能有
2015-05-11 16:13:52 812
转载 “人工特征工程+线性模型”的尽头
11年的时候我加入百度,在凤巢使用机器学习来做广告点击预测。当时非常惊讶于过去两年内训练数据如此疯狂的增长。大家都在热情的谈特征,每次新特征的加入都能立即得到AUC的提升和收入的增长。大家坚信特征才是王道,相信还会有源源不断的特征加入,数据规模还会成倍的增长。我也深受感染,坚定的相信未来两年数据至少还会长十倍,因此一切的工作都围绕这个假设进行。现在两年过去了,回过头来看,当时的预测是正确的吗?
2015-05-11 16:10:28 1741
转载 Tomcat Neither the JAVA_HOME nor the JRE_HOME environment variable is defined
一眼就能看出来是jdk的环境有问题,但是用了这么久的jdk一直都配置的好好的,怎么一到Tomcat上就这么矫情了。最后查解决方案,原来是我的jdk从官网直接下载的,虽然我修改了java_home,但不太智能的tomcat仍然没有自动识别出java_home路径。linux解决方法:编辑文件 /usr/local/tomcat/bin/catalina.sh (根据你自己
2015-04-15 13:55:48 486
原创 Java Probelem
1.关于找不到或者无法加载主类的错误. 首先执行目录需要在src下,javac 包名/类名.java 其次还是在src目录下,执行 java 包名.类名 如果还存在问题,需要在配置的CLASSPATH下最后添加 ;(找不到class,说明问题出现在classpath)
2015-04-12 15:25:54 426
原创 Scrapy问题
1. rules规则start_urls = [' ']rules = [Rule(SgmlLinkExtractor(allow=[r' ']), callback=' ', follow=True)] 其中callback一般不使用parse,因为parse是默认的,如果用parse的话,会导致重写. rules规则是指在start_urls下所有的链接中符合allow规则的,进
2015-01-24 14:51:06 353
原创 Ubuntu问题-持续更新
1. 更新至ubuntu 14.04的时候,发现system setting中的很多设置选项都没了,安装一下sudo apt-get install unity-control-center就可以了.
2015-01-22 16:43:54 370
转载 如何修炼成大数据高手?
首先声明一点,千万不要以为看了这篇文章就能成为大数据高手了,不然就不会用“修炼”这个词了,要修炼成大数据高手决不是件容易的事,可以说是非常难的一件事。要不也不会连大数据发源地——美国也不超出10个人(也许就5、6个)能达到这个层次,在中国……算了,就不说了。这篇文章实际是给你指一条过程异常艰辛,但前途异常光明的路。没有毅力的人,看看就好了,千万别认真。(说实在的,就算要看明白这篇文章,也都
2014-09-08 13:04:04 1005
转载 世界上十个著名悖论详解
今天看了十个著名悖论的最终解答:)发一下跟大家分享~第一个电车问题耶鲁大学的公开课Justice也有提到哟~还有第九个薛定谔的猫里提到的公式什么的公主真的不懂啊QAQ世界十个著名悖论的最终解答(一)电车难题(The Trolley Problem) 引用: 一、“电车难题”是伦理学领域最为知名的思想实验之一,其内容大致是:一个疯子把五个无辜的人绑在电车轨道上。一辆失控
2014-08-30 09:18:03 2918
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人