- 博客(10)
- 资源 (15)
- 收藏
- 关注
转载 实时路况分析:不同路段车速预测、推荐(距离、时间、路况)最优路径
转的,如果有问题,及时联系我删除。大雨临城,大数据给你最温暖的怀抱原创 2016-07-23 孙弋涵 烦躁的雨天北京持续多日的强降水终于结束,打开uber看到界面上的小船又重新回归熟悉的汽车,真是让人大松一口气。大雨下北京的优步打船要说暴雨这几天无论对于是坐公共交通系统上下班,还是打车或者开
2016-07-25 19:39:00 21177 9
原创 几个相关系数:Pearson、Spearman、pointbiserialr、kendalltau
http://baike.baidu.com/link?url=rkocJKJhSEL0UO-iCqg8n76fhNKotOlC4zj3yGbPgahDRZa2AqNv_7FxUOlk0Cb8Y9wlkJAnVRzq3AsDNZfKUK皮尔逊相关系数(Pearson correlation coefficient)在统计学中,皮尔逊相关系数(Pearson correl
2016-07-18 15:36:36 37504 8
转载 cython,加速python,保护代码(3):扩展文件 .pxd
.pxd文件相当于c语言中的头文件.h。Using an augmenting .pxd allows to let the original .py file completely untouched. On the other hand, one needs to maintain both the .pxd and the .py to keep them in
2016-07-15 15:18:37 4258
原创 cython,加速python,保护代码(2):Faster code via static typing
http://docs.cython.org/src/quickstart/cythonize.htmlCython is a Python compiler. This means that it can compile normal Python code without changes (with a few obvious exceptions of some as-yet
2016-07-15 15:06:16 2012
转载 Cython,加速python,保护代码(1):Overview
一个更完整的例子:http://docs.cython.org/src/tutorial/cython_tutorial.htmlPrimesHere’s a small example showing some of what can be done. It’s a routine for finding prime numbers. You tell it ho
2016-07-15 14:14:34 3685
原创 sklearn源码解析:ensemble模型 零碎记录;如何看sklearn代码,以tree的feature_importance为例
最近看sklearn的源码比较多,好记性不如烂笔头啊,还是记一下吧。整体:)实现的代码非常好,模块化、多继承等写的很清楚。)predict功能通常在该模型的直接类中实现,fit通常在继承的类中实现,方便不同的子类共同引用。随机森林 和 GBDT)RandomForest的bootstrap是又放回的;GBDT则是无放回的。
2016-07-12 10:14:30 24487 6
原创 python平行(3):【parallel python】与【sklearn joblib的parallel和delayed】性能对比
随机森林的并行写完了。大致采用了两种方法:1)一种是 python并行(1)中提到的joblib的parallel和delayed方法(具体实现是直接使用sklearn.externals.joblib,因为sklearn优化得很好)2)第二种是采用http://www.parallelpython.com/的SMP两者编程都很简单,但效率相差还是挺大的,这里大概贴出三者的编程
2016-07-11 09:47:07 18858 4
转载 python并行(2):python多进程与多线程
转自:http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/00143192823818768cd506abbc94eb5916192364506fa5d000感谢廖老师。在Unix/Linux下,可以使用fork()调用实现多进程。要实现跨平台的多进程,
2016-07-10 20:28:45 4695
原创 深入RandomFroest
随机森林体现在随机上,台湾林老师讲了三种随机方式:1)样本bootstrap2)特征sample3)特征交叉组合看了sklearn的代码,实现了前两者,但没有第三种看了karpathy的代码(https://github.com/karpathy/Random-Forest-Matlab),没有bootstrap样本,feature组合部分写的也真是太“”随机“
2016-07-10 17:46:02 938 1
原创 python并行(1)
最近在看scikit learn的random forest源码,之后会公布一些简化版的代码,欢迎大家关注。【predict_proba】中有一块代码不清楚怎么回事。https://github.com/scikit-learn/scikit-learn/blob/51a765a/sklearn/ensemble/forest.py#L543# Parallel loo
2016-07-05 22:44:05 9163 1
dblp测试数据集
2016-03-26
entity linking源码
2016-01-17
机器学习数据集,20news-bydate.rar
2015-09-06
java读xml文件jar包
2015-08-22
javaweb连接数据库包mysql-connector-java-5.1.27-bin.jar
2015-08-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人