自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (15)
  • 收藏
  • 关注

转载 实时路况分析:不同路段车速预测、推荐(距离、时间、路况)最优路径

转的,如果有问题,及时联系我删除。大雨临城,大数据给你最温暖的怀抱原创 2016-07-23 孙弋涵 烦躁的雨天北京持续多日的强降水终于结束,打开uber看到界面上的小船又重新回归熟悉的汽车,真是让人大松一口气。大雨下北京的优步打船要说暴雨这几天无论对于是坐公共交通系统上下班,还是打车或者开

2016-07-25 19:39:00 21177 9

原创 几个相关系数:Pearson、Spearman、pointbiserialr、kendalltau

http://baike.baidu.com/link?url=rkocJKJhSEL0UO-iCqg8n76fhNKotOlC4zj3yGbPgahDRZa2AqNv_7FxUOlk0Cb8Y9wlkJAnVRzq3AsDNZfKUK皮尔逊相关系数(Pearson correlation coefficient)在统计学中,皮尔逊相关系数(Pearson correl

2016-07-18 15:36:36 37504 8

转载 cython,加速python,保护代码(3):扩展文件 .pxd

.pxd文件相当于c语言中的头文件.h。Using an augmenting .pxd allows to let the original .py file completely untouched. On the other hand, one needs to maintain both the .pxd and the .py to keep them in

2016-07-15 15:18:37 4258

原创 cython,加速python,保护代码(2):Faster code via static typing

http://docs.cython.org/src/quickstart/cythonize.htmlCython is a Python compiler. This means that it can compile normal Python code without changes (with a few obvious exceptions of some as-yet

2016-07-15 15:06:16 2012

转载 Cython,加速python,保护代码(1):Overview

一个更完整的例子:http://docs.cython.org/src/tutorial/cython_tutorial.htmlPrimesHere’s a small example showing some of what can be done. It’s a routine for finding prime numbers. You tell it ho

2016-07-15 14:14:34 3685

原创 sklearn源码解析:ensemble模型 零碎记录;如何看sklearn代码,以tree的feature_importance为例

最近看sklearn的源码比较多,好记性不如烂笔头啊,还是记一下吧。整体:)实现的代码非常好,模块化、多继承等写的很清楚。)predict功能通常在该模型的直接类中实现,fit通常在继承的类中实现,方便不同的子类共同引用。随机森林 和 GBDT)RandomForest的bootstrap是又放回的;GBDT则是无放回的。

2016-07-12 10:14:30 24487 6

原创 python平行(3):【parallel python】与【sklearn joblib的parallel和delayed】性能对比

随机森林的并行写完了。大致采用了两种方法:1)一种是 python并行(1)中提到的joblib的parallel和delayed方法(具体实现是直接使用sklearn.externals.joblib,因为sklearn优化得很好)2)第二种是采用http://www.parallelpython.com/的SMP两者编程都很简单,但效率相差还是挺大的,这里大概贴出三者的编程

2016-07-11 09:47:07 18858 4

转载 python并行(2):python多进程与多线程

转自:http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/00143192823818768cd506abbc94eb5916192364506fa5d000感谢廖老师。在Unix/Linux下,可以使用fork()调用实现多进程。要实现跨平台的多进程,

2016-07-10 20:28:45 4695

原创 深入RandomFroest

随机森林体现在随机上,台湾林老师讲了三种随机方式:1)样本bootstrap2)特征sample3)特征交叉组合看了sklearn的代码,实现了前两者,但没有第三种看了karpathy的代码(https://github.com/karpathy/Random-Forest-Matlab),没有bootstrap样本,feature组合部分写的也真是太“”随机“

2016-07-10 17:46:02 938 1

原创 python并行(1)

最近在看scikit learn的random forest源码,之后会公布一些简化版的代码,欢迎大家关注。【predict_proba】中有一块代码不清楚怎么回事。https://github.com/scikit-learn/scikit-learn/blob/51a765a/sklearn/ensemble/forest.py#L543# Parallel loo

2016-07-05 22:44:05 9163 1

挖掘DBLP作者合作关系,FP-Growth算法实践

挖掘DBLP作者合作关系,FP-Growth算法实践 包括三个代码,一堆结果文件

2017-04-07

Chrome_IE_driver_X64_X32.rar

Chrome_IE_driver 64位32位都有,很好用,已测试。

2016-11-07

dblp测试数据集

dblp测试数据集, 包括十六个会议的【部分内容】, 使用SDM, ICDM, ECML-­PKDD, PAKDD, WSDM, DMKD, TKDE, KDD Explorations, ACM Trans. On KDD, CVPR, ICML, NIPS, COLT、 CVPR、SIGIR、SIGKDD 十六个会议,至少从2000年至今的所有数据。 应用代码参考:http://blog.csdn.net/mmc2015/article/details/50988375 确实花了我很多时间搜集

2016-03-26

entity linking源码

使用lucene、lingpipe做实体连接(Entity Linking)。 数据来自dbpidia。 原始博客参考: http://blog.csdn.net/mmc2015/article/category/5795687 绝对值得参考。

2016-01-17

sql server 2008安装教程

sql server 2008安装教程,绝对详细。 每一步一个图。 不会的请留言,

2015-09-12

机器学习数据集,20news-bydate.rar

主要是解决这里的问题:http://blog.csdn.net/mmc2015/article/details/47971253#reply。数据集下载不下来,还是用现成的吧。

2015-09-06

20news-bydate.tar.gz

机器学习;数据集;20news; 机器学习数据集,主要是为不能用程序正常下载的同学准备。

2015-09-06

java读xml文件jar包

java读xml文件jar包,关于如何读写XML,参考:http://blog.csdn.net/mmc2015/article/details/47860133

2015-08-22

javaweb连接数据库包mysql-connector-java-5.1.27-bin.jar

javaweb连接数据库包 mysql-connector-java-5.1.27-bin.jar

2015-08-15

java操作excel包 jxl.jar

java操作excel包 jxl.jar

2015-08-15

java发送邮件jar包 activation.jar

java发送邮件jar包 activation.jar

2015-08-15

java发送邮件jar包 mail.jar

mail.jar java 发送邮件的jar包

2015-08-15

mysql-connector-java-5.1.27-bin.jar

mysql-connector-java

2015-08-15

中文《机器学习实战》(注解版).pdf

中文版的《机器学习实战》。 和网上资源不同的是,加入了自己的注解,是初学者学习起来有重点,易理解。

2015-07-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除