自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Machine Learning with Tutors

分享机器学习,数学,统计和编程干货

  • 博客(22)
  • 资源 (10)
  • 问答 (1)
  • 收藏
  • 关注

原创 机器学习实战系列(八):分类与回归树

课程的所有数据和代码在我的Github:Machine learning in Action,目前刚开始做,有不对的欢迎指正,也欢迎大家star。除了 版本差异,代码里的部分函数以及代码范式也和原书不一样(因为作者的代码实在让人看的别扭,我改过后看起来舒服多了)。在这个系列之后,我还会写一个scikit-learn机器学习系列,因为在实现了源码之后,带大家看看SKT框架如何使用也是非常重要的。  ...

2018-07-26 22:17:40 845

转载 深入浅出Flume之原理解析

阅读目录(Content)一、Flume简介 二、Flume特点 三、Flume的一些核心概念 3.1、Agent结构   3.2、source 3.3、Channel 3.4、Sink 四、Flume拦截器、数据流以及可靠性 4.1、Flume拦截器 4.2、Flume数据流 4.3、Flume可靠性 五、Flume使用场景 5.1、多个agent顺...

2018-07-25 00:14:39 1229

原创 Java中synchronized与Lock的区别

***//***//***//***//***/}lock():获取锁,如果锁被暂用则一直等待unlock():释放锁tryLock(): 注意返回类型是boolean,如果获取锁的时候锁被占用就返回false,否则返回truetryLock(long time, TimeUnit unit):比起tryLock()就是给了一个时间期限,保证等待参数时间。

2018-07-20 13:07:56 16513 7

转载 深入浅出Java反射机制

JAVA反射机制是在运行状态中,对于任意一个类,都能够知道这个类的所有属性和方法;对于任意一个对象,都能够调用它的任意一个方法和属性;这种动态获取的信息以及动态调用对象的方法的功能称为java语言的反射机制。要想解剖一个类,必须先要获取到该类的字节码文件对象。而解剖使用的就是Class类中的方法.所以先要获取到每一个字节码文件对应的Class类型的对象.以上的总结就是什么是反射反射就是把java类中的各种成分映射成一个个的Java对象。

2018-07-18 18:29:51 350

原创 Python-Scikit learn保存机器学习训练的模型

在做模型训练的时候,尤其是在训练集上做交叉验证,通常想要将模型保存下来,然后放到独立的测试集上测试,下面介绍的是Python中训练模型的保存和再使用。scikit-learn已经有了模型持久化的操作,导入joblib即可。

2018-07-17 23:56:01 1758

原创 python DataFrame获取行数、列数、索引及第几行第几列的值

print df.ix[[0]].values[0][0]#第一行第一列的值。print df.ix[[1]].values[0][1]#第二行第二列的值。print df.ix[[0]].index.values[0]#索引值。print df.iloc[:,0].size#行数。print df.columns.size#列数。

2018-07-15 13:30:17 25350

原创 Python中DataFrame按照行遍历

在做分类模型时候,需要在DataFrame中按照行获取数据以便于进行训练和测试。

2018-07-15 13:29:15 2653

原创 python中计算DataFrame,Series的数据频率

我的机器学习教程「美团」算法工程师带你入门机器学习 已经开始更新了,欢迎大家订阅~任何关于算法、编程、AI行业知识或博客内容的问题,可以随时扫码关注公众号「图灵的猫」,加入”学习小组“,沙雕博主在线答疑~此外,公众号内还有更多AI、算法、编程和大数据知识分享,以及免费的SSR节点和学习资料。其他平台(知乎/B站)也是同名「图灵的猫」,不要迷路哦~在pa...

2018-07-15 13:26:51 8916

原创 Scala学习笔记——主构造器、辅助构造器与私有构造器

上述代码声明并初始化了不可变字段name和color,并且这两个字段都是对象私有的。也就是说,类的方法,只能访问到当前对象的字段。想要让主构造器变成私有构造器,只需要加上private关键字即可。这样做之后,就必须使用辅助构造器来构造Dog对象了。

2018-07-14 17:41:30 5435

原创 C/C++面试宝典:虚函数与纯虚函数

参考《C/C++程序员面试宝典》

2018-07-14 17:25:43 714

原创 机器学习实战系列(七):数值回归与预测

 课程的所有数据和代码在我的Github:Machine learning in Action,目前刚开始做,有不对的欢迎指正,也欢迎大家star。除了 版本差异,代码里的部分函数以及代码范式也和原书不一样(因为作者的代码实在让人看的别扭,我改过后看起来舒服多了)。在这个系列之后,我还会写一个scikit-learn机器学习系列,因为在实现了源码之后,带大家看看SKT框架如何使用也是非常重要的...

2018-07-14 15:18:49 2417 1

原创 机器学习实战系列(六):Adaboost提升法

目前刚开始做,有不对的欢迎指正,也欢迎大家star。除了 版本差异,代码里的部分函数以及代码范式也和原书不一样(因为作者的代码实在让人看的别扭,我改过后看起来舒服多了)。在这个系列之后,我还会写一个scikit-learn机器学习系列,因为在实现了源码之后,带大家看看SKT框架如何使用也是非常重要的。Adaboost提升算法是机器学习中很好用的两个算法之一,另一个是SVM支持向量机;机器学习面试中也会经常提问到Adaboost的一些原理;

2018-07-13 13:56:26 793

原创 《机器学习实战》原书数据与代码(基于Python3)汇总

这次做的系列是《机器学习实战》,原书比较久远了,且代码和练习都是基于Python2,我个人是升级到了Python3,因此使用最新的版本来写这些习题。具体2和3其实在基础语法上并没有太多差别,一些高级特性比如装饰器工厂,协程,IO等Python3的新用法,一般机器学习也用不上,因为追求性能的话都会用C/C++等语言去实现,Python只是小规模的测试用。除了版本差异,代码里的部分函数以及代码范式也和原书不一样(因为作者的代码实在让人看的别扭,我改过后看起来舒服多了)。

2018-07-13 12:16:46 22203 6

原创 Java中List与ArrayList的区别及用法

因此,List接口不能被构造,也就是我们说的不能创建实例对象,但是我们可以像下面那样为List接口创建一个指向自己的对象引用,而ArrayList实现类的实例对象就在这充当了这个指向List接口的对象引用。要是你已经学过了OOP,上面的部分是不难理解的,这是面向对象重要的知识点,面向对象最重要的就是多态,我们都知道接口和抽象不能被实例化,但是它们可以创建一个指向自己的对象引用,它们的实现类或子类就在充当这样的角色,我想这就是面向对象编程中多态的优势。

2018-07-10 21:34:37 6537 1

原创 机器学习实战系列(五):SVM支持向量机

 课程的所有数据和代码在我的Github:Machine learning in Action,目前刚开始做,有不对的欢迎指正,也欢迎大家star。除了 版本差异,代码里的部分函数以及代码范式也和原书不一样(因为作者的代码实在让人看的别扭,我改过后看起来舒服多了)。在这个系列之后,我还会写一个scikit-learn机器学习系列,因为在实现了源码之后,带大家看看SKT框架如何使用也是非常重要的...

2018-07-10 13:36:39 1592 1

原创 Hive报错:Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient

我的机器学习教程「美团」算法工程师带你入门机器学习 以及「三分钟系列」数据结构与算法已经开始更新了,欢迎大家订阅~这篇专栏整合了这几年的算法知识,简单易懂,也将是我实体书的BLOG版。欢迎大家扫码关注微信公众号「图灵的猫」,除了有更多AI、算法、Python相关文章分享,还有免费的SSR节点和外网学习资料。其他平台(微信/知乎/B站)也是同名「图灵的猫」,不要迷路哦~...

2018-07-09 17:09:09 691

原创 Scala中的Apply方法与伴生对象

类和单例对象间的一个差别是,单例对象不带参数,而类可以。每个单例对象都被作为由一个静态变量指向的虚构类:synthetic class的一个实例来实现,因此它们与Java静态类有着相同的初始化语法。当单例对象与某个类共享同一个名称时,他被称作是这个类的伴生对象:companion object。类被称为是这个单例对象的伴生类:companion class。Scala 的apply 有2 张形式,一种是 伴生对象的apply ,一种是 伴生类中的apply,下面展示这2中的apply的使用。

2018-07-08 21:57:54 967

原创 推荐系统:NDCG评价指标

两个最受欢迎的指标是MAP和NDCG。我们在前段时间已经使用了(MAP)。NDCG表示。两者之间的主要区别是,MAP认为是二元相关性(一个项是感兴趣的或者不感兴趣的),而NDCG允许以实数形式进行相关性打分。这种关系类似分类和回归的关系。实际当中,很难直接地优化MAP或NDCG指标,因为他们是不连续的,所以不可微。幸运的是,表明,用于排名学习的一对损失函数近似于这些指标。

2018-07-07 14:04:01 33402 1

原创 《机器学习实战》UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xae in position 199

今天做贝叶斯这一章的时候出了这个问题,Python3版本的GBK不太跳BUG,所以我特意上网查了一下,发现是文档里的“?”符号出错,作者应该打成了非英语系的符号。根据decode byte 0xae in position 199看出来好像是文件中某个字节不能解码,经过好心人的查找,是HAM的第23个文件出问题了。

2018-07-06 21:20:27 9973 4

原创 Scala常用List列表操作方法

把Scala List的几种常见方法梳理汇总如下,日常开发场景基本上够用了。

2018-07-03 16:18:21 16803

转载 Github-emoji表情图像大全

目录人物自然事物地点符号人物 :bowtie: :smile: :laughing: :blush: :smiley: :relaxed: :smirk: :heart_eyes: :kissing_heart: :kissing_closed_eyes: :flushed: :relieved: :satisfied: :grin: :wink: :stuck_out_tongue_winkin...

2018-07-03 14:51:36 6288

原创 matplotlib无法显示图片的解决方法(non-gui backend)

Windows下解决方案应该是一样的(只是配置文件位置不同),还没有使用Windows跑过,请自行Google。(其中,~/.config/matplotlib/是配置文件matplotlibrc的路径)

2018-07-03 13:14:30 34429 2

支持向量机通俗导论(SVM三层境界)-2018最新LaTex版

此版本我找了很久,是作者July最新订正的博文整理而来,比原来的版本多了20页,干货十足,也是支持向量机SVM详解的深度好文,难度适中。

2018-06-05

最优化:GMRES算法

最优化算法里的一个比较重要的算法GMRES,里面还讲了GRAM正交等

2018-05-26

An Introduction to Statistical Learning with R

统计学习殿堂级入门课本,PRML/ESL前置必读,另外看完这本书去看别的书会非常流畅

2018-05-26

Matrix CookBook

用于机器学习,数据挖掘有关矩阵知识的汇总复习,简短有用

2018-05-26

利用Python进行数据分析(高清中文版)

中文原版,最新的一个版本,代码和字都很清晰。自己看完了,分享一下

2018-05-26

2017留学行业大数据报告

2017留学行业数据报告,包括人数,专业,出国趋势等各项分析

2018-05-26

机器学习:迫近算子

机器学习中的一篇有关迫近算子的论文,对于一些模型有参考作用

2018-05-26

TCP/IP简明教程

40页的教程,简要介绍了TCP/IP和OSI协议的架构和细节,适合入门

2018-05-26

Python新闻标题挖掘小项目

主要教大家用Python构建一个小的文本挖掘项目,用来挖掘新闻标题(内附代码)

2018-05-26

Kronecker克罗内克积

线性代数中有关直和与直积的运算,这里主要讲解了在矩阵里的应用

2018-05-26

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除