Machine Learning with Peppa

分享机器学习,数学,统计和编程干货

排序:
默认
按更新时间
按访问量

python DataFrame获取行数、列数、索引及第几行第几列的值

print df.columns.size#列数 print df.iloc[:,0].size#行数 print df.ix[[0]].index.values[0]#索引值 print df.ix[[0]].values[0][0]#第一行第一列的值 print df.ix[[1]].valu...

2018-07-15 13:30:17

阅读数:15

评论数:0

Python中DataFrame按照行遍历

在做分类模型时候,需要在DataFrame中按照行获取数据以便于进行训练和测试。import pandas as pd dict=[[1,2,3,4,5,6],[2,3,4,5,6,7],[3,4,5,6,7,8],[4,5,6,7,8,9],[5,6,7,8,9,10]] data=pd.Da...

2018-07-15 13:29:15

阅读数:5

评论数:0

python中计算DataFrame,Series的数据频率

在pandas里面常用用value_counts确认数据出现的频率。Series 情况下import numpy as npimport pandas as pdfrom pandas import DataFramefrom pandas import Seriesss = Series(['T...

2018-07-15 13:26:51

阅读数:4

评论数:0

Scala学习笔记——主构造器、辅助构造器与私有构造器

辅助构造器(Auxiliary Constructor)1. 辅助构造器的名称为this 2. 每个辅助构造器都必须以一个对先前已定义的其他辅助构造器或主构造器的调用开始 123class Student { private var name = " "...

2018-07-14 17:41:30

阅读数:10

评论数:0

C/C++面试宝典:虚函数与纯虚函数

参考《C/C++程序员面试宝典》虚函数与纯虚函数虚函数的主要作用是建立抽象模型,从而可以达到方便扩展系统的目的。纯虚函数是指被标明为不具体实现的虚函数,是一种特殊的虚函数。两者的区别虚函数必须是基类的非静态成员函数,其访问权限可以是protected或public,在基类的类定义中定义虚函数的形式...

2018-07-14 17:25:43

阅读数:28

评论数:0

机器学习实战系列(七):数值回归与预测

1、线性回归现有一数据集,其分布如下图所示,通过观察发现可以通过一个线性方程去拟合这些数据点。可设直线方程为 y=wx. 其中w称为回归系数。那么现在的问题是,如何从一堆x和对应的y中确定w?一个常用的方法就是找出使误差最小的w。这里的误差是指预测y值和真实y值之间的差值,我们采用平方误差,写作:...

2018-07-14 15:18:49

阅读数:34

评论数:0

机器学习实战系列(六):Adaboost提升法

这次做的系列是《机器学习实战》,原书比较久远了,且代码和练习都是基于Python2,我个人是升级到了Python3,因此使用最新的版本来写这些习题。具体2和3其实在基础语法上并没有太多差别,一些高级特性比如装饰器工厂,协程,IO等Python3的新用法,一般机器学习也用不上,因为追求性能的话都会用...

2018-07-13 13:56:26

阅读数:24

评论数:0

《机器学习实战》原书数据与代码(基于Python3)汇总

这次做的系列是《机器学习实战》,原书比较久远了,且代码和练习都是基于Python2,我个人是升级到了Python3,因此使用最新的版本来写这些习题。具体2和3其实在基础语法上并没有太多差别,一些高级特性比如装饰器工厂,协程,IO等Python3的新用法,一般机器学习也用不上,因为追求性能的话都会用...

2018-07-13 12:16:46

阅读数:20

评论数:0

Java中List与ArrayList的区别及用法

 List是一个接口,而ArrayList是List接口的一个实现类。 ArrayList类继承并实现了List接口。 因此,List接口不能被构造,也就是我们说的不能创建实例对象,但是我们可以像下面那样为List接口创建一个指向自己的对象引用,而ArrayList实现类的实例对象就在这充当了这个...

2018-07-10 21:34:37

阅读数:14

评论数:0

机器学习实战系列(五):SVM支持向量机

1、支持向量机概述1.1 原理简述所谓支持向量机,顾名思义,分为两个部分了解,一什么是支持向量(简单来说,就是支持(或支撑)平面上把两类类别划分开来的超平面的向量点),二这里的“机(machine,机器)”是一个算法。在机器学习领域,常把一些算法看做是一个机器,如分类机(当然,也叫做分类器),而支...

2018-07-10 13:36:39

阅读数:30

评论数:0

Hive报错:Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient

Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient解决方法1、Hive版本过高。第一次安装我用的是Hive的1.2.1版本,mysql是5.6.33,hadoop是2.6版本。但是安...

2018-07-09 17:09:09

阅读数:16

评论数:0

Scala中的Apply方法与伴生对象

Scala比Java更面向对象的一个方面是Scala没有静态成员。替代品是,Scala有单例对象:singleton object。当单例对象与某个类共享同一个名称时,他被称作是这个类的伴生对象:companion object。你必须在同一个源文件里定义类和它的伴生对象。类被称为是这个单例对象的...

2018-07-08 21:57:54

阅读数:65

评论数:0

机器学习实战系列(四):logistic回归

logistic回归假设我们现有一些数据点,我们用一条直线对这些点进行拟合,这个拟合的过程就称作回归。利用logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。我们知道,logistic回归主要是进行二分类预测,也即是对于0~1之间的概率值,当概率大于0.5...

2018-07-08 15:35:25

阅读数:23

评论数:0

推荐系统:NDCG评价指标

排名指标两个最受欢迎的排名指标是MAP和NDCG。我们在前段时间已经使用了平均精度均值(MAP)。NDCG表示归一化折损累积增益。两者之间的主要区别是,MAP认为是二元相关性(一个项是感兴趣的或者不感兴趣的),而NDCG允许以实数形式进行相关性打分。这种关系类似分类和回归的关系。实际当中,很难直接...

2018-07-07 14:04:01

阅读数:77

评论数:0

机器学习实战系列(三):朴素贝叶斯算法

算法简介    朴素贝叶斯算法是有监督的学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立(条件特征独立)性和连续变量的正态性假设为前提,就会导...

2018-07-07 12:55:55

阅读数:120

评论数:0

《机器学习实战》UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199

File "C:/Users/Administrator/Machine-Learning/Naive_Bayes/__main__.py", line 31, in <module> Spam_filte...

2018-07-06 21:20:27

阅读数:13

评论数:0

机器学习实战系列(二):决策树算法

这个月开始练习《机器学习实战》,原书比较久远了,且代码和练习都是基于Python2,我个人是升级到了Python3,因此使用最新的版本来写这些习题。具体2和3其实在基础语法上并没有太多差别,一些高级特性比如装饰器工厂,协程,IO等Python3的新用法,一般机器学习也用不上,因为追求性能的话都会用...

2018-07-05 17:05:10

阅读数:25

评论数:0

Scala常用List列表操作方法

把Scala List的几种常见方法梳理汇总如下,日常开发场景基本上够用了。创建列表scala> val days = List("Sunday", "Monday", "Tuesday...

2018-07-03 16:18:21

阅读数:31

评论数:0

Github-emoji表情图像大全

目录人物自然事物地点符号人物 :bowtie: :smile: :laughing: :blush: :smiley: :relaxed: :smirk: :heart_eyes: :kissing_heart: :kissing_closed_eyes: :flushed: :relieved:...

2018-07-03 14:51:36

阅读数:113

评论数:0

Hadoop-Mapreduce经典习题:字数统计

源数据与代码也放在我的GITHUB:Hadoop-mapreduce,欢迎fork与starMapperpackage hadoops; import java.io.*; import javax.servlet.*; import org.apache.hadoop.mapreduce.M...

2018-07-03 14:21:22

阅读数:31

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭