自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 MachineLearning Practice: CART

regTrees.pyfrom numpy import *def loadDataSet(fileName): #general function to parse tab -delimited floats dataMat = [] #assume last column is target value fr = open(fileName

2016-01-31 18:04:02 528

原创 MachineLearning Practice: linear regression

00''' Created on Jan 8, 2011@author: Peter ''' from numpy import *def loadDataSet(fileName): #general function to parse tab -delimited floats numFeat = len(open(fileName).readline().split('\t'

2016-01-31 17:56:32 423

原创 MachineLearning Practice: Adaboost

from numpy import *def loadSimpData(): datMat = matrix([[ 1. , 2.1], [ 2. , 1.1], [ 1.3, 1. ], [ 1. , 1. ], [ 2. , 1. ]]) classLabels = [1.0, 1.0, -1.0, -1.

2016-01-29 10:49:07 636

原创 MachineLearning Practice: decision tree

1.K-NN算法可以完成很多分类任务,但是其中的一个较大的缺点是其无法给出数据的内在含义,决策树能在数据形式上能对数据产生很好的解读。决策树能够挖掘数据中蕴含的信息,因此决策树可以应用于不熟悉的数据集,从中提取一系列的规则,而这个过程也是机器学习的过程。2.构建决策树时,如果该数据集的分类还不是同一类,计算该数据集的信息熵和不同特征条件下的信息熵,选择信息增益(information gain)最大

2016-01-16 20:30:21 430

原创 DataStructures:algorithm analysis

1.算法是解决问题的指令集。单算法给定时,可以计算算法所用的时间或者空间资源。算法分析就是计算算法的时间和空间复杂度,并对算法做出优化,获取对问题更有效的计算方法。2.当T(N)=O(f(N))(念大O),f(N)是T(N)的上界,也就是T(N)在以不快于f(N)的速度增长。f(N)=Ω(T(N))(念omega),则T(N)是f(N)的下界,T(N)=Θ(h(N))(念theta)是T(N)的增长

2016-01-15 14:07:29 429

原创 MachineLearning Practice:K-NN

1.存在一个样本数据集,作为样本数据集,该样本集的每一条数据都存在标签也就是说每条样本集的类别已知。输入一个没有标签的新数据集,将新数据的特征和样本集的数据特征进行比较,然后提取与新数据最相似的样本数据的标签作为新数据的标签。一般来说,选择样本集中前K个出现次数最多的标签作为新数据的标签。2.一般步骤:收集数据(文本/其他程序收集)–>准备数据(归一化,格式化数据,是数据使用于距离计算)–>分析数据

2016-01-11 21:36:34 429

原创 DataStructures:Introduction

public class Test { public static void main(String[] args) { person[] ps = new employee[5]; ps[0]=new student(); System.out.println("ok"); } }class perso

2016-01-11 11:05:01 349

原创 Numpy:使用Matplotlib绘图

matplotlib tutorial1.Matplotlib是python中非常有用的绘图库,与numpy结合得很好,同时Matplotlib也是独立的开源项目。 2. # ----------------------------------------------------------------------------- # Copyright (c) 2015, Nicolas P.

2016-01-08 10:15:32 740

转载 卷积的意义

原文链接卷积最近总是和卷积打交道,工作需要,每天都要碰到它好几次,不胜烦恼,因为在大学时候学信号与系统的时候就没学会,我于是心想一定要把卷积完全搞明白。正好同办公室的同学也问我什么是卷积,师姐昨天也告诉我说:”我也早就想把这个问题搞明白了!”经过一段时间的思考之后,有一些很有趣的体会和大家分享。听说卷积这种运算式物理学家发明的,在实际中用得不亦乐乎,而数学家却一直没有把运算的意义彻底搞明白。仔细品以

2016-01-07 20:03:44 433

转载 大牛讲解信号与系统以及数字信号处理

转载链接 第一课 什么是卷积 卷积有什么用 什么是傅利叶变换 什么是拉普拉斯变换引子 很多朋友和我一样,工科电子类专业,学了一堆信号方面的课,什么都没学懂,背了公式考了试,然后毕业了。先说”卷积有什么用”这个问题。(有人抢答,”卷积”是为了学习”信号与系统”这门课的后续章节而存在的。我大吼一声,把他拖出去枪毙!)讲一个故事: 张三刚刚应聘到了一个电子产品公司做测试人员,他没有学过”信号与系统”

2016-01-07 19:45:35 5320 2

原创 Numpy:常用函数

1.写入文件可以使用numpy.savetxt(‘filename’,array)可以把数组写入到文件filename中。使用numpy.loadtxt(‘filename’,delimiter=’,or something’,usecls=sequence,unpack=True/False)读取文件。这两个函数也能对大部分数据存储使用的csv格式文件进行操作。2.使用numpy.average(

2016-01-04 10:10:42 1677

转载 2分钟读懂大数据框架Hadoop和Spark的异同

这里写链接内容 谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是提留在字面上,并没有对它们进行深入的思考,下面不妨跟我一块看下它们究竟有什么异同。解决问题的层面不一样首先,Hadoop和Apache Spark两者都是大数据框架,但是各自存在的目的不尽相同。Hadoop实质上更多是一个分布式数据基础设施: 它将巨大的数据集分派到一个由普通计

2016-01-02 12:49:39 573

原创 Numpy:基础

1.Numpy中的ndarray是一个多维数组对象,其包含了数组中的实际数据和描述该数组的元数据。大部分数组的操作仅仅改变元数据的部分,而不改变实际的数据。>>> #维度元素大小不同的情况 m=numpy.array([numpy.arange(2),numpy.arange(3)]) >>> m array([array([0, 1]), array([0, 1, 2])], dtype=obj

2016-01-02 10:36:55 1467

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除