2016年01月_Damen2016

原创 MachineLearning Practice: CART

regTrees.pyfrom numpy import *def loadDataSet(fileName): #general function to parse tab -delimited floats dataMat = [] #assume last column is target value fr = open(fileName

2016-01-31 18:04:02 528

原创 MachineLearning Practice: linear regression

00''' Created on Jan 8, 2011@author: Peter ''' from numpy import *def loadDataSet(fileName): #general function to parse tab -delimited floats numFeat = len(open(fileName).readline().split('\t'

2016-01-31 17:56:32 423

原创 MachineLearning Practice: Adaboost

from numpy import *def loadSimpData(): datMat = matrix([[ 1. , 2.1], [ 2. , 1.1], [ 1.3, 1. ], [ 1. , 1. ], [ 2. , 1. ]]) classLabels = [1.0, 1.0, -1.0, -1.

2016-01-29 10:49:07 636

原创 MachineLearning Practice: decision tree

1.K-NN算法可以完成很多分类任务，但是其中的一个较大的缺点是其无法给出数据的内在含义，决策树能在数据形式上能对数据产生很好的解读。决策树能够挖掘数据中蕴含的信息，因此决策树可以应用于不熟悉的数据集，从中提取一系列的规则，而这个过程也是机器学习的过程。2.构建决策树时，如果该数据集的分类还不是同一类，计算该数据集的信息熵和不同特征条件下的信息熵，选择信息增益(information gain)最大

2016-01-16 20:30:21 430

原创 DataStructures:algorithm analysis

1.算法是解决问题的指令集。单算法给定时，可以计算算法所用的时间或者空间资源。算法分析就是计算算法的时间和空间复杂度，并对算法做出优化，获取对问题更有效的计算方法。2.当T(N)=O(f(N))（念大O），f(N)是T(N)的上界，也就是T(N)在以不快于f(N)的速度增长。f(N)=Ω(T(N))（念omega），则T(N)是f(N)的下界，T(N)=Θ(h(N))(念theta)是T(N)的增长

2016-01-15 14:07:29 429

原创 MachineLearning Practice：K-NN

1.存在一个样本数据集，作为样本数据集，该样本集的每一条数据都存在标签也就是说每条样本集的类别已知。输入一个没有标签的新数据集，将新数据的特征和样本集的数据特征进行比较，然后提取与新数据最相似的样本数据的标签作为新数据的标签。一般来说，选择样本集中前K个出现次数最多的标签作为新数据的标签。2.一般步骤：收集数据（文本/其他程序收集）–>准备数据（归一化，格式化数据，是数据使用于距离计算）–>分析数据

2016-01-11 21:36:34 429

原创 DataStructures:Introduction

public class Test { public static void main(String[] args) { person[] ps = new employee[5]; ps[0]=new student(); System.out.println("ok"); } }class perso

2016-01-11 11:05:01 349

原创 Numpy:使用Matplotlib绘图

2016-01-08 10:15:32 740

转载卷积的意义

原文链接卷积最近总是和卷积打交道,工作需要，每天都要碰到它好几次,不胜烦恼,因为在大学时候学信号与系统的时候就没学会，我于是心想一定要把卷积完全搞明白。正好同办公室的同学也问我什么是卷积,师姐昨天也告诉我说:”我也早就想把这个问题搞明白了！”经过一段时间的思考之后，有一些很有趣的体会和大家分享。听说卷积这种运算式物理学家发明的，在实际中用得不亦乐乎，而数学家却一直没有把运算的意义彻底搞明白。仔细品以

2016-01-07 20:03:44 433

转载大牛讲解信号与系统以及数字信号处理

转载链接第一课什么是卷积卷积有什么用什么是傅利叶变换什么是拉普拉斯变换引子很多朋友和我一样，工科电子类专业，学了一堆信号方面的课，什么都没学懂，背了公式考了试，然后毕业了。先说”卷积有什么用”这个问题。(有人抢答，”卷积”是为了学习”信号与系统”这门课的后续章节而存在的。我大吼一声，把他拖出去枪毙！)讲一个故事: 张三刚刚应聘到了一个电子产品公司做测试人员，他没有学过”信号与系统”

2016-01-07 19:45:35 5320 2

原创 Numpy:常用函数

1.写入文件可以使用numpy.savetxt(‘filename’,array)可以把数组写入到文件filename中。使用numpy.loadtxt(‘filename’,delimiter=’,or something’,usecls=sequence,unpack=True/False)读取文件。这两个函数也能对大部分数据存储使用的csv格式文件进行操作。2.使用numpy.average(

2016-01-04 10:10:42 1677

转载 2分钟读懂大数据框架Hadoop和Spark的异同

这里写链接内容谈到大数据，相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是提留在字面上，并没有对它们进行深入的思考，下面不妨跟我一块看下它们究竟有什么异同。解决问题的层面不一样首先，Hadoop和Apache Spark两者都是大数据框架，但是各自存在的目的不尽相同。Hadoop实质上更多是一个分布式数据基础设施: 它将巨大的数据集分派到一个由普通计

2016-01-02 12:49:39 573

原创 Numpy:基础

1.Numpy中的ndarray是一个多维数组对象，其包含了数组中的实际数据和描述该数组的元数据。大部分数组的操作仅仅改变元数据的部分，而不改变实际的数据。>>> #维度元素大小不同的情况 m=numpy.array([numpy.arange(2),numpy.arange(3)]) >>> m array([array([0, 1]), array([0, 1, 2])], dtype=obj

2016-01-02 10:36:55 1467

honlangwu的博客