自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 数据分析[1]_常用数据处理

常用数据处理这里主要介绍包括以下几种类型的数据处理: –数据离散化 –数据数值化 –数据归一化 –相似度计算1. 数据离散化包括两种方法:(1)等频装箱:将数据排序后,分为不同箱子,在每个箱子中数据的个数一样; (2)等宽装箱:将数据排序后,分为不同箱子,在每个箱子中数据最大最小的差值是一样的,即箱子的宽度相同。 由于在数据分析[0]中有对装箱的介绍,这里不在介绍,代码结构大致相同,只是

2018-03-02 17:56:33 605 2

原创 数据分析[0]_常用数据处理

常用数据处理这里主要介绍了包括以下几种类型的数据处理: - 数值型数列均值、方差、分位数的计算 - 噪声数据过滤 - 缺失值补全方法1. 实现数值型数列均值、方差、分位数的计算1.1 均值计算 1、传入数据; 2、然后是构造计算均值的函数; 3、步骤为:(1)传入要计算列的参数;(2)设置变量存储该列数据的总和,以及设置变量存储数据的长度;(3)长度调用len()函...

2018-03-01 16:14:09 1114 2

原创 python学习[4]_利用numpy做一些距离的计算

利用numpy做一些距离的计算1、汉明距离的概念:汉明距离是使用在数据传输差错控制编码里面的,汉明距离是一个概念,它表示两个(相同长度)字对应位不同的数量,我们以d(x,y)表示两个字x,y之间的汉明距离。对两个字符串进行异或运算,并统计结果为1的个数,那么这个数就是汉明距离。2、代码示例:#-*- coding:utf-8 -*-from numpy import *#汉明距离:字符串不同

2017-03-04 22:57:33 1190

原创 python学习[3]_按日期分割数据集

按日期分割数据集-1、 首先我这里的数据集,形式如下图: 这里可以看见第一行为数据的属性,最后一个为时间,格式为.csv文件,我希望按日期(年月日)划分出数据,即按天将数据分割出来。2、由于数据集较大,因次需要导入pandas,利用pandas将csv文件导入到Python中。3、假设导入的变量为d,那么2014年11月18号这天的数据即可以这样截取:d[d[‘time’].str.conta

2017-03-04 22:20:54 10007 3

原创 weka学习[2]_weka简单介绍

weka简单的介绍(一)Explorer标签页: Preprocess,选择和修改要处理的数据。 Classify,训练和测试关于分类或回归的学习方案。 Cluster,从数据中学习聚类。 Associate,从数据中学习关联规则。 Select attributes,选择数据中最相关的属性。 Visualize,查看数据的交互式二维图像。(二)状态栏: 状态(Status

2017-02-07 17:27:20 527

原创 weka学习[1]_Eclipse中读取arff文件

在eclipse中读取arff文件(一)文件读取介绍: 对于字节流,在java中有FileInputStream。 该流用于从文件读取数据 new创建,FileInputStream类是InputStream的子类。 FileInputStream类主要用于从文件系统中的某个文件中获取输入字节。InputStream f = new FileInputStream(“C:/java/hello”

2017-02-06 20:51:25 2398 3

原创 weka学习[0]_文件读取

weka中的文件读取简要介绍weka读取数据文件Weka中需要识别ARFF格式的文件,因此经常需要做简单的数据处理。一般过程这里以uci完备数据集waveform处理过程做简单的介绍: 1.下载完备数据集:waveform.data.z。直接去uci下载就可以,里面有完整的属性介绍,训练集,测试集等等,还有一些有介绍这个数据集的贡献者、来源、大小等等的文档。 2.在waveform.data首行

2017-02-06 20:44:28 965

原创 机器学习[0]_简单理解

机器学习简单理解才开始接触机器学习,有错之处大神请指教!以前一直只是听说机器学习这个话题,在哪个应用领域多么牛逼,多么的厉害咯,说白了,以前就是仅仅听大牛们吹机器学习,心里可能只有这么个名词而已,具体干什么的完全是小白。直到最近开始接触机器学习,从周志华的机器学习开始入门,第一反应就是真的难,特别难,开始看这本书的时候,其实比较抓狂,里面很多公式都不会推导,有时候甚至都开始怀疑人生了。 虽

2017-02-06 20:37:27 635

原创 java学习[2]_数据结构

数据结构简要介绍一些java中的数据结构。 Java工具包提供了强大的数据结构,在Java中的数据结构主要包括以下七种接口和类。java数据结构介绍: 1、Enumeration接口:枚举(The Enumeration)接口定义了一种从数据结构中取回连续元素的方式。其中包括了nextElement()方法:用来得到一个包含多元素的数据结构的下一个元素;hasmoreElements()方法:

2017-02-06 20:34:34 421

原创 java学习[1]_多线程

多线程简要介绍java中多线程相关知识(一)多线程介绍: 随着CPU进入双核、多核时代,多线程的优势越来越明显。多线程是Java中的并发机制,表示能够在同一时间内同时执行多个操作。 这里举个多线程的例子,多线程实际开发例子:在很多网站中,当用户注册后,系统一方面会通知用户已经注册成功,一方面向用户在注册时填写的Email中发送邮件。(二)如何定义线程: 定义线程有两种方法,一种是继承Thr

2017-02-06 20:29:06 369

原创 java学习[0]_文件读写

文件读写简要介绍java文件读写 Java.io 包几乎包含了所有操作输入、输出需要的类。(一)读取控制台输入: (1) 控制台输入由 System.in 完成,把 System.in 包装在一个 BufferedReader 对象中来创建一个字符流;(2) 再使用 read() 方法从控制台读取一个字符,或者用 readLine() 方法读取一个字符串; (3) 需要导入对应的io包,其

2017-02-06 20:19:20 304

原创 python学习[2]_Python中面向对象编程1

1、一个简单的类:# -*- coding:utf-8 -*-#class语句后接类名,缩进语句块形成类体class Person: pass #an empty blockp = Person() #创建一个实类print p输出结果: <main.Person instance at 0x0000000002439308> 告诉我们在main中已经有了person类,内存地

2016-10-30 16:17:32 259

原创 python学习[1]_python中的__name__属性和__doc__属性使用示

python中_name_属性和_doc_属性使用示例1、_name_属性 用于判断当前模块是不是程序入口,如果当前程序正在使用,name的值为main'''display informaiton about a google calendar'''if __name__=='__main__': print __doc__ #print globals()['__doc__

2016-10-27 09:58:37 1350

原创 python学习[0]_安装Python以及Python算法库、IDE

安装Python:1、首先搜索Python官网下载地址,下载与电脑匹配的32/64位;2、双击下载的安装程序,执行安装即可。安装Python算法库:1、在cmd命令中,进入安装目录下scripts 执行 pip install 苦命 库名(小写字母不加后缀)2、算法库的安装顺序为: numpy->scipy->matplotlib->scikit-learn(注:可能直接安

2016-10-24 10:41:14 486

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除