自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

困而学之,学思并重

学而不思则罔,思而不学则殆。

  • 博客(9)
  • 资源 (2)
  • 问答 (1)
  • 收藏
  • 关注

原创 【Python那些事儿】准备数据——训练集和测试集

准备工作在把数据用于机器学习的算法之前,必须认真准备数据。提供类别分布一致的训练集和测试集对于成功的分类模型是十分重要的。继续使用iris数据集,把80%的记录归入训练集,剩下的20%作为测试集。操作方法#导入必要的库from sklearn.datasets import load_irisimport numpy as npfrom sklearn.cross_validation imp

2017-06-30 21:12:21 24420 2

原创 【Python那些事儿】主成分分析PCA

主成分分析PCA(Principal Component Analysis):无监督方法保留数据分布PCA通过以下步骤来完成目标:将数据集标准化成为均值为0;找出数据集的相关矩阵和单位标准偏差值;将相关矩阵分解为特征向量和特征值;基于降序的特征值选择Top-N特征向量;投射输入的特征向量矩阵到一个新的子空间。对于一维数据,可用方差来衡量数据的分布或散步情况。在多维的场景里,我们很容

2017-06-30 11:26:54 4530

原创 【Python那些事儿】数据放缩

讨论如何对数据进行放缩:放缩是一种非常重要的数据转换手段;对数据进行放缩之后,能够控制数值的范围;数据集里有很多列的时候,数据较大的列对于其他列更有优势,必须对数据进行放缩以避免这种干扰。操作方法缩放到[0, 1]区间import numpy as npnp.random.seed(10)x = [np.random.randomint(10, 25)*1.0 for i in rang

2017-06-29 21:00:45 6804 2

原创 【Python那些事儿】使用箱线图

在概要统计里,箱线图是一种好用的查看统计信息的工具。高效表达数据的千分位数、异常值点、总体结构;标出水平中位线。指明数据的位置;箱体扩展到四分位范围,用来衡量数据的分布;一系列的虚线从中间的箱体或横或纵伸展,表明数据的尾部分布。操作方法from sklearn.datasets import load_irisimport matplotlib.pyplot as plt#加载数据da

2017-06-29 15:56:12 3794

原创 【Python那些事儿】为多变量数据绘制散点图

准备工作在分析多变量数据时,我们更关注这些变量之间是否存在某些联系。无相关强相关简单关联多元(非简单)关联本实验使用iris数据集。iris数据集有150个实例(3类鸢尾花各50条记录)和4种属性(花萼长度、宽度和花瓣长度、宽度)。操作方法#导入相关库from sklearn.datasets import load_irisimport numpy as npimport matp

2017-06-12 16:46:19 15229

原创 【Python那些事儿】用图表分析单变量数据

准备工作我们采用EDA(探索性数据分析)方式对数据集进行探索,并通过可视化进行展示。这里使用pyplot来绘制图形进行数据可视化,pyplot是matplotlib绘图库的状态机接口。 数据集:1946,411947,231948,161949,281950,201951,111952,191953,141954,391955,321956,1957,141958,195

2017-06-09 21:01:40 1407

原创 Python外观模式

外观模式许多情况下,我么不想把内部复杂性暴露给客户端。外观模式有助于隐藏系统的内部复杂性,并通过一个简化的接口向客户端暴露必要的部分。外观模式跟代理模式有点像,都是在客户端和目标类之间建一个中间的类,客户端不直接调用目标的类,而是通过先调用中间类的方法,由中间类来实现怎么调用目标类。外观模式的目的是通过建立一个中间类,把调用目标类的代码都封装好,例如有时候目标类有很多个,逐一得去调用它们会很麻

2017-06-06 10:53:09 473

原创 Python修饰器模式

无论何时,在对一个对象添加额外功能时,都有以下可选方法:如果合理,直接将功能添加到对象所属的类;使用组合;使用继承。设计模式为我们提供了第四种可选方法,以支持动态地(运行时)扩展一个对象的功能,这种方法就是修饰器(Decorator)。修饰器模式能够以透明的方式(不影响其他对象)动态地将功能添加到一个对象中。在很多编程语言里,使用继承来实现修饰器模式。在Python中,可以使用内置的修饰

2017-06-04 16:54:21 1470

原创 Python适配器模式

适配器模式(Adapter Pattern)通常情况下,原系统的代码要么无法获取——如库等、要么难以冒险重构——如运行5年以上的老旧系统牵一发而动全身。在设计中使用适配器模式,可以保证在不修改原系统代码的前提下,实现新需求与原系统的对接。适配器模式是一种结构型设计模式,实现两个不兼容接口之间的兼容。以保证程序符合开放/封闭原则,保持新老代码间的兼容性。结构型设计模式处理一个系统中不同实体(类和

2017-06-02 20:29:02 1078 1

蓝牙协议的体系结构

主要包括两方面内容: 1、蓝牙技术 介绍蓝牙的起源、实质和蓝牙的技术特。 2、蓝牙协议体系 介绍蓝牙协议、蓝牙协议的体系结构以及核心协议。

2016-05-02

Hadoop2.6.0集群环境搭建

1.linux系统:Ubuntu14.04 2.hadoop版本:hadoop-2.2.0 3.JDK版本:Jdk1.8.0_74

2016-04-28

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除