自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 Scala(三)之“控制结构”

for和foreach循环 遍历一个集合中的所有元素,对集合中的每个元素进行操作,或者利用现有的集合创建一个新集合。scala> val a = Array("apple", "banana", "orange")a: Array[String] = Array(apple, banana, orange)scala> for(e <- a) println(e)applebananao

2016-08-29 23:15:23 720

原创 Scala(二)之“数值”

Scala中所有的数值都是对象,包括Byte、Char、Double、Float、Int、Long和Shart。与被称为“非数值类型”的Unit和Boolean一样,这些数值类型都继承扩展自AnyVal特质(trait)数据类型的精确范围值得查看:scala> Short.MinValueres45: Short = -32768scala> Short.MaxValueres46: Shor

2016-08-29 09:11:49 4700

原创 Scala(一)之“字符串”

Scala中的String类

2016-08-28 13:22:17 17390 2

原创 Scrapy爬虫(一)

Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。

2016-08-28 10:50:26 646

原创 PDB命令行调试Python程序

* 待续……*

2016-08-25 11:14:29 650

原创 机器学习(二)k-近邻分类算法(kNN)

1、k-近邻算法概述k-近邻算法采用测量不同特征值之间的距离的方法进行分类。优点:精度高、对异常值不敏感、无数据输入假定;缺点:计算复杂度高、空间复杂度高;适用数据范围:数值型和标称型。2、工作原理:     存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样

2016-08-21 19:43:19 1147

原创 Hadoop 3.0学习笔记(持续更新....)

HDFS联盟:为了水平扩展服务,联盟使用多个独立的NamNode。联盟的NameNode是互相独立的,不互相协调。每个DataNode与集群中的所有NameNode注册,DataNode节点周期性发送的心跳和块报告和处理命令的节点。MapReduce NextGen aka YARN aka MRv2:新的功能已经在Hadoop-0.23中介绍过了,划分了JobTracker两个功能:

2016-08-21 17:39:44 868

原创 机器学习(一)

1、什么是机器学习?机器学习 就是把无序的数据转换成有用的信息。2、特征或者属性通常是训练样本集的列,它们是独立测量得到的结果,多个特征联系在一起共同组成一个训练样本3、机器学习的主要任务:分类、回归,分类以及回归属于监督学习。     *无监督学习——聚类4、选择算法:     *使用机器学习算法的目的,想要完成何种任务;          --预测目标变量的值:监督

2016-08-21 17:33:59 581

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除