- 博客(11)
- 资源 (2)
- 收藏
- 关注
原创 初学机器学习的四种方式
学习机器学习有很多方法,大多数人选择从理论开始。 如果你是个程序员,那么你已经掌握了把问题拆分成相应组成部分及设计小项目原型的能力,这些能力能帮助你学习新的技术、类库和方法。这些对任何一个职业程序员来说都是重要的能力,现在它们也能用在初学机器学习上。 要想有效地学习机器学习你必须学习相关理论,但是你可以利用你的兴趣及对知识的渴望,来激励你从实际例子学起,然后再步入对算法的数学理解。 通过本文你
2015-09-29 18:49:36 2530
原创 深入 HBase 架构解析(2)
这是《深入HBase架构解析(1)》的续,不多废话,继续。。。。 HBase读的实现 通过前文的描述,我们知道在HBase写时,相同Cell(RowKey/ColumnFamily/Column相同)并不保证在一起,甚至删除一个Cell也只是写入一个新的Cell,它含有Delete标记,而不一定将一个Cell真正删除了,因而这就引起了一个问题,如何实现读的问题?要解决这个问题,我们先来分析一
2015-09-28 22:40:39 1212
原创 深入 HBase 架构解析(1)
前记公司内部使用的是MapR版本的Hadoop生态系统,因而从MapR的官网看到了这篇文文章:An In-Depth Look at the HBase Architecture,原本想翻译全文,然而如果翻译就需要各种咬文嚼字,太麻烦,因而本文大部分使用了自己的语言,并且加入了其他资源的参考理解以及本人自己读源码时对其的理解,属于半翻译、半原创吧。HBase架构组成HBase采用Master/Sla
2015-09-28 22:23:50 1705
原创 防范sql注入
关于sql注入的危害在这里就不多做介绍了,相信大家也知道其中的厉害关系。 防范sql注入的方法无非有以下几种:1.使用类型安全的SQL参数 2.使用参数化输入存储过程 3.使用参数集合与动态SQL 4.输入滤波 5.过滤LIKE条款的特殊字符Sample:var Shipcity;ShipCity = Request.form ("ShipCity");var sql = "sele
2015-09-28 22:07:09 1499
原创 Java异步事件:轮询与中断
CPU几乎把所有的时间都花费在从内存获取指令并运行它们的过程中。然而,CPU和主存仅仅只是计算机硬件系统中众多组件的其中两个。一个完整的系统还包含其他的设备,比如:硬盘或者固态硬盘,用来存储程序和数据文件的。(注意,主存仅保存少量的信息,并且只有在计算机接通电源的时候才能保存信息。硬盘或者固态硬盘用来永久存储大量的信息。但是在程序真正运行前,程序必须把硬盘或者固态硬盘里的数据加载到主存中。硬盘把数据
2015-09-19 20:06:44 3996
原创 浅谈Weka
Weka系统汇集了最前沿的机器学习算法和数据预处理工具,以便用户能够快速灵活地将已有的据处理方法应用于新的数据集。它为数据挖掘的整个过程提供全面的支持,包括准备输入数据、统计评估学习方案、输入数据和学习效果的可视化.Weka除了提供大量学习算法之外,还提供了适应范围很广的预处理工具,用户通过一个统一界面操作各种组件,比较不同的学习算法,找出能够解决问题的最有效的方法。 Weka系统包括处理标准
2015-09-17 10:55:59 9019
原创 MSSQL 复习笔记 (下)
MSSQL 复习笔记,总结不全,还望指教。 子查询子查询–一个查询中包含另外一个查询。被包含的查询就称为子查询,。包含它的查询就称父查询1.子查询的使用方式:使用()包含子查询2.子查询分类:独立子查询:子查询可以直接独立运行 查询比“王八”年龄大的学员信息 select * from Student where BornDate<(select BornDate from Student w
2015-09-11 15:37:04 1234
原创 MSSQL 复习笔记 (上)
什么是SQL语句sql语言:结构化的查询语言。(Structured Query Language),是关系数据库管理系统的标准语言。它是一种解释语言:写一句执行一句,不需要整体编译执行。语法特点:1.没有“ ”,字符串使用‘ ’包含2.没有逻辑相等,赋值和逻辑相等都是=3.类型不再是最严格的。任何数据都可以包含在‘ ’以内4.没有bool值的概念,但是在视图中可以输入true/false5.它也有
2015-09-11 15:30:37 1368
原创 Java性能优化(13):支持非可变性
一个非可变类是一个简单的类,它的实例不能被修改。每个实例中包含的所有信息都必须在该实例被创建的时候就提出来,并且在对象的整个生存期内固定不变。Java平台库包含许多非可变类,其中有String、原语类型的包装—BigInteger和BigDecimal。非可变类的存在有许多理由:非可变类比可变类更加易于设计、实现和使用。它们不容易出错,更加安全。
2015-09-09 17:07:32 1150
原创 Java性能优化(12):最小化类和成员可访问能力
类和接口是Java程序设计语言的核心,它们也是Java语言的基本抽象单元。Java语言提供了许多强大的基本元素,供程序猿来设计类和接口。 要想区别一个设计良好的模块与一个设计不好的模块,最重要的因素是,这个模块对于外部其他模块而言,是否隐藏了内部的数据和其他的实现细节。一个设计良好的模块会隐藏所有的实现细节,把它的API与实现清晰的隔离开来。然后,模块之间只通过它们的API进行通信,一个模块不
2015-09-08 12:52:52 1356
原创 基于OAtuth2的新浪微博Java爬虫
OAUTH协议为用户资源的授权提供了一个安全的、开放而又简易的标准。与以往的授权方式不同之处是OAUTH的授权不会使第三方触及到用户的帐号信息(如用户名与密码),即第三方无需使用用户的用户名与密码就可以申请获得该用户资源的授权,因此OAUTH是安全的。oAuth是Open Authorization的简写。 其实多数尝试动手写新浪微博爬虫的童鞋都知道,新浪微博虽然为用户提供了API调用的接口。
2015-09-07 10:54:41 10931 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人