自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(204)
  • 资源 (2)
  • 收藏
  • 关注

转载 Hadoop Hive sql语法详解

原文地址:http://blog.csdn.net/hguisu/article/details/7256833Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过

2015-09-30 14:53:11 432

转载 使用Eclipse构建Maven项目 (step-by-step)

原文地址:http://blog.csdn.net/qjyong/article/details/9098213引 题          Maven这个个项目管理和构建自动化工具,越来越多的开发人员使用它来管理项目中的jar包。本文仅对Eclipse中如何安装、配置和使用Maven进行了介绍。完全step by step。如果觉得本文对你有用

2015-09-28 16:22:30 365

转载 linux之进程管理详解

原文地址:http://www.cnblogs.com/skyofbitbit/p/3651749.html |-进程管理        进程常用命令        |- w查看当前系统信息        |- ps进程查看命令        |- kill终止进程        |- 一个存放内存中的特殊目录/proc        |-

2015-09-20 19:46:25 412

原创 usaco shopping offers 解析 and C 语言实现

题意:现在商场正在打折,打折的方式是同时买规定的的物品会比分开买便宜,现在告诉你打折的方式和要买的物品,求最少的钱,有个条件是不可以多买物品。本题是典型的动态规划,对于动态规划问题,关键是找出其最优子结构,然后写出其递归式,然后,填表及可,另外注意各种边界条件。对于本题,递归式可写为: d[a1][a2][a3][a4][a5]=min(d[a1][a2][

2015-09-19 15:55:57 697

转载 集成学习:机器学习兵器谱的“屠龙刀”

转载地址:http://www.csdn.net/article/2015-03-02/2824069编者按:目前机器学习领域诞生的多种算法并不见得都有很好的实战效果。本文作者认为,集成学习是一种立竿见影、从不过时的方法,堪称机器学习兵器谱上排名第一的“屠龙刀”。作者在文章中介绍了集成学习的概念和发展,它有RF和GBDT两大杀器,着重讲解了嫁接法、集成半监督学习等最新进展,以及

2015-09-17 10:10:57 971

转载 推荐!国外程序员整理的机器学习资源大全

转载地址:http://blog.jobbole.com/73806/本文汇编了一些机器学习领域的框架、库以及软件(按编程语言排序)。C++计算机视觉CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口,并支持Windows, Linux, Androi

2015-09-17 10:07:14 1616

转载 机器学习中的数据清洗与特征处理综述

原文地址:http://tech.meituan.com/machinelearning-data-feature-process.html背景随着美团交易规模的逐步增大,积累下来的业务数据和交易数据越来越多,这些数据是美团做为一个团购平台最宝贵的财富。通过对这些数据的分析和挖掘,不仅能给美团业务发展方向提供决策支持,也为业务的迭代指明了方向。目前在美团的团购系统中

2015-09-17 10:05:01 767

原创 python编程:使用opencv按一定间隔截取视频帧

前言关于opencvOpenCV 是 Intel 开源计算机视觉库 (Computer Version) 。它由一系列 C 函数和少量 C++ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。 OpenCV 拥有包括 300 多个 C 函数的跨平台的中、高层 API 。它不依赖于其它的外部库 —— 尽管也可以使用某些外部库。 OpenCV 对非商业应用和商业应用都是免费 的。

2015-09-14 16:04:04 46295 7

翻译 网络安全和机器学习:准确的特征可通向成功

网络安全和机器学习:准确的特征可通向成功 原文地址:http://www.computerworld.com/article/2947617/data-analytics/cybersecurity-and-machine-learning-how-selecting-the-right-features-can-lead-to-success.html译者:张某人ER译者地址:h

2015-09-12 16:57:38 3732

转载 MongoDB基本使用

转载地址:http://www.cnblogs.com/TankMa/archive/2011/06/08/2074947.html成功启动MongoDB后,再打开一个命令行窗口输入mongo,就可以进行数据库的一些操作。输入help可以看到基本操作命令:show dbs:显示数据库列表 show collections:显示当前数据库中的集合(类似关系数据库中

2015-09-10 17:43:19 442

转载 关于C++ const 的全面总结

转载地址:http://blog.csdn.net/Eric_Jo/article/details/4138548   C++中的const关键字的用法非常灵活,而使用const将大大改善程序的健壮性,本人根据各方面查到的资料进行总结如下,期望对朋友们有所帮助。Const 是C++中常用的类型修饰符,常类型是指使用类型修饰符const说明的类型,常类型的变量或对象的值是不能被更

2015-09-07 15:33:19 342

转载 Linux线程-互斥锁pthread_mutex_t

转载地址:http://blog.csdn.net/zmxiangde_88/article/details/7998458在线程实际运行过程中,我们经常需要多个线程保持同步。这时可以用互斥锁来完成任务;互斥锁的使用过程中,主要有pthread_mutex_init,pthread_mutex_destory,pthread_mutex_lock,pthread_mutex_u

2015-09-07 15:26:54 427

原创 USACO Riding the fences and C implement

USACO Riding the fences and C implement

2015-09-05 08:15:15 487

转载 GBDT(MART) 迭代决策树入门教程 | 简介

转载地址:http://blog.csdn.net/w28971023/article/details/8240756在网上看到一篇对从代码层面理解gbdt比较好的文章,转载记录一下:              GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression T

2015-08-31 15:03:01 594

原创 预测的原理及其实战(3)

预测的基本步骤

2015-08-29 14:41:31 837

原创 预测的原理及其实战(2)

决定预测的量,预测的需求,预测周期,预测频率,预测数据。预测方法的选取很大程度上依赖于可用的数据,多种方法的结合。如果没有可用数据,或者可用数据与预测不相关,采用定性预测方法

2015-08-29 14:33:11 1612

原创 python pandas dataframe 去重函数

python pandas dataframe 去重函数

2015-08-27 09:32:15 165678 3

原创 USACO Ski Course Design解析和C语言实现

USACO Ski Course Design解析和C语言实现

2015-08-22 16:17:54 948

原创 统计学方法与数据分析学习笔记1

用于质量改进和再造工程的统计工具、技术和方法有、直方图、数值描述量(均值、标准差、比例等)、散点图、线图(在散点图中用线连接各点)、控制图:(样本均值),r(样本极差),及s(样本标准差)、抽样方案、试验设计。

2015-08-19 15:11:20 4786

原创 时间序列学习笔记

大量时间序列的观测样本都表现出趋势性、季节性和随机性,或者只表现出三者中的其二和其一。

2015-08-18 21:26:45 2941

转载 Scikit Learn: 在python中机器学习

原文地址:http://my.oschina.net/u/175377/blog/84420作者: yyliuScikit Learn: 在python中机器学习载入示例数据一个改变数据集大小的示例:数码数据集(digits datasets)学习和预测分类K最近邻(KNN)分类器训练集和测试集分类支持向量机(SVMs)线性支持向量机使用核聚

2015-08-17 09:52:43 1608

原创 使用excel进行数据挖掘(8)---- 购物篮分析

使用excel进行数据挖掘演示购物篮分析。

2015-08-16 09:15:44 11231

原创 UASCO Wormholes 解析 and C 语言实现

UASCO Wormholes 解析 and C 语言实现

2015-08-15 10:39:11 1217

转载 python的nltk中文使用和学习资料汇总帮你入门提高

原文地址:http://blog.csdn.net/huyoo/article/details/12188573作者:糊糊nltk是一个python工具包, 用来处理和自然语言处理相关的东西. 包括分词(tokenize), 词性标注(POS), 文本分类, 等等现成的工具.1. nltk的安装资料1.1: 黄聪:Python+NLTK自然语言处理学习(一)

2015-08-12 20:49:25 1512

转载 Python+NLTK自然语言处理学习(一):环境搭建

作者:黄聪出处:http://www.cnblogs.com/huangcong/最近开始学习Python+NLTK自然语言处理,在此分享自己的学习经验,因为是初学,肯定有很多很多不懂的地方,发布此文章绝非为了显示自己的水平,而是因为网络上对NLTK的资料实在太少了,我就想分享一下自己的心得,也希望能够得到更多高手的指点,希望高手们发现不对的地方耐心指点,切勿针锋相对,

2015-08-12 20:44:44 1227

原创 sql server 导入平面文件源数据,错误 0xc02020a1错误 0xc020902a 错误 0xc02020c5,返回状态值 4 和状态文本“文本被截断,或者一个或多个字符在目标代码页...

使用sql server 导入平面文件源数据时,报错:错误 0xc02020a1: 错误 0xc020902a: 错误 0xc02020c5;错误 0xc0047022: 返回状态值 4 和状态文本“文本被截断,或者一个或多个字符在目标代码页中没有匹配项。

2015-08-08 10:31:43 28192 1

原创 预测的原理及其实战 (1)

预测的原理及其实战 --- 好的预测,获取历史数据中真正的模式和数据关系,而不是仅仅复制过去发生过的事件。

2015-08-07 08:19:14 1115

原创 使用excel进行数据挖掘(7)---- 从示例填充数据

使用excel进行数据挖掘 ,演示 从示例填充数据 功能

2015-08-06 16:10:24 3789

原创 webQQ 中hash值的计算 python实现 2015年7月

目前,在webqq获取群列表时,需要post一个hash值,计算函数在js中,代码的具体位置详见注释部分。

2015-07-31 15:16:06 1121

转载 Python yield 使用浅析

原文地址:http://blog.csdn.net/preterhuman_peak/article/details/40615201如何生成斐波那契數列斐波那契(Fibonacci)數列是一个非常简单的递归数列,除第一个和第二个数外,任意一个数都可由前两个数相加得到。用计算机程序输出斐波那契數列的前 N 个数是一个非常简单的问题,许多初学者都可以轻易写出如下函数:清单

2015-07-29 19:50:46 405

原创 python 多线程中同步的小例子

例子中有一个共同的资源池,利用多线程获取其中的资源,但要保证数据的同步,即在某一次获取过程中,仅有一个线程可以对资源池进行操作。

2015-07-27 14:40:10 897

原创 使用excel进行数据挖掘(6)---- 预测

使用excel 2007 演示数据预测的功能。

2015-07-24 19:10:20 3121

转载 Cookie/Session机制详解

原文地址:http://blog.csdn.net/fangaoxin/article/details/6952954作者:fangaoxin会话(Session)跟踪是Web程序中常用的技术,用来跟踪用户的整个会话。常用的会话跟踪技术是Cookie与Session。Cookie通过在客户端记录信息确定用户身份,Session通过在服务器端记录信息确定用户身

2015-07-23 15:04:51 584

转载 浅谈CSRF攻击方式

原文地址:http://www.cnblogs.com/hyddd/archive/2009/04/09/1432744.html作者:hyddd一.CSRF是什么?  CSRF(Cross-site request forgery),中文名称:跨站请求伪造,也被称为:one click attack/session riding,缩写为:CSRF/XSRF。

2015-07-22 14:40:30 422

转载 好的软件架构设计

转载源地址:http://blog.csdn.net/gerryzhu/article/details/17379639什么是软件架构前言:软体设计师中有一些技术水平较高、经验较为丰富的人,他们需要承担软件系统的架构设计,也就是需要设计系统的元件如何划分、元件之间如何发生相互作用,以及系统中逻辑的、物理的、系统的重要决定的作出。在很多公司中,架构师不是一个专门的和正式的

2015-07-22 10:01:56 3904

原创 UASCO Combination Lock 解析 and C 语言实现

UASCO Combination Lock 解析 and C 语言实现

2015-07-21 18:45:59 599

转载 小技巧:让linux程序在后台运行

转载源地址:http://www.cnblogs.com/hnrainll/archive/2011/07/04/2097408.html有些时候,我们需要在终端启动一个程序,并使之运行——但是如果关闭终端,那么这个程序也就随着关闭了。那么有没有什么方法在关闭终端后,让已经从这个终端启动的程序继续运行呢?前置知识:xterm,console,tty,pts,pty的区别

2015-07-21 17:29:37 745

转载 Python多线程学习

一、Python中的线程使用:    Python中使用线程有两种方式:函数或者用类来包装线程对象。1、  函数式:调用thread模块中的start_new_thread()函数来产生新线程。如下例: import time  import thread  def timer(no, interval):      cnt = 0      while cnt10:

2015-07-21 09:23:02 464

原创 使用excel进行数据挖掘(5)---- 应用场景分析

使用excel进行数据挖掘(5)---- 应用场景分析

2015-07-18 14:34:20 5689

转载 在 linux 下使用 CMake 构建应用程序

原文地址:http://www.ibm.com/developerworks/cn/linux/l-cn-cmake/作者:    王程明 (wangchengming.jlu@gmail.com), CMake 简介CMake 是一个跨平台的自动化建构系统,它使用一个名为 CMakeLists.txt 的文件来描述构建过程,可以产生标准的构建文件,如 Unix

2015-07-16 16:43:18 536

测试数据集

用于测试的数据集合,配套https://github.com/zhangxinxing/basic_of_datamining

2015-11-15

SQLserver 数据挖掘数据样例 DMAddins_SampleData.xlsx

SQLserver 数据挖掘数据样例 DMAddins_SampleData.xlsx

2015-06-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除