- 博客(204)
- 资源 (2)
- 收藏
- 关注
转载 Hadoop Hive sql语法详解
原文地址:http://blog.csdn.net/hguisu/article/details/7256833Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过
2015-09-30 14:53:11 432
转载 使用Eclipse构建Maven项目 (step-by-step)
原文地址:http://blog.csdn.net/qjyong/article/details/9098213引 题 Maven这个个项目管理和构建自动化工具,越来越多的开发人员使用它来管理项目中的jar包。本文仅对Eclipse中如何安装、配置和使用Maven进行了介绍。完全step by step。如果觉得本文对你有用
2015-09-28 16:22:30 365
转载 linux之进程管理详解
原文地址:http://www.cnblogs.com/skyofbitbit/p/3651749.html |-进程管理 进程常用命令 |- w查看当前系统信息 |- ps进程查看命令 |- kill终止进程 |- 一个存放内存中的特殊目录/proc |-
2015-09-20 19:46:25 412
原创 usaco shopping offers 解析 and C 语言实现
题意:现在商场正在打折,打折的方式是同时买规定的的物品会比分开买便宜,现在告诉你打折的方式和要买的物品,求最少的钱,有个条件是不可以多买物品。本题是典型的动态规划,对于动态规划问题,关键是找出其最优子结构,然后写出其递归式,然后,填表及可,另外注意各种边界条件。对于本题,递归式可写为: d[a1][a2][a3][a4][a5]=min(d[a1][a2][
2015-09-19 15:55:57 697
转载 集成学习:机器学习兵器谱的“屠龙刀”
转载地址:http://www.csdn.net/article/2015-03-02/2824069编者按:目前机器学习领域诞生的多种算法并不见得都有很好的实战效果。本文作者认为,集成学习是一种立竿见影、从不过时的方法,堪称机器学习兵器谱上排名第一的“屠龙刀”。作者在文章中介绍了集成学习的概念和发展,它有RF和GBDT两大杀器,着重讲解了嫁接法、集成半监督学习等最新进展,以及
2015-09-17 10:10:57 971
转载 推荐!国外程序员整理的机器学习资源大全
转载地址:http://blog.jobbole.com/73806/本文汇编了一些机器学习领域的框架、库以及软件(按编程语言排序)。C++计算机视觉CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口,并支持Windows, Linux, Androi
2015-09-17 10:07:14 1616
转载 机器学习中的数据清洗与特征处理综述
原文地址:http://tech.meituan.com/machinelearning-data-feature-process.html背景随着美团交易规模的逐步增大,积累下来的业务数据和交易数据越来越多,这些数据是美团做为一个团购平台最宝贵的财富。通过对这些数据的分析和挖掘,不仅能给美团业务发展方向提供决策支持,也为业务的迭代指明了方向。目前在美团的团购系统中
2015-09-17 10:05:01 767
原创 python编程:使用opencv按一定间隔截取视频帧
前言关于opencvOpenCV 是 Intel 开源计算机视觉库 (Computer Version) 。它由一系列 C 函数和少量 C++ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。 OpenCV 拥有包括 300 多个 C 函数的跨平台的中、高层 API 。它不依赖于其它的外部库 —— 尽管也可以使用某些外部库。 OpenCV 对非商业应用和商业应用都是免费 的。
2015-09-14 16:04:04 46295 7
翻译 网络安全和机器学习:准确的特征可通向成功
网络安全和机器学习:准确的特征可通向成功 原文地址:http://www.computerworld.com/article/2947617/data-analytics/cybersecurity-and-machine-learning-how-selecting-the-right-features-can-lead-to-success.html译者:张某人ER译者地址:h
2015-09-12 16:57:38 3732
转载 MongoDB基本使用
转载地址:http://www.cnblogs.com/TankMa/archive/2011/06/08/2074947.html成功启动MongoDB后,再打开一个命令行窗口输入mongo,就可以进行数据库的一些操作。输入help可以看到基本操作命令:show dbs:显示数据库列表 show collections:显示当前数据库中的集合(类似关系数据库中
2015-09-10 17:43:19 442
转载 关于C++ const 的全面总结
转载地址:http://blog.csdn.net/Eric_Jo/article/details/4138548 C++中的const关键字的用法非常灵活,而使用const将大大改善程序的健壮性,本人根据各方面查到的资料进行总结如下,期望对朋友们有所帮助。Const 是C++中常用的类型修饰符,常类型是指使用类型修饰符const说明的类型,常类型的变量或对象的值是不能被更
2015-09-07 15:33:19 342
转载 Linux线程-互斥锁pthread_mutex_t
转载地址:http://blog.csdn.net/zmxiangde_88/article/details/7998458在线程实际运行过程中,我们经常需要多个线程保持同步。这时可以用互斥锁来完成任务;互斥锁的使用过程中,主要有pthread_mutex_init,pthread_mutex_destory,pthread_mutex_lock,pthread_mutex_u
2015-09-07 15:26:54 427
原创 USACO Riding the fences and C implement
USACO Riding the fences and C implement
2015-09-05 08:15:15 487
转载 GBDT(MART) 迭代决策树入门教程 | 简介
转载地址:http://blog.csdn.net/w28971023/article/details/8240756在网上看到一篇对从代码层面理解gbdt比较好的文章,转载记录一下: GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression T
2015-08-31 15:03:01 594
原创 预测的原理及其实战(2)
决定预测的量,预测的需求,预测周期,预测频率,预测数据。预测方法的选取很大程度上依赖于可用的数据,多种方法的结合。如果没有可用数据,或者可用数据与预测不相关,采用定性预测方法
2015-08-29 14:33:11 1612
原创 统计学方法与数据分析学习笔记1
用于质量改进和再造工程的统计工具、技术和方法有、直方图、数值描述量(均值、标准差、比例等)、散点图、线图(在散点图中用线连接各点)、控制图:(样本均值),r(样本极差),及s(样本标准差)、抽样方案、试验设计。
2015-08-19 15:11:20 4786
转载 Scikit Learn: 在python中机器学习
原文地址:http://my.oschina.net/u/175377/blog/84420作者: yyliuScikit Learn: 在python中机器学习载入示例数据一个改变数据集大小的示例:数码数据集(digits datasets)学习和预测分类K最近邻(KNN)分类器训练集和测试集分类支持向量机(SVMs)线性支持向量机使用核聚
2015-08-17 09:52:43 1608
转载 python的nltk中文使用和学习资料汇总帮你入门提高
原文地址:http://blog.csdn.net/huyoo/article/details/12188573作者:糊糊nltk是一个python工具包, 用来处理和自然语言处理相关的东西. 包括分词(tokenize), 词性标注(POS), 文本分类, 等等现成的工具.1. nltk的安装资料1.1: 黄聪:Python+NLTK自然语言处理学习(一)
2015-08-12 20:49:25 1512
转载 Python+NLTK自然语言处理学习(一):环境搭建
作者:黄聪出处:http://www.cnblogs.com/huangcong/最近开始学习Python+NLTK自然语言处理,在此分享自己的学习经验,因为是初学,肯定有很多很多不懂的地方,发布此文章绝非为了显示自己的水平,而是因为网络上对NLTK的资料实在太少了,我就想分享一下自己的心得,也希望能够得到更多高手的指点,希望高手们发现不对的地方耐心指点,切勿针锋相对,
2015-08-12 20:44:44 1227
原创 sql server 导入平面文件源数据,错误 0xc02020a1错误 0xc020902a 错误 0xc02020c5,返回状态值 4 和状态文本“文本被截断,或者一个或多个字符在目标代码页...
使用sql server 导入平面文件源数据时,报错:错误 0xc02020a1: 错误 0xc020902a: 错误 0xc02020c5;错误 0xc0047022: 返回状态值 4 和状态文本“文本被截断,或者一个或多个字符在目标代码页中没有匹配项。
2015-08-08 10:31:43 28192 1
原创 webQQ 中hash值的计算 python实现 2015年7月
目前,在webqq获取群列表时,需要post一个hash值,计算函数在js中,代码的具体位置详见注释部分。
2015-07-31 15:16:06 1121
转载 Python yield 使用浅析
原文地址:http://blog.csdn.net/preterhuman_peak/article/details/40615201如何生成斐波那契數列斐波那契(Fibonacci)數列是一个非常简单的递归数列,除第一个和第二个数外,任意一个数都可由前两个数相加得到。用计算机程序输出斐波那契數列的前 N 个数是一个非常简单的问题,许多初学者都可以轻易写出如下函数:清单
2015-07-29 19:50:46 405
原创 python 多线程中同步的小例子
例子中有一个共同的资源池,利用多线程获取其中的资源,但要保证数据的同步,即在某一次获取过程中,仅有一个线程可以对资源池进行操作。
2015-07-27 14:40:10 897
转载 Cookie/Session机制详解
原文地址:http://blog.csdn.net/fangaoxin/article/details/6952954作者:fangaoxin会话(Session)跟踪是Web程序中常用的技术,用来跟踪用户的整个会话。常用的会话跟踪技术是Cookie与Session。Cookie通过在客户端记录信息确定用户身份,Session通过在服务器端记录信息确定用户身
2015-07-23 15:04:51 584
转载 浅谈CSRF攻击方式
原文地址:http://www.cnblogs.com/hyddd/archive/2009/04/09/1432744.html作者:hyddd一.CSRF是什么? CSRF(Cross-site request forgery),中文名称:跨站请求伪造,也被称为:one click attack/session riding,缩写为:CSRF/XSRF。
2015-07-22 14:40:30 422
转载 好的软件架构设计
转载源地址:http://blog.csdn.net/gerryzhu/article/details/17379639什么是软件架构前言:软体设计师中有一些技术水平较高、经验较为丰富的人,他们需要承担软件系统的架构设计,也就是需要设计系统的元件如何划分、元件之间如何发生相互作用,以及系统中逻辑的、物理的、系统的重要决定的作出。在很多公司中,架构师不是一个专门的和正式的
2015-07-22 10:01:56 3904
原创 UASCO Combination Lock 解析 and C 语言实现
UASCO Combination Lock 解析 and C 语言实现
2015-07-21 18:45:59 599
转载 小技巧:让linux程序在后台运行
转载源地址:http://www.cnblogs.com/hnrainll/archive/2011/07/04/2097408.html有些时候,我们需要在终端启动一个程序,并使之运行——但是如果关闭终端,那么这个程序也就随着关闭了。那么有没有什么方法在关闭终端后,让已经从这个终端启动的程序继续运行呢?前置知识:xterm,console,tty,pts,pty的区别
2015-07-21 17:29:37 745
转载 Python多线程学习
一、Python中的线程使用: Python中使用线程有两种方式:函数或者用类来包装线程对象。1、 函数式:调用thread模块中的start_new_thread()函数来产生新线程。如下例: import time import thread def timer(no, interval): cnt = 0 while cnt10:
2015-07-21 09:23:02 464
转载 在 linux 下使用 CMake 构建应用程序
原文地址:http://www.ibm.com/developerworks/cn/linux/l-cn-cmake/作者: 王程明 (wangchengming.jlu@gmail.com), CMake 简介CMake 是一个跨平台的自动化建构系统,它使用一个名为 CMakeLists.txt 的文件来描述构建过程,可以产生标准的构建文件,如 Unix
2015-07-16 16:43:18 536
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人