- 博客(64)
- 资源 (8)
- 收藏
- 关注
转载 mahout+hadoop安装,配置,运行
1.准备工作下载maven2.x配置maven环境变量:export MAVEN_HOME=xxxx export PATH=${MAVEN_HOME}/bin:${PATH}运行mvn -v,检测是否成功下载安装JDK配置JDK环境变量:export JAVA_HOME=xxxxexport CLASSPATH=$JAVA_HOME/lib2.安装mah
2013-10-27 11:01:42
1763
原创 推荐系统架构小结
一、HULU的推荐系统总结:葫芦的推荐系统,至少在他blog中写的比较简单。更多的是对推荐系统在线部分的一种描述,离线部分我猜想也是通过分布式计算或者不同的计算方式将算法产生的数据存储进入一种介质中,供推荐系统在线部分调用。系统的整个流程是这样的,首先获取用户的行为,包括(watch、subscribe、vote),这样行为会到后台获取show-show对应的推荐数据。同时这些
2013-10-13 23:04:54
1059
原创 《数据挖掘概念与技术》读书笔记(五)
九. 离群点检测1. 基本概念离群点:显著不同于其他数据对象的对象。离群点不同于噪声数据,噪声是被观测变量的随机误差或方差。全局离群点:显著偏离数据集的其余部分情境离群点:在特定情境下显著偏离其他对象集体离群点:数据对象的一个自己形成集体离群点 2. 检测方法:监督、半监督、无监督方法1). 监督方法:标记一个数据样本,样本用于训练和检验一个可以识别离群点的分类
2013-08-08 23:39:52
1377
原创 《数据挖掘概念与技术》读书笔记(四)
八. 聚类分析的基本概念和方法1. 聚类分析的典型要求:可伸缩性、处理不同属性类型的能力、发现任意形状的簇、确定输入参数的要求、处理噪声数据、增量聚类、对输入次序不敏感、聚类高维数据、基于约束的聚类、可解释性 2. 基本方法概述划分方法: 在数据集上进行一层划分,包括k-均值划分、k-中心点划分、CLARA(大型应用聚类)。 层次方法: 创建给定
2013-08-08 23:38:58
2293
原创 《数据挖掘概念与技术》读书笔记(三)
六. 分类的基本概念1. 决策树归纳:迭代的二分器,自顶向下递归分治构造决策树属性选择度量(又称分裂规则)的方法:信息增益、增益率、基尼指数、最小描述长度(MDL)1). 信息增益:原信息需求和新的信息需求之差, 它存在倾向于选择具有大量值的属性的偏倚。选择具有最高信息增益的属性作为结点N的分列属性。2). 增益率: 用分裂信息将信息增益规范化,调整信息增益的偏倚,但它倾向于产生不
2013-08-08 23:37:08
2387
原创 《数据挖掘概念与技术》读书笔记(三)
五. 挖掘频繁模式、关联和相关性1. 基本概念 1). 一个典型例子:购物篮分析顾客可能会在一次购物同时购买哪些商品?分析结果可以用于营销计划和商店布局。 2). 规则兴趣度的度量:支持度和置信度支持度:两种商品同时被购买占事务总数的比例,反映发现该规则的有用性置信度:购买一个商品的顾客中同时购买另一个商品的顾客所占比例,反映规则的确定性。 项集:项的集合,如集合{
2013-08-08 23:36:06
3121
原创 《数据挖掘概念与技术》读书笔记(一)
之前看过经典的《数据挖掘导论》,然后又看了韩家炜的《数据挖掘概念与技术》这本数据挖掘入门书籍,对数据挖掘也有了一个初步的了解,特此写篇文章总结一下自己读这两本书后对数据挖掘的认识。 一. 什么是数据挖掘,数据挖掘的知识体系及应用范围1. 定义: 又称数据中的知识发现,从大量的数据中挖掘有趣模式和知识的过程。知识发现的过程: 1). 数据清理: 除噪声和删除不一致数据
2013-08-08 23:34:55
12929
1
转载 自己动手写Django app,第四部分【全剧终】
原文地址:https://docs.djangoproject.com/en/1.4/intro/tutorial04/这个教程是从教程3剩下的地方开始的。我们继续网络调查应用程序并将关注简单的表单处理和精简我们的代码。一、写一个简单的表单让我们从上个教程中更新我们的调查详细模板(“polls/detail.html”),这样模板就包含一个HTML元素:
2013-07-25 19:42:00
761
转载 自己动手写Django app,第三部分【完】
原文地址:https://docs.djangoproject.com/en/1.4/intro/tutorial03/这个教程是从教程2留下的地方开始的。我们继续这个基于网络调查应用程序并且将关注与创建一个公共接口——“view”。一、哲学一个视图是你Django应用程序中(一种特别的功能和一个特别的模板)“一种”网页。比如说,在一个网络博客应用程序中,你可能有下
2013-07-25 19:40:49
1124
转载 自己动手写Django app,第二部分【完】
原文地址:https://docs.djangoproject.com/en/1.4/intro/tutorial02/这个教程从教程一留下的东西开始的。我们继续网络调查应用程序同时我们将会关注Django的自动生成的管理站点。(哲学:为你的员工或者客户生成增加,修改或删除内容的站点是一个枯燥无味的工作,因为这不需要太多的创造性。由于这个原因,Django完全自动为模型创建
2013-07-25 19:39:28
828
转载 自己动手写Django app,第一部分【完】
让我们通过例子来学习。通过这个教程,我们将带领你了解创建基本的调查程序。它将包括两部分:一个让人们可以查看调查和投票的网址;一个可以让你增加,改变和删除调查的管理员网址。假设你已经安装了Django。你可以在python交互式解释器中输入 import django,如果成功,没有错误的话,就说明Django已经安装。一、创建一个项目
2013-07-25 19:38:22
1995
转载 windows下安装apache2.2 + python2.7 + django(mod_wsgi集成)
网上好像没有基于python2.7和django框架的集成于是决定靠google+baidu搞一个出来,毕竟开源是强大的。 对应软件使用版本:Apache:Apache HTTP Server (httpd) 2.2.19Python:Python2.7Django:Django-1.3Mod_wsgi.so:mod_wsgi-win32-ap22
2013-07-23 20:07:08
4671
4
转载 使用django创建项目最终代码
目录树[plain] view plaincopyprint?djproject/ |-- db | `-- tdata.sqlite3 |-- djproject | |-- __init__.py | |-- __init__.pyc | |-- settings.py | |-- settings.pyc | |
2013-07-23 14:57:58
1545
转载 django 简易博客开发 1 安装、创建、配置、admin使用
django 简易博客开发 1 安装、创建、配置、admin使用首先贴一下项目地址吧 https://github.com/goodspeedcheng/sblog到现在位置项目实现的功能有:1、后台管理使用Admin ,前端显示使用bootstrap2、评论使用的系统自带comments 支持ajax3、支持markdown 代码高亮 使用markdown
2013-07-23 14:54:02
915
转载 Django学习笔记
Django学习笔记Django Web编程思路 global setting生成项目project初始化配置settings.py生成应用模块app安装app至projectapp setting编写models.py定义urls.py将app urls加入project urls配置编写views.py编写相应的templaterun s
2013-07-23 12:54:39
1166
转载 介绍Django
强烈建议看原创的文章http://djangobook.py3k.cn/2.0/chapter01/,再次强调这是本人读书笔记,您不一定适合的。第一章:介绍Django本书所讲的是Django:一个可以使Web开发工作愉快并且高效的Web开发框架。 使用Django,使你能够以最小的代价构建和维护高质量的Web应用。MVC 设计模式下面就是通过使用Django来完成
2013-07-23 12:48:47
420
转载 python数据库编程_sqlite
sqlite是一个轻量级的数据库,与很多大型的数据库(例如DB2,Oracle,MSSQL,MYSQL,PostgreSQL)相比,它不需要一个Server Process,因此更相像于其他的小型数据库,例如Access,而且事实上,它的作用很类似于Access,不过由于缺乏商业支持,没有像Access一样提供丰富的界面组件,相信如果需要的话,其实不是很难做的。 前面也用到过sqlite
2013-07-15 20:18:06
460
转载 Apriori算法(c++/c#语言实现)
#pragma once#include "Struct.h"#include#include#include#includeusing namespace std;class Apriori{private: intMin_support;//最小支持度 vector vec_str;//保存从文件中读取的字符串 map
2013-07-09 19:34:25
1451
转载 漫谈数据挖掘从入门到进阶
做数据挖掘也有些年头了,写这篇文一方面是让我写篇文,朋友作为数据挖掘方面的参考,另一方面也是有抛砖引玉之意,希望能够和一些大牛交流,相互促进,让大家见笑了。 ######################################### 更新部分 ######################################### Q&A: Q:学习,最近在看集体智慧编程,楼
2013-07-09 19:21:55
791
转载 如何在Linux使用Eclipse + CDT开发C/C++程序?
如何在Linux使用Eclipse + CDT开发C/C++程序? (转发) 2010-12-20 15:22:24| 分类: linux学习 | 标签:eclipse linux创建 |字号 订阅 A. 为什么要在Linux使用Eclipse开发C/C++程序? Linux是一个以C/C++开发为主的平台,无论是Kernel或是A
2013-06-26 21:22:50
462
转载 C语言文件操作解析(四)
在文件操作中除了打开操作以及读写操作,还有几种比较常见的操作。下面介绍一下这些操作中涉及到的函数。一.移动位置指针的函数 rewind函数和fseek函数,这两个函数的原型是: void rewind(FILE *fp); 将位置指针移动到文件首 int fseek(FILE *fp,long int offset,int origin); 将
2013-06-22 18:37:21
341
转载 C语言文件操作解析(三)
在前面已经讨论了文件打开操作,下面说一下文件的读写操作。文件的读写操作主要有4种,字符读写、字符串读写、块读写以及格式化读写。一.字符读写 字符读写主要使用两个函数fputc和fgetc,两个函数的原型是: int fputc(int ch,FILE *fp);若写入成功则返回写入的字符,否则返回-1 int fgetc(FILE *fp); 若
2013-06-22 18:36:32
341
转载 C语言文件操作解析(二)
C语言中对文件进行操作必须首先打开文件,打开文件主要涉及到fopen函数。fopen函数的原型为 FILE* fopen(const char *path,const char *mode) 其中path为文件路径,mode为打开方式 1)对于文件路径,只需注意若未明确给出绝对路径,则默认该文件在工程的目录下。若需给出绝对路径,则注意转义
2013-06-22 18:35:33
422
转载 C语言文件操作解析(一)
在讨论C语言文件操作之前,先了解一下与文件相关的东西。一.文本文件和二进制文件 文本文件的定义:由若干行字符构成的计算机文件,存在于计算机系统中。文本文件只能存储文件中的有效字符信息,不能存储图像、声音等信息。狭义上的二进制文件则指除开文本文件之外的文件,如图片、DOC文档。 事实上,无论是上面所定义的文本文件还是二进制文件,在计算机中存储都是以二进制的形式存储
2013-06-22 18:34:19
653
转载 CentOS后台任务执行相关命令
fg、bg、jobs、&、nohup、ctrl + z命令一、&加在一个命令的最后,可以把这个命令放到后台执行,如gftp &,二、ctrl + z可以将一个正在前台执行的命令放到后台,并且处于暂停状态,不可执行三、jobs查看当前有多少在后台运行的命令jobs -l选项可显示所有任务的PID,jobs的状态可以是running,
2013-06-22 17:19:16
5604
转载 嵌入式系统的知识体系、学习误区及学习建议
1 嵌入式系统的知识体系 嵌入式系统的应用范围可以粗略分为两大类:电子系统的智能化(工业控制、现代农业、家用电器、汽车电子、测控系统、数据采集等),计算机应用的延伸(MP3、手机、通信、网络、计算机外围设备等)。从这些应用可以看出,要完成一个以MCU为核心的嵌入式系统应用产品设计,需要硬件、软件及行业领域相关知识。硬件主要有MCU的硬件最小系统、输入/输出外围电路、人机接口设计。软件设计
2013-06-22 10:57:58
519
转载 嵌入式开发知识体系
嵌入式开发从下到上分为:嵌入式硬件开发、嵌入式驱动开发、嵌入式系统开发、嵌入式软件开发。一、嵌入式硬件开发:熟悉电路等知识,非常熟悉各种常用元器件,掌握模拟电路和数字电路设计的开发能力。熟练掌握嵌入式硬件知识,熟悉硬件开发模式和设计模式,熟悉ARM32位处理器嵌入式硬件平台开发、并具备产品开发经验。精通常用的硬件设计工具:Protel/PADS(PowerPCB)/Cadence/OrCad。一
2013-06-22 10:50:44
980
转载 计算机常用端口
HTTP:80:www服务。DHCP:服务器端的端口号是67DHCP:客户机端的端口号是68POP3:POP3仅仅是接收协议,POP3客户端使用SMTP向服务器发送邮件。POP3所用的端口号是110。SMTP:端口号是25。SMTP真正关心的不是邮件如何被传送,而只关心邮件是否能顺利到达目的地。SMTP具有健壮的邮件处理特性,这种特性允许邮件依据一定标准自动路由,SMTP具有当邮件
2012-10-26 22:54:11
94
转载 托福听力
1、托福的听力有很多东西你是不用去太在意,主要听的是考点,具体的考点你可以在以下两个网站上找到,一个是太傻,一个是小马过河。 此外,你再注意听力中的连接词,包括转折,因果,描述顺序的词等等,这个你可以通过对听力稿的阅读总结出来。在词汇的重要性上,一般是名词>动词>形容词 在你收集到了考点和关键词后,你就把它们写在一张纸上,听的时候就注意听这些词。当然,你也可以首先看着听力稿听,听的时候同样是关
2012-09-23 23:19:51
85
转载 从不同题型分析托福阅读训练技巧
分享到:2012-09-18 10:33 作者: 来源:互联网 字号:T|T 托福阅读训练中存在着哪些方法和技巧? 我们知道,在托福阅读的考试中存在3种常见的题型,即:单词题目,找代词指代对象题目和考查文章内容的题目。 一、单词题目 平时注意单词量的积累,力求达到可以随时随地记忆单词的境界。其实我们在记忆单词的时候也
2012-09-23 23:16:45
298
转载 ejb开发实例
ejb开发实例1 新建ejb项目 1、Remote(或Local)接口package com.terry.ejbsample;import java.rmi.RemoteException;import javax.ejb.EJBObject;public interface Hello extends EJBObject { pu
2012-09-19 19:14:22
234
转载 在Eclipse下如何安装插件
在Eclipse下如何安装插件 安装Eclipse插件有两种方式,一种是将插件中的plugins和features下的文件直接copy到eclipse的相应文件夹下,另一种是采用link方式,这种方式有两个好处:1. 插件目录可以放在任意位置2. 便于反安装推荐采用第二种方式,此处以tk htmleditor为例,方法如下:1.
2012-09-19 19:12:41
230
转载 使用stringstream对象简化类型转换
使用stringstream对象简化类型转换C++标准库中的提供了比ANSI C的更高级的一些功能,即单纯性、类型安全和可扩展性。在本文中,我将展示怎样使用这些库来实现安全和自动的类型转换。为什么要学习如果你已习惯了风格的转换,也许你首先会问:为什么要花额外的精力来学习基于的类型转换呢?也许对下面一个简单的例子的回顾能够说服你。假设你想用sprintf()函数将一个变量从int类型转换
2012-09-16 23:19:16
558
转载 vector C++ 详细用法
vector是C++标准模板库中的部分内容,它是一个多功能的,能够操作多种数据结构和算法的模板类和函数库。vector之所以被认为是一个容器,是因为它能够像容器一样存放各种类型的对象,简单地说,vector是一个能够存放任意类型的动态数组,能够增加和压缩数据。 为了可以使用vector,必须在你的头文件中包含下面的代码: #include vector属于std命名
2012-09-16 18:44:57
181
转载 auto_ptr
auto_ptrC++的auto_ptr auto_ptr所做的事情,就是动态分配对象以及当对象不再需要时自动执行清理。 1 构造函数与析构函数 auto_ptr在构造时获取对某个对象的所有权(ownership),在析构时释放该对象。我们可以这样使用auto_ptr来提高代码安全性:int* p = new int(0);auto_ptr ap(p);从此
2012-09-16 18:37:00
293
转载 c_str()
c_str()1.string类成员函数c_str()的原型: const char *c_str()const;//返回一个以null终止的c字符串2.c_str()函数返回一个指向正规c字符串的指针,内容和string类的本身对象是一样的,通过string类的c_str()函数能够把string对象转换成c中的字符串的样式; c
2012-09-16 18:25:50
399
转载 #include<cstdlib>的解释
[转载]#include的解释 转载▼是一些常用的函数,但是又不知道把它们放到哪里合适,因此就都放到了stdlib.h这个头文件中。stdlib.h可以提供一些函数与符号常量,具体如下:根据ISO标准,stdlib.h提供以下类型:size_t, wchar_t, div_t, ldiv_t, lldiv_t常量NULL, EXIT_FAILURE, E
2012-09-16 17:34:16
271
转载 关于String类的一些用法实例(一)
关于String类的一些用法实例(一)下面是我根据JDK.API.1.6.0编写的一些关于string的实例,并不完全,以后会不断地更新,希望能给大家带来实质性的帮助。一、charAtpublic char charAt(int index)返回指定索引处的 char 值。索引范围为从 0 到 length() - 1。序列的第一个 char 值位于索引 0 处,第二个位于索引 1
2012-09-14 23:38:00
554
转载 (转)内联函数
(转)内联函数(1)什么是内联函数?内联函数是指那些定义在类体内的成员函数,即该函数的函数体放在类体内。(2)为什么要引入内联函数?当然,引入内联函数的主要目的是:解决程序中函数调用的效率问题。另外,前面我们讲到了宏,里面有这么一个例子:#define ABS(x) ((x)>0? (x):-(x))当++i出现时,宏就会歪曲我们的意思,换句话说就是:宏
2012-09-14 18:33:29
223
转载 指针与引用的区别
指针与引用的区别 指针与引用看上去完全不同(指针用操作符“*”和“->”,引用使用操作符“. ”),但是它们似乎有相同的功能。指针与引用都是让你间接引用其他对象。你如何决定在什么时候使用指针,在什么时候使用引用呢?首先,要认识到在任何情况下都不能使用指向空值的引用。一个引用必须总是指向某些对象。因此如果你使用一个变量并让它指向一个对象,但是该变量在某些时候也可能不指向任何对
2012-09-14 17:29:00
148
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人