- 博客(8)
- 收藏
- 关注
原创 hive建表及导入数据
1 新建一个表hive -e "create external table if not exists uid_vid_test(uid string, vid string) row format delimited fields terminated by '\t'"注意后面的\t,表示数据以\t分割 2 从本地导入数据执行hive -e "load data loc...
2014-10-10 18:10:46
180
原创 k近邻算法
k紧邻算法用来进行分类。分类方法为:对每个待分类数据,计算该数据与每个训练数据之间的距离,对数据进行排序后,找出前k个距离最近的训练样例。这k个训练样例所属的分类中,最多的分类即判定为该数据的分类。距离计算可以使用欧氏距离,并且要把所有数据归一化。 可以很容易的看出,该方法有个缺点,就是对每一个查询数据,都要和所有的训练数据对比一遍,效率比较低下。另外,想要...
2014-03-13 20:52:11
83
原创 python及numpy安装
一直想要学习python,之前自己看过一段时间,但是苦于没有项目可以实践,过段时间久忘了。想了解下机器学习,看到有本书,叫做<机器学习实战>,书中算法全部用python实现。这不正好可以拿python练练手吗。1 安装python可以选择安装更新版本的3.x,但是为了在学习中少走弯路,决定使用和书中一样的2.6版本。下载地址为http://www.python.org/...
2014-03-09 11:40:02
312
原创 数据库中的内连接、外连接
这块知识不太牢固,一提起来就有点怵。今天抽空整理下。当做表的关联时,有时我们只需要完全符合条件的记录,这就需要用到内连接。有时需要把其中一个表中的所有记录找出来,这就需要用到外连接。关联方法一般是select * from a (left/right/inner) join b on a.xx = b.xx1 内连接形式为:select * from a (inner) join ...
2014-01-20 16:48:23
247
原创 poj1503
#include#includeint main(){ char s[100],s1[110],s2[110]; int len1,len2,i,j,max,temp,flag; memset(s1,0,sizeof(s1)); memset(s2,0,sizeof(s2)); while(scanf("%s",s)) { if(s[0]==0&&strlen(s)==1) brea
2009-10-29 11:40:00
317
原创 poj3306
耗时可能较大,大家可以用赛选法试试#include#includebool isprime(int n){ int i; if(n==1) return false; for(i=2;i if(n%i==0) return false; return true;}int main(){ int a,d,n,i,j; while(scanf("%d %d %d",&a,&d,&n)) {
2009-10-29 11:38:00
360
原创 poj1083
#includeusing namespace std;struct area{ int left; int right;};bool isin(int x,int left,int right){ x=(x+1)/2; left=(left+1)/2; right=(right+1)/2; if(x>=left&&x return true; return false;}int main()
2009-10-28 23:32:00
334
原创 poj2262
#include#includeusing namespace std;#define max 1000000bool isprime(int n){ for(int i=2;i if(n%i==0) return false; return true;}int main(){ bool a[max]; int i,j,n; bool flag; memset(a,1,sizeof(a)
2009-10-28 23:20:00
356
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人