hadoop
文章平均质量分 83
iteye_12877
这个作者很懒,什么都没留下…
展开
-
Hadoop 统计专利被那些专利所引用(一)
一、以下是测试数据: "CITING","CITED" 3858241,956203 3858241,1324234 3858241,3398406 3858241,3557384 3858241,3634889 3858242,1515701 3858242,3319261 3858242,3668705 3858242,3707004 3858243,2949611 ...2013-11-23 13:01:27 · 524 阅读 · 0 评论 -
Hadoop 统计专利被引用次数(二)
一、在(一)中,我们计算出专利被那些专利所引用,在此基础上计算被引用的次数,不难实现。我们用两种方法来完成。代码(1)如下: import java.io.IOException; import org.apache.hadoop.conf.Configured; import org.apache.hadoop.fs.Path; import org.apache.hado...原创 2013-11-23 16:03:45 · 794 阅读 · 0 评论 -
Hadoop 统计不同引用次数的专利数目(三)
一、在(二)的基础之上做修改,代码如下: import java.io.IOException; import org.apache.hadoop.conf.Configured; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoo...2013-11-23 16:14:36 · 236 阅读 · 0 评论 -
Hadoop 自定义数据类型实例
一、来自 hadoop in action 上的实例,我在这里做了一个总结。文件内容如下: 17:16:20 http://blackproof.iteye.com/blog/1806263 17:16:21 http://blackproof.iteye.com/blog/1806264 17:16:56 http://blackproof.iteye.com/blog/1806265 ...2013-11-23 16:21:26 · 161 阅读 · 0 评论 -
hive 操作专利数据笔记
create table cite(citing int,cited int) row format deliminted fields terminated by ',' stored as textfile; load data inpath '/tmp/file1.txt' overwrite into table cite; select * from cite l...2013-12-06 19:18:35 · 105 阅读 · 0 评论