自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 java jar包定时运行的脚本编辑步骤

如何让java jar包定时运行1、将java程序打成jar包2、上传jar包   把jar包上传到指定路径A下   使用rz命令上传3、编辑.sh文件 进入到B路径下编辑.sh文件  使用vim指令进行编辑  编辑格式:pathfile="/home/apps/dm_sw"   指定.jar包的路径 这里就是Ajava -jar ${pathfile}/proSalesWar

2016-03-09 14:54:59 1095

原创 java 用log4j输出日志信息

java 用log4j输出日志信息1、首先需要向项目导入log4j和commen-logging的jar包2、配置log4j.xml文件,如果是eclipse环境,则只需放在工程的src下面就可以了配置内容如下:

2015-10-14 18:29:40 616

原创 Eclipse操作hive数据库以及操作HDFS的jar包和环境配置

在eclipse操作hive所需的jar包有:其中必须要的是前三个;eclipse操作HDFS所需的jar包有:另外eclipse操作数据库除了要所需的jar包外,还需有进行HADOOP_HOME,和PATH路径配置。

2015-08-13 18:15:34 727

原创 java 让程序定时运行

java  在执行任务时,让程序定时运行import java.text.SimpleDateFormat;import java.util.Date;import java.util.Timer;import java.util.TimerTask;public class MyTimerTask extends TimerTask{ private Timer timer =

2015-08-11 18:04:24 842

原创 “购买过该商品的用户还浏览了”的商品推荐功能实现

该功能是基于数据库中persona_product,和persona_order表实现的,这两个表分别记录了用户的id以及该用户浏览过的商品,用户的id以及该用户购买过的商品,主要思路如下:package bubugao.com.productRecommendation;import java.sql.ResultSet;import java.sql.SQLException

2015-07-31 15:58:35 4007

原创 “购买过该商品的用户还购买了”的商品推荐功能实现

该功能是基于数据库中persona_order表实现的,该表记录了用户的id以及该用户购买过的商品,主要思路如下:package bubugao.com.productRecommendation;import java.sql.ResultSet;import java.sql.SQLException;import java.util.ArrayList;import j

2015-07-31 15:52:46 4320 2

原创 “浏览过该商品的用户还浏览了”的商品推荐

该功能是基于数据库中persona_product表实现的,该表记录了用户的id以及该用户浏览过的商品,主要思路如下:该功能主要用java实现,源代码如下:package bubugao.com.productRecommendation;import java.sql.ResultSet;import java.sql.SQLException;import java.u

2015-07-31 11:19:21 1048

原创 浏览过该商品的用户最终购买推荐模型实现

这周做了一个“浏览过该商品的用户最终购买”的商品推荐,很多网站上比如京东等都有此功能,先讲一下自己的实现方法:方法是基于数据库中的三个表实现的,这三个表分别是persona_order、persona_browse、以及product_similarity,分别是用户购买的商品(uid_proIds)、用户浏览的商品、以及商品的相似度表。基本思路:根据正在浏览的商品id获取浏览过该商品的用

2015-07-30 15:27:08 1264

转载 短文本合并重复(去重)的简单有效做法

短文本合并重复(去重)的简单有效做法不大合适的SimHash前些日子看了Charikar SimHash的介绍《Simhash算法原理和网页查重应用》,核心思想是用一个f位的hash值来表示文件的特征值,然后使用hash值之间的Hamming距离来衡量相似性。输入的是一个文档的特征集合,输出的是f位的二进制数S。于是用来测试短文本(长度在8个中文字符~45个中文

2015-07-02 16:40:47 894

原创 N-gram语言模型文本分类器

N-gram语言模型文本分类器一  语言模型(Language Model LM)1、定义假设一个字符串w=w1w2….wn; wi可以是一个字,一个词或者一个短语我们把一个可以计算 P(W) 或者P(wn|w1,w2…wn-1) 的模型称为语言模型,Language model,或者写成LM。目的:在给定语料库的情况下,计算一个字符串出现的概率作用:a、机器翻译P(h

2015-02-04 10:29:28 6286 1

原创 用户商品评论自动分类

商品评论自动分类                          实习阶段的任务是对商品评论信息进行自动分类,主要针对的是家用电器商品评论数据,现在实习要结束了,来总结一下实现这一任务的主要流程。一语料库的准备商品评论数据的主要特点:1)评论一般较短,并且语言口语化,没有标准的语法规则,经常出现网络词汇2)评论一般涉及商品的多个属性针对这些特点,我将评论拆分成句子,然

2015-01-30 15:22:14 2231

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除