【热搜词方案】android/java热搜词方案设计
热搜词,即用户搜索频率很高的一些关键词
每个app基本上都会有搜索的功能,而热搜词即可表现出app用户最关注的是什么,又能达到引流的效果;对于用户而言,app给出的热搜词就是搜索频率最高的,而对于app的维护方,需要根据业务需求可控地对热搜词进行管理,比如有10条热搜词,其中有2-3条其实是管理员手动指定的(有的可能全部都是指定的),下面给出我在实际开发中运用到的一个热搜词方案。
效果一:
效果二:
:**
需要解决的问题
1、这种热搜效果一般是可控的,即前面几个是由后台管理员根据业务需求来设置的(有的完全有管理员来设置);之后的就是根据搜索的频率来排序(可控问题);
2、关键词相似度问题,比如“搬家”和“我要搬家”,50%的相似度。
设计方案
一、词条加入搜索榜条件:
1、至少两个中文(否则不加入);
2、该词条与现有词条相似度40%以下(否则相似度最高的搜索量+1);
3、第一、二名热搜由管理员设置,其他6条与该两条相似度不超过40%。
二、后台处理流程:
(A)、加入词条的流程:
1、获取用户搜索的词条,判断是否2个字中文以上;
2、判断该词条与数据库中的所有热搜词的相似度;
3、40%以下就将该词条加入数据库;
4、40%以上就将与该词条相似度最高的词条+1;
(B)、管理员设置词条流程:
1、加入前判断该词条与数据库中所有词条的相似度;
2、40%以下,加入数据库,并设置是否为管理员指定为Y;
3、40%以上,将数据库中与改词条相似度最高的作为管理员指定词条;
(C)、返回热搜词条的流程:
1、先获取数据库中由管理员设置的两条作为一、二名;
2、再获取其余按搜索量由高到低排序的6条词条;
3、合并返回;
相似度判断
设计方案出来了,这里最主要的问题就是判断相似度了,下面的一个判断字符串相似度的工具类(工具源自网络,有待优化,这里提供一种思路)即可解决这个问题:
public class StrSimilarityUtils {
private static int compare(String str, String target) {
int d[][]; // 矩阵
int n = str.length();
int m = target.length();
int i; // 遍历str的
int j; // 遍历target的
char ch1; // str的
char ch2; // target的
int temp; // 记录相同字符,在某个矩阵位置值的增量,不是0就是1
if (n == 0) {
return m;
}
if (m == 0) {
return n;
}
d = new int[n + 1][m + 1];
for (i = 0; i <= n; i++) { // 初始化第一列
d[i][0] = i;
}
for (j = 0; j <= m; j++) { // 初始化第一行
d[0][j] = j;
}
for (i = 1; i <= n; i++) { // 遍历str
ch1 = str.charAt(i - 1);
// 去匹配target
for (j = 1; j <= m; j++) {
ch2 = target.charAt(j - 1);
if (ch1 == ch2) {
temp = 0;
} else {
temp = 1;
}
// 左边+1,上边+1, 左上角+temp取最小
d[i][j] = min(d[i - 1][j] + 1, d[i][j - 1] + 1, d[i - 1][j - 1] + temp);
}
}
return d[n][m];
}
private static int min(int one, int two, int three) {
return (one = one < two ? one : two) < three ? one : three;
}
/** * 获取两字符串的相似度 * *@param str *@param target *@return */
public static float getSimilarityRatio(String str, String target) {
return 1 - (float) compare(str, target) / Math.max(str.length(), target.length());
}
}
用法:
String str = "搬家";
String target = "我要搬家";
System.out.println("similarityRatio=" + StrSimilarityUtils.getSimilarityRatio(str, target));
运行结果: