算法
文章平均质量分 50
香山上的麻雀1008
大数据
展开
-
【算法】求n个字符的任意组合
题目 如: 有字符a, b, c, d 求它们的任意种组合: 得到结果: a,b,c,d,ab,ac,ad,bc,bd,cd,bcd,acd,abd,abc,abcd python实现: import math # 分组列 group = ['a', 'b', 'c', 'd'] le = len(group) all_num = int(math.pow(2, le)-1) print('一共有 %d 种分组' % all_num) for i in range(1, all_num+1): t原创 2021-12-10 21:15:29 · 876 阅读 · 0 评论 -
【算法题】给定两个数组a和b,判断a中是否有全局顺序出现的b序列
例如: int[] a = {3, 1, 2, 5, 4, 6, 8, 7, 3, 2, 5, 9, 4}; int[] b = {2, 3, 4}; 因为a中的第3、9、13 个元素分别就是b中的元素顺序,因此判断结果为True int[] a = {3, 1, 2, 5, 4, 6, 8, 7, 3, 2, 5, 9, 4}; int[] b = {1, 9, 3}; 这种情况就为false,因为a中没有全局顺序出现的1, 9, 3序列。 解题思路: public boolean test() {原创 2021-08-01 18:14:17 · 439 阅读 · 0 评论 -
电商推荐系统架构
第1章 项目体系架构设计 1.1 项目系统架构 项目以推荐系统建设领域知名的经过修改过的中文亚马逊电商数据集作为依托,以某电商网站真实业务数据架构为基础,构建了符合教学体系的一体化的电商推荐系统,包含了离线推荐与实时推荐体系,综合利用了协同过滤算法以及基于内容的推荐方法来提供混合推荐。提供了从前端应用、后台服务、算法设计实现、平台部署等多方位的闭环的业务实现。 电商推荐系统架构图 架构图代码,使...转载 2020-01-07 09:04:29 · 2457 阅读 · 1 评论 -
TF-IDF算法详解
最近在做一些NLP的研究,由于也是第一次做这个东西,其实还是发现很多有意思的东西。 相信很多做过NLP的人都应该接触过提取关键词的这个功能。现在有很多可以使用的第三方工具包可以很容易的来实现这个功能,比如snowNLP,jieba等,但是我们还是要做到知其然,知其所以然,所以便有了这一篇文字的记录。 首先我们来了解一下什么是TF-IDF? 其实这个是两个词的组合,可以拆分为TF和ID...转载 2019-03-11 14:22:55 · 1228 阅读 · 1 评论 -
深度解析某头条的一道TopN面试题
首先,某头条的文章量、用户量都是很大的,点击量那就更恐怖了!请问,如果实时展现热门文章,比如近8小时点击量最大的文章前100名。如果是你来开发这个功能,你怎么做?这个好办啊,Redis一个SortedSet搞定啊,Score计数,Key是文章ID,不就OK了么?回答的不错,你可以走了!要听清题目,说好的8小时动态时间窗口,计数是会过期的。还有,头条的量有这么小么,一个Redis就搞定了?同学啊,我...转载 2019-04-28 22:24:22 · 456 阅读 · 0 评论 -
实现用户分层的手段——RFM模型
RFM模型是用于评估客户已有价值和用户潜在价值的一套重要方法,早期的RFM模型出现在营销事件中。 R(Recency) 最近一次消费与上一次消费的时间差,R值越大,说明用户上一次交易的时间越久远,也证实了用户与产品亲密度的下降。 F(Frequency) 消费频率,可以理解为某一时间段内的消费次数,具体的时间段需要依据产品特性而定,F值越大,说明用户活跃度越高,是个正向反馈。 M(Monetary...原创 2019-09-17 18:24:43 · 2315 阅读 · 1 评论