Datawhale新闻推荐竞赛学习总结:特征工程 特征工程和数据清洗转换是比赛中至关重要的一块, 因为数据和特征决定了机器学习的上限,而算法和模型只是逼近这个上限而已,所以特征工程的好坏往往决定着最后的结果,特征工程可以一步增强数据的表达能力,通过构造新特征,我们可以挖掘出数据的更多信息,使得数据的表达能力进一步放大。
Datawhale新闻推荐竞赛学习总结:多路召回 - 推荐系统读取数据的三种模式- 几种不同的召回策略:基于关联顾泽的itemCF、基于关联规则的userCF、youtubeDNN召回、冷启动召回- 多路召回合并
Datawhale新闻推荐竞赛学习总结:Baseline - 推荐算法:ItemCF,如何计算相似度,如何根据用户历史交互行为推荐- code:读取采样数据,df 内存优化,Python进度条 tqdm库
HTTP协议与HTTPS 协议 - HTTP(HyperText Transfer Protocol:超文本传输协议)被用于在Web浏览器和网站服务器之间传递信息,HTTP协议以明文方式发送内容,不提供任何方式的数据加密。- HTTPS(Hypertext Transfer Protocol Secure:超文本传输安全协议)是一种透过计算机网络进行安全通信的传输协议。HTTPS 经由 HTTP 进行通信,但利用 SSL/TLS 来加密数据包。SSL依靠证书来验证服务器的身份,并为浏览器和服务器之间的通信加密。
Python自然语言处理库 gensim核心概念 gensim 的核心概念包括:- Document:一些文本(text)。- Corpus:文档(documents)的集合。- Vector:文档(documents)的一种数学上方便的表示。- Model::一种将向量(Vector)从一种表示转换为另一种表示的算法。
LeetCode数学问题(Python) - 公倍数与公因数- 质数- 数字处理:Boyer-Moore 投票算法- 随机与取样:Fisher-Yates 洗牌算法,蓄水池抽样算法,用一个随机数生成器生成另一个随机数生成器- 浮点数在计算机中的存储,Python精度控制