- 博客(8)
- 收藏
- 关注
原创 推荐系统的负采样
负采样1.随机负采样1.1 存在的问题1.2 失效原因1.3 基于其他用户点击的负采样1.随机负采样1.1 存在的问题头部效应非常重。热文被大量分发,个性化能力大幅减弱。站在一个用户的角度看,用户的样本可以通过一些手段做到均衡化。站在一篇文章的角度看,就不是这么回事了,被频繁点击的文章有大量正样本,因为负样本是随机采样,冷文章和热文章被采到的几率相等,那么被频繁点击的文章正样本相对负样本就会多很多,多到均衡化都带不动。1.2 失效原因库中有1000个item,我需要随机负采样5000次,那么理论上
2020-12-27 17:04:00 2211 2
原创 leetcode汇总
leetcode汇总迭代栈94. 二叉树的中序遍历队列循环25. K个一组翻转链表(可以再刷。。。)递归迭代栈94. 二叉树的中序遍历class Solution {public: vector<int> inorderTraversal(TreeNode* root) { vector<int> res; TreeNode* tmp=root; stack<TreeNode*> s;
2020-11-20 22:31:37 112
转载 snort规则学习
snort规则学习:https://www.cnblogs.com/zlslch/p/7337011.html一、snort的规则啊,是基于文本的
2019-04-16 12:09:14 325
转载 snort学习
一条简单的规则alert tcp 202.110.8.1 any -> 122.111.90.8 80 (msg:”Web Access”; sid:1)alert:表示如果此条规则被触发则告警tcp:协议类型ip地址:源/目的IP地址any/80:端口号->:方向操作符,还有<>双向。msg:在告警和包日志中打印消息sid:Snort规则id …...
2019-04-12 14:39:42 501 3
原创 shll命令学习(一)
字符串操作1、获取字符串长度:string=“abcd”echo ${#string}#输出:42、提取子字符串string=“alibaba is a great company”echo ${string:1:4}#输出:libaexpr命令1、计算字串长度expr length “this is a test”14...
2019-04-12 11:32:15 319
原创 joy数据向量化处理
joy数据经过解压后,需经过向量化处理才能变为可训练的数据。joy数据主要包括:TLS数据、字符分布、packet具体数据三类,共661维一、TLS数据处理(198)TLS相关数据构成一个数组1、密码套件(cs):原则:构造数组,若命中下列cs值,则在相应位置取‘1’密码套件的可能值有176种:cs = {u’c005’: 0, u’c004’: 1, u’c007’: 2, u’00...
2019-04-06 20:50:57 386
转载 特征选择
一、基于树的特征选择1、随机森林:a.随机森林的构成:由多棵决策树构成,每棵决策树随机选择输入数据、输入特征b.特征重要性的计算方法:b1)对于随机森林中的每一颗决策树,使用相应的OOB(袋外数据)数据来计算它的袋外数据误差,记为errOOB1.b2) 随机地对袋外数据OOB所有样本的特征X加入噪声干扰(就可以随机的改变样本在特征X处的值),再次计算它的袋外数据误差,记为errOOB2....
2019-04-05 16:06:38 185
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人