自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 推荐系统的负采样

负采样1.随机负采样1.1 存在的问题1.2 失效原因1.3 基于其他用户点击的负采样1.随机负采样1.1 存在的问题头部效应非常重。热文被大量分发,个性化能力大幅减弱。站在一个用户的角度看,用户的样本可以通过一些手段做到均衡化。站在一篇文章的角度看,就不是这么回事了,被频繁点击的文章有大量正样本,因为负样本是随机采样,冷文章和热文章被采到的几率相等,那么被频繁点击的文章正样本相对负样本就会多很多,多到均衡化都带不动。1.2 失效原因库中有1000个item,我需要随机负采样5000次,那么理论上

2020-12-27 17:04:00 2193 2

原创 算法基础总结

算法基础总结一级目录二级目录三级目录一级目录二级目录三级目录

2020-11-24 09:47:50 160

原创 leetcode汇总

leetcode汇总迭代栈94. 二叉树的中序遍历队列循环25. K个一组翻转链表(可以再刷。。。)递归迭代栈94. 二叉树的中序遍历class Solution {public: vector<int> inorderTraversal(TreeNode* root) { vector<int> res; TreeNode* tmp=root; stack<TreeNode*> s;

2020-11-20 22:31:37 110

转载 snort规则学习

snort规则学习:https://www.cnblogs.com/zlslch/p/7337011.html一、snort的规则啊,是基于文本的

2019-04-16 12:09:14 322

转载 snort学习

一条简单的规则alert tcp 202.110.8.1 any -> 122.111.90.8 80 (msg:”Web Access”; sid:1)alert:表示如果此条规则被触发则告警tcp:协议类型ip地址:源/目的IP地址any/80:端口号->:方向操作符,还有<>双向。msg:在告警和包日志中打印消息sid:Snort规则id …...

2019-04-12 14:39:42 496 3

原创 shll命令学习(一)

字符串操作1、获取字符串长度:string=“abcd”echo ${#string}#输出:42、提取子字符串string=“alibaba is a great company”echo ${string:1:4}#输出:libaexpr命令1、计算字串长度expr length “this is a test”14...

2019-04-12 11:32:15 316

原创 joy数据向量化处理

joy数据经过解压后,需经过向量化处理才能变为可训练的数据。joy数据主要包括:TLS数据、字符分布、packet具体数据三类,共661维一、TLS数据处理(198)TLS相关数据构成一个数组1、密码套件(cs):原则:构造数组,若命中下列cs值,则在相应位置取‘1’密码套件的可能值有176种:cs = {u’c005’: 0, u’c004’: 1, u’c007’: 2, u’00...

2019-04-06 20:50:57 382

转载 特征选择

一、基于树的特征选择1、随机森林:a.随机森林的构成:由多棵决策树构成,每棵决策树随机选择输入数据、输入特征b.特征重要性的计算方法:b1)对于随机森林中的每一颗决策树,使用相应的OOB(袋外数据)数据来计算它的袋外数据误差,记为errOOB1.b2) 随机地对袋外数据OOB所有样本的特征X加入噪声干扰(就可以随机的改变样本在特征X处的值),再次计算它的袋外数据误差,记为errOOB2....

2019-04-05 16:06:38 183

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除