自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Demonwolfe的博客

夹饼豆浆

  • 博客(11)
  • 收藏
  • 关注

原创 win11下永久设置cmd编码为utf-8

cmd 编码永久设置utf-8

2022-10-09 15:40:18 8787 4

转载 Task05 天池新闻推荐入门赛之【排序模型+模型融合】

排序模型通过召回的操作,已经对问题规模进行了缩减,对于每个用户,选择出来N篇文章作为候选集,并基于召回的候选集构建了与用户历史相关的特征,以及用户本身的属性特征,文章本身的属性特征,以及用户与文章之间的特征。接下来就需要对构建好的特征进行学习,然后对测试集进行测试,得到测试集中的每个候选集用户点击的概率,返回点击率最高的topk个文章,最为最终的结果。排序阶段3个代表性模型1.LGB排序模型2.LGB分类模型3.深度学习的分类模型DIN得到最终的排序模型输出的结果以后,选择两种比较经典的集成方法

2020-12-07 22:02:20 310

转载 Task04 天池新闻推荐入门赛之【特征工程】

特征工程1.文章的特征:category_id:文章类型created_at_ts:文章创建的时间 (文章的时效性)words_count:文章的字数2.文章的Embedding特征3.用户的设备特征信息构造特征的关键点:结合用户的历史点击文章信息思路:要预测最后一次点击的文章和最后几次点击的文章有着十分密切的关系,所以做出与最后几次点击相关的特征1)候选item与最后几次点击的相似性特征(embedding 内积)——直接关联用户历史行为2)候选item与最后几次点击的相似性的统计特

2020-12-03 23:31:59 160

原创 Task03 天池新闻推荐入门赛之【多路召回】

多路召回多路召回:采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混在一起供后续排序模型使用导包import pandas as pd import numpy as npfrom tqdm import tqdm from collections import defaultdict import os, math, warnings, math, picklefrom tqdm import tqdmimport faissimport collections

2020-11-30 23:56:53 174

原创 天池新闻推荐入门赛之【数据分析】Task02

天池新闻推荐入门赛之【数据分析】Task02数据分析导包%matplotlib inlineimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsplt.rc('font', family='SimHei', size=13)import os,gc,re,warnings,syswarnings.filterwarnings("ignore")读取数据p

2020-11-27 23:02:15 147

原创 天池新闻推荐入门赛之【赛题理解+Baseline】

天池新闻推荐入门赛之【赛题理解+Baseline】Task01比赛简介新闻推荐场景下的用户行为预测挑战赛,根据用户的历史浏览记录预测用户可能的点击行为数据概况该数据来自某新闻APP平台的用户交互数据,包括30万用户,近300万次点击,共36万多篇不同的新闻文章,同时每篇新闻文章有对应的embedding向量表示。为了保证比赛的公平性,从中抽取20万用户的点击日志数据作为训练集,5万用户的点击日志数据作为测试集A,5万用户的点击日志数据作为测试集B。评价指标user1, article1, art

2020-11-25 23:25:37 143

原创 DataWale_numpy组队学习下-输入和输出

DataWale_numpy组队学习下-输入和输出numpy 二进制文件文本文件#numpy输入输出平常对于数据的输入输出用pandas多一些,这一次接触numpy的输入输出另有收获。numpy 二进制文件numpy可以用于保存为二进制的文件,在平常的工作中,在进行深度学习模型训练的过程中,我有使用过numpy保存相应的中间数据,但是当时只用到了save()。通过本部分的学习了解到了可以使用save(), savez()保存不同的数据。save() , 多用于保存单个数组,保存的格式为.npyi

2020-11-23 21:14:23 166 1

原创 栈的应用_计算器(加,减,乘,除,括号)

最初接触此类的题目,是只涉及到的加减乘除四则运算,没有符号的操作,因为在一次笔试中遇到了有括号的情况,抱着遇到问题一定要去解决的态度,笔试结束后尝试将这道题目进行还原。这里的思想主要是用到了栈,分为两个栈,一个栈存放数字,另外一个栈存放运算符和括号#include <cstdio>#include <stack>using namespace std;cha...

2019-03-31 16:00:27 391

原创 剑指Offer_矩阵中的路径

#include <cstdio>#include <string>#include <stack>using namespace std;int go[][2] = { -1,0, 0,-1, 1, 0, 0, 1};bool hasPathCore(string maze, int x, int y, int rows, int col...

2018-12-03 20:41:02 261

原创 Ubuntu 安装anaconda3并配置tensorflow+jupyter notebook远程访问

Ubuntu 安装anaconda3并配置tensorflow+jupyter notebook远程访问目录一、anaconda3的下载和安装 二、tensorflow环境的搭建 三、jupyter notebook的远程访问配置以及kernel的配置一、anaconda3的下载和安装首先去网站下载anaconda3的安装包,然后上传到服务器端 https://www...

2018-06-01 12:04:03 1285

原创 CentOS 7 连接不到网络解决方法

使用VM12创建虚拟机并安装CentOS 7,但是安装完成后发现连接不到网络。ping jd.com发现不通因为在创建虚拟机的时候我们选择的是NAT模式这里给出NAT模式下对应的的解决方法:一、在vm虚拟机中 按照  编辑-&gt;虚拟网络编辑器然后点击NAT设置,进入下一个界面,并进行网关的设置。更改完成后,进行应用。二、在shell中输入ip addr这里我的是ens33,这个名字将在下一步中...

2018-05-13 14:54:43 36668 25

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除