自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(88)
  • 收藏
  • 关注

原创 pandas函数

Pandas nunique() 用于获取唯一值的统计次数。比如获取某一列唯一值的统计次数。pandas.describe函数用来获取dataframe的一些统计信息,比如count、mean、max、min

2022-03-24 13:49:14 2139

原创 LeetCode——回溯

组合三部曲确定函数参数和递归终止条件for循环遍历树的深度和宽度回溯记得pop_back.1. 组合为了简单将两个vector设为全局变量startindex要传入,不然递归时无法往下更新递归过程中伴随回溯,path.pop_back就是在回溯过程中使用的,class Solution {public:vector<vector<int>>res;vector<int>path; void backtracking(int n,int

2022-03-17 10:02:44 630

原创 Leetcode-动态规划

Leetcode-动态规划动态规划5部曲Leetcode题目1.斐波那契数动态规划5部曲确定dp数组以及下标的含义确定递推公式dp数组如何进行初始化,如dp[0]、dp[1],以及边界条件确定遍历顺序举例推导dp数组Leetcode题目1.斐波那契数斐波那契数dp数组代表最后的数列和递推公式dp[n]=dp[n-1]+dp[n-2]初始化dp[0]=0,dp[1]=1,遍历顺序从左向右遍历,for循环从i=2开始声明数组dp长度为n+1大小,最后返回dp[n]注:声明数组

2022-03-14 12:53:04 624

原创 Sparrow项目疑问解答

1.召回层怎么处理,排序层用到了哪些深度学习模型?召回层可以有单策略召回,比如用户对电影A评分超过4分,就将与A电影风格相同且评分在前50以内的电影作为召回层后的候选集,多路召回可以根据不同的策略生成Top K个物品,再将这不同策略生成的Top K个物品组成真正的候选集。本项目采用embedding召回的方法,计算用户embedding和物品embedding之间相似性,embedding将多路召回使用的热门电影、、物品属性等信息添加到embedding向量中。2.Spark工作原理:Stage 内部

2022-03-08 11:14:05 205

原创 c++中||和&&

||或操作将表达式分为两部分,先算前一部分,前一部分为真后面就不算了,前一部分·为假才会算第二部分&&且操作,只有在前一部分为真才会算第二部分,第一部分为假,第二部分也就不会计算。...

2022-03-07 09:35:31 1127 1

原创 SparrowRecSys电影推荐系统项目(四)模型评估

SparrowRecSys电影推荐系统项目(四)模型评估一、模型评估方法:1.离线评估:Holdout检验、交叉检验、自助法离线Replay:一、模型评估方法:1.离线评估:定义:在将模型部署到线上环境之前,在离线环境下进行的评估。Holdout检验、交叉检验、自助法Holdout检验:将样本集随机划分为训练集和测试集,比如将样本集70%作为训练集,30%作为测试集。优点:简单使用。缺点:划分训练集和测试机具有随机性,导致评价结果也具有随机性。交叉检验:将所有样本划分为k个大小相等的样本子集,依

2022-03-03 10:47:45 3096

原创 SparrowRecys——线上服务

SparrowRecys——线上服务一、线上服务主要内容二、本项目选择服务器——Jetty服务器三、存储模块redis一、线上服务主要内容把候选物品和离线处理好的特征载入到服务器将离线模型上线在线进行模型服务(model serving)如何做到负载均衡、缓存、推荐服务降级机制:二、本项目选择服务器——Jetty服务器Jetty服务器public class RecSysServer { //主函数,创建推荐服务器并运行 public static void main(S

2022-02-27 22:12:29 911

原创 斜杠和反斜杠

转载:https://www.cnblogs.com/codingmengmeng/p/6179822.html

2022-02-27 19:55:55 192

原创 Leetcode——螺弦矩阵系列

Leetcode——螺弦矩阵系列一、思想一、思想59. 螺旋矩阵 II54. 螺旋矩阵剑指 Offer 29. 顺时针打印矩阵确定左边界l、右边界r、上边界t、下边界b.顺时针打印矩阵分为4部分:从左到右、从上到下、从右到左、从下到上矩阵有n×n矩阵,也有m×n矩阵while循环条件为true,只有内部有break才会退出循环,当上边界大于下边界,退出循环,右边界大于左边界退出循环螺弦矩阵II代码:初始化二维数组:vector<vector> res(n, vect

2022-02-26 13:20:27 216

原创 Leetcode-滑动窗口法

Leetcode-滑动窗口法一、长度最小的子数组1.暴力法2.滑动窗口法一、长度最小的子数组209. 长度最小的子数组1.暴力法暴力法采用双层for循环,定义变量数组和sum,sum大于等于targe时计算子序列长度sublength,比较sublength和最后返回的result,得到result。初始化result=INT_MAX,这是很多代码比较常见的方式,使用整数最大值和最小值进行初始化。-每一次找到sumlength后要将sum更新一次即初始化为0,重新开始计算。brak

2022-02-24 13:38:49 654

原创 windows下切换盘符

C盘怎么切换到D盘:输入 d:,即可切换盘符

2022-02-23 15:50:27 630

原创 推荐领域的思考

1。用户embedding和物品embedding在什么情况下可以计算相似性?

2022-02-22 21:46:01 167

原创 Leetcode——双指针

Leetcode——双指针一、环形链表一、环形链表首先怎么判断一个链表有环?即使用双指针法slow,fast,将slow和fast先指向链表的起始位置,再将slow每次移动一个位置,fast每次移动两个位置,这样如果链表有环,slow指针和fast指针必定能在环内相遇。注:如果链表只有一个节点和两个节点怎么办?即while循环条件为fast&&fast->next存在。return语句用于结束当前正在执行的函数,因此在while循环中如果slow指针和fast指针相遇即ret

2022-02-22 10:59:53 880

原创 Leetcode-排序

Leetcode-排序一、冒泡排序一、冒泡排序j初始化为倒数第二个,交换依据为nums[j]>nums[j+1]吗,从后面往前排序,最后将最小数字排在第一位,然后i+1,把第二个位置的数确定,依次把所有数位置确定下来。class Solution {public: vector<int> sortArray(vector<int>& nums) { int length=nums.size(); for(int i=0

2022-02-21 20:32:37 562

原创 SparrowRecys——embedding

Embedding向量一、Embedding是什么?二、生成embedding方法一、Embedding是什么?Embedding向量就是用一个数值向量表示一个对象的方法。由于One-Hot向量往往比较稀疏,Embedding向量可以将稀疏高维特征向量转换成稠密低维特征向量,embedding向量可以融合大量有价值信息,表达能力更强。二、生成embedding方法生成embedding方法:word2vec,将词向量生成embedding向量。word2vec模型有两种生成embedding向量方

2022-02-21 15:47:48 675

原创 Leetcode——最大子序和

一、Leetcode——最大子序和最大子数组和本题有3种写法:暴力法、贪心法、动态规划法1. 暴力法暴力法使用双层for循环,寻找最大的result,最后return result超时class Solution {public: int maxSubArray(vector<int>& nums) { int result=INT_MIN; for(int i=0;i<nums.size();i++){

2022-02-21 15:39:32 477

原创 SparrowRecys——推荐模型

推荐经典算法一、协同过滤二、矩阵分解一、协同过滤协同过滤算法就是协同大家的反馈、评价、意见对海量的信息进行过滤,筛选出用户感兴趣的信息。“协同”过滤算法:让用户考虑与自己兴趣相似用户的意见,预测第一步就是找到与用户兴趣相似的Top n 用户,n为超参数,综合top n个用户对物品的评价,得出用户的意见。那么怎么找出相似用户呢即top n用户?计算用户相似度:用户对商品的评价可以看做是一个偏好矩阵,偏好矩阵的每一个行向量可以看做是用户embedding向量。最常用的方法是余弦相似度:夹角与相

2022-02-20 21:36:37 592

原创 机器学习面经

机器学习面经为了准备实习和秋招,准备下面经。题目来源1.介绍双塔模型双塔模型使用于推荐系统的召回层和排序层,模型结构分为两部分:用户塔、item塔。比如user特征经过DNN生成user embedding,item特征经过DNN生成item-embedding,常见操作是对user-embedding和item-embedding自检的相似度,返回最近的Top K 个item.疑问:user和item是在同一空间吗? 在,但目前不知道怎么解释。2.双塔embedding做内积+sigm

2022-02-20 15:57:40 969

原创 Leetcode周赛

Leetcode周赛一、???? 第 281 场力扣周赛一、???? 第 281 场力扣周赛第 281 场力扣周赛6012. 统计各位数字之和为偶数的整数个数第一步:编写一个将数字千分位、百分位、十分位数字相加的函数第二步:使用for循环遍历从1~num的数字,如果数字和为偶数,count++,最后return count.注:c++中/是求商,%是求余,比如数985,商为98,余数为5,依次…class Solution {public: int countEven(int n

2022-02-20 13:20:14 639

原创 Leetcode刷题——二叉树

Leetcode刷题——二叉树一、二叉树基础知识二叉树种类二叉树存储方式二叉树遍历方式二叉树c++定义一、二叉树基础知识二叉树种类满二叉树:如果一棵二叉树只有度为0的结点和度为2的结点,并且度为0的结点在同一层上,则这棵二叉树为满二叉树。完全二叉树:在完全二叉树中,除了最底层节点可能没填满外,其余每层节点数都达到最大值,并且最下面一层的节点都集中在该层最左边的若干位置。若最底层为第 h 层,则该层包含 1~ 2^h -1 个节点。二叉搜索树:只有二叉搜索树有数值。二叉搜索树为有序树。若它的左

2022-01-21 15:44:12 880

原创 Leetcode刷题——栈与队列

Leetcode刷题——栈与队列一、栈与队列定义二、Leetcode题目1.用栈实现队列2.用队列实现栈一、栈与队列定义栈:先进后出,栈提供push 和 pop 等等接口,所有元素必须符合先进后出规则,所以栈不提供走访功能,也不提供迭代器(iterator)。 不像是set 或者map 提供迭代器iterator来遍历所有元素。栈的底层实现可以是vector,deque,list 都是可以的, 主要就是数组和链表的底层实现。队列:先进先出,同样不允许有遍历行为,不提供迭代器, STL中队列一样是以d

2022-01-21 14:12:01 371

原创 Leetcode刷题——字符串

Leetcode刷题——字符串一、Leetcode题目1.反转字符串一、Leetcode题目1.反转字符串和反转链表相似,反转字符串也可以采用双指针法利用库函数swap交换两个指针位置的值。class Solution {public: void reverseString(vector<char>& s) { int left=0; int right=s.size()-1; while(left<=righ

2022-01-19 19:21:58 4753

原创 Leetcode刷题——哈希表

Leetcode刷题——哈希表哈希表使用场景一、Leetcode题目1.有效的字母异位词哈希表使用场景快速判断一个元素是否出现在集合里判断一个元素是否出现过一、Leetcode题目1.有效的字母异位词创建两个unordered_map记录每个字母出现的次数对s中字母进行循环,如果在两个map中字母出现的次数不相等即返回false.class Solution {public: bool isAnagram(string s, string t) { if(s

2022-01-19 16:37:54 720

原创 Leetcode刷题——链表

Leetcode刷题-链表一、链表定义一、Leetcode题目1.移除链表元素一、链表定义c++链表节点定义方式:// 单链表struct ListNode { int val; // 节点上存储的元素 ListNode *next; // 指向下一个节点的指针 ListNode(int x) : val(x), next(NULL) {} // 节点的构造函数};自己定义构造函数初始化节点:ListNode *head=new ListNode(5)使用默

2022-01-14 16:07:42 393

原创 Leetcode刷题——数组

Leetcode刷题——二分查找一、二分查找使用条件二、二分法写法三、Leetcode题目:二分查找一、二分查找使用条件1.数组为有序数组(无序数组可以sort变为有序数组)2.数组中无重复元素注意事项:区间定义要遵循不变量的原则,区间定义有左闭右闭[left,right]或者左闭右开[left,right)二、二分法写法我习惯使用左闭右闭的写法定义target在左闭右闭的区间里即[left,right],whiile(left<=right),因为left可以等于right,即l

2022-01-14 12:47:47 355

原创 ImportError: cannot import name ‘OneHotEncoderEstimator‘

from pyspark.ml.feature import OneHotEncoderEstimator报错:ImportError: cannot import name ‘OneHotEncoderEstimator’解决方法,去pyspark.ml.feature查看是否有OneHotEncoderEstimator,查看结果:解决方案:from pyspark.ml.feature import OneHotEncoder...

2022-01-10 15:16:20 848

原创 SparrowRecSys电影推荐系统项目(二)特征工程

SparrowRecSys电影推荐系统项目(二)特征工程前言一、特征工程是什么?二、推荐系统常用特征1.用户行为数据2.用户关系数据3.属性、标签类数据4.内容类数据5.场景信息(上下文信息)总结前言推荐系统中用户信息、物品信息、场景信息非常庞杂,如何在冗余的数据中提取到对最终的推荐效果起到决定作用的信息是算法工程师需要去考虑的,这也就是特征工程的魅力。一、特征工程是什么?特征定义:特征是对某个行为过程相关信息的抽象表达。信息必须得表达为数学形式才可以输入到机器学习模型中。电影推荐系统常见的影响因

2022-01-09 14:12:53 1097

原创 SparrowRecSys电影推荐系统项目(一)

SparrowRecSys电影推荐系统项目(一)前言一、SparrowSystems总体架构图二、数据部分2.模型部分总结前言SparrowrecSys推荐系统是王喆老师非常好的一个项目实战,我打算把这个项目弄懂并深入挖掘自己喜欢的领域。一、SparrowSystems总体架构图这个架构图逻辑清晰,将整个推荐系统分为3部分:数据部分、模型部分、前端部分。二、数据部分推荐系统数据部分主要负责的是用户、物品、场景信息的收集,根据处理数据量和实时性不同,按照实时性强弱进行排序,主要有三种数据处理方式

2022-01-08 12:15:07 1998

原创 谈谈我对矩阵维度的理解

谈谈我对矩阵维度的理解前言一、混淆点二、代码实现1.矩阵相乘总结前言在机器学习中,遇到的数据都是以矩阵形式存储的,那么矩阵的维度经常在变化,在编写代码应该时刻注意矩阵的维度变化,不然在参数和矩阵进行相乘时会报错。一、混淆点在机器学习领域经常会说将特征向量由低维空间映射到高维空间。比如平面就是二维空间,立体就是三维空间,超过三维空间我们就不知道怎样表示。特征向量feature=[1,2,3,4],feature有4个特征,假设特征空间由这4个特征可以表示,那么给出这4个特征独一无二的数字即可在特征空

2022-01-02 14:27:53 3963

原创 机器学习算法-逻辑回归实现

机器学习算法-逻辑回归实现一、逻辑回归算法初步理解二、代码实现1.数据集处理2.创建model总结一、逻辑回归算法初步理解逻辑回归不是解决回归任务,是为了解决分类任务。通过wx>0和wx<0可以直接判断出样本类别。二、代码实现1.数据集处理from math import expimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.datasets import loa

2022-01-01 21:51:08 1065

原创 python中字典

对字典取键key或者取值value注意事项:代码:d={'a':0,'b':1,'c':2,'d':3}print(d.keys())print(d.values())print(len(d))输出:dict_keys(['a', 'b', 'c', 'd'])dict_values([0, 1, 2, 3])4使用方法.keys得到的是一个列表包括所有的key,使用方法.values得到的也是一个列表包括所有的values,len方法得到的是字典的长度。总结:返回的是一个列表,

2021-12-31 11:14:12 501

原创 机器学习算法-KNN代码实现

机器学习算法-KNN代码实现一、KNN算法初步理解二、代码实现1.数据集处理2.创建model3.可视化总结一、KNN算法初步理解统计学习方法书上的解释:给定一个训练数据集,对于新的输入实例,在训练数据集中找到与该实例最邻近的k个实例,这k个实例的多数属于某个类,就把该输入实例分为这个类。二、代码实现1.数据集处理数据集是使用的是鸢尾花数据集,在代码中直接从sklearn中导入即可。要对数据集进行处理,必须得先知道数据集的特点,鸢尾花共有150个样本,类别数为3.0~50个样本label=0,

2021-12-30 20:55:47 7404 2

原创 机器学习算法-感知机代码实现

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、感知机算法初步理解二、代码实现1.数据集处理2.创建model3.可视化结果总结前言为了更深入的理解机器学习算法,最近阅读统计学习方法,打算把书上代码复现一遍,顺便把python语法、numpy、pandas、matplotlib巩固下。一、感知机算法初步理解感知机本质是二分类任务,如果数据集中有正样本和负样本,那么只需要拟合出一个超平面把正样本和负样本分隔开。二、代码实现1.数据集处理数据集是使用的是鸢尾.

2021-12-30 15:26:04 2075 1

原创 python中len方法

思考:对于numpy中的array如果是多维的,想统计元素数目len(x)和len(x[0])有区别吗代码:import numpy as npx=np.array([[1,2,3], [4,5,6], [7,8,9]])print("len(x):",len(x))print("len(x[0]:",len(x[0]))out:len(x): 3len(x[0]: 3总结:python中应该默认了求样本数目使用len(x)即可,不用特别

2021-12-30 14:51:56 1983

原创 word中页面上下出现横线无法删除

写论文时页面上下分别有两条黑线,删除不掉,仔细分析原因后发现是在画表格时一不小心选中页面边框。上下黑线:在这里插入图片描述解决方案:开始>>边框和底纹>>页面边框>>选择无...

2021-06-29 12:45:42 4217

原创 LInux下解压文件命令

1.解压后缀为.zip文件unzip a.zip2.解压后缀为.rar文件并且会在当前解压目录内创建以压缩包为名的目录unrar x a.rar

2021-06-26 18:46:35 110

原创 VOT2018json文件修改

在使用pysot对算法在数据集上进行评估性能,需要将VOT2018json文件进行修改:数据集文件夹图片存放形式:VOT2018.json文件格式:

2021-06-17 16:56:03 723 8

原创 pytorch先建立列表再转化为ModuleList

在代码中我们经常看到先将网络结构添加到列表中,再转化为ModuleList类型代码示例:import torchimport torch.nn as nn#建立列表convs=[]l=nn.Conv2d(3,3,kernel_size=1)convs.append(l)#转化为ModuleList类型module=nn.ModuleList(convs)print(list(module.modules()))输出:[ModuleList( (0): Conv2d(3, 3,

2021-05-23 14:35:01 805

原创 math.floor用法

math.floor:取数字的近似值代码示例:import mathprint('-3.88的近似值',math.floor(-3.88))print('3.88的近似值:',math.floor(3.88))输出:-3.88的近似值 -43.88的近似值: 3

2021-05-23 14:16:37 9176

原创 python中items函数

items:函数以列表返回可遍历的(键, 值) 元组数组常与for循环搭配代码示例:a={'a':1,'b':2,'c':3}print(a.items())for key,value in a.items(): print("key:",key) print('value;',value)输出:dict_items([('a', 1), ('b', 2), ('c', 3)])key: avalue; 1key: bvalue; 2key: cvalue; 3

2021-05-22 17:08:25 16215 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除