自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(39)
  • 收藏
  • 关注

原创 推荐系统之评估体系

1、预测准确度这是最最关键的指标,推荐系统推荐物品干嘛,就是希望推荐出来的物品能让用户满意。一般用点击率,用户停留时间等指标来度量。但是,用户满意度没有办法离线计算,只能通过用户调查或者在线实验获得。2、预测准确度预测准确度可以用评分预测和TopN表示(1)评分预测评分预测的预测准确度一般通过均方根误差(RMSE)和平均绝对误差(MAE)计算。对于测试集中一个用户u 和 物品 i,令 rui 是用户u对i 的实际评分,而^rui 是推荐算法给出的预测评分。那么 RMSE 的定义

2020-10-30 16:18:56 808 1

原创 推荐模型之LFM

一、概念该方法是先对所有的物品进行分类,再根据用户的兴趣分类给用户推荐该分类中的物品。而协同过滤是:(1)UserCF,先计算和目标用户兴趣相似的用户,再根据计算出来的用户喜欢的物品给目标用户推荐物品。(2)ItemCF,根据目标用户喜欢的物品,寻找和这些物品相似的物品,再推荐给用户。因此 LFM关键问题在于:(1)给物品分类(2)确定用户兴趣属于哪些类及感兴趣程度(3)对于用户感兴趣的类,如何推荐物品给用户二、算法原理隐语义模型,可以基于用户的行为自动进行聚类,并且这个类的数量,即粒度

2020-10-29 17:05:19 474

原创 bilibili面经

一面:1 自我介绍2 介绍最熟悉的项目(场景,怎么做的,具体细节)3 说最熟悉的模型(lr:从原理,到公式推到,到模型参数优化)4讲xgboost/gbdt/rf区别与特点5.算法题:二叉树一个后序遍历非递归版本;一个水槽蓄水的题,最大二面:1.讲xgboost/gbdt区别2.深度学习有了解吗3介绍美团实习4介绍爱奇艺实习(GMM)5(0,1)*...

2019-09-19 16:20:38 1490

原创 腾讯提前批一面复盘

信息流推荐相关,做策略算法,短视频推荐中心自我介绍(参加面试准备【面向简历】) spark相关看我简历上写了会spark,spark是基本应用工具,让我讲下spark的基本工作流程,基本架构,阐述一下(https://www.cnblogs.com/BYRans/p/5889374.html)(https://www.cnblogs.com/openAI/p/8481646.html)(...

2019-08-26 10:18:30 231

原创 百度策略算法一面面经

一.自我介绍1.我大概说了专业学校,自己的实习经历(爱奇艺和平安科技),以及比赛经历2.针对我的实习经历问了我关于知识图谱项目的问题,后来才知道团队是关于nlp方向的二.问一些机器学习基础知识问题1似然概率和条件概率区别2偏差和方差区别3L1和L2区别三.coding三道1.(1+((2+3)*(4*5))) 提醒用栈和队列 这题没做出来其实,想问牛油们有知道怎么做的吗?(希望能...

2019-06-14 16:03:23 1038

原创 面试常见那些事儿

1.训练决策树时的参数是什么? 参数说明https://blog.csdn.net/qq_38923076/article/details/829313402.在决策树的节点处分割的标准是什么? https://blog.csdn.net/zjm2017/article/details/861841713.基尼系数的公式是什么? 决策树https://b...

2019-05-20 22:05:02 190

原创 【复习】剑指offer(11-20)

11二进制中1的个数输入一个整数,输出该数二进制表示中1的个数。其中负数用补码表示。# -*- coding:utf-8 -*-import sysclass Solution: def NumberOf1(self, n): # write code here count=0 n=int(n) if n...

2019-05-20 16:12:14 148

原创 【复习】剑指offer (1-10)

01二维数组中的查找在一个二维数组中(每个一维数组的长度相同),每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。# -*- coding:utf-8 -*-class Solution: # array 二维列表 def Find(self, target, ar...

2019-05-20 15:34:44 98

原创 leetcode 练习(三)

字符串https://leetcode.com/problems/longest-palindrome/description/class Solution(object): def longestPalindrome(self, s): """ :type s: str :rtype: int """ ...

2019-05-19 14:27:34 110

原创 leetcode 练习(二)

leetcode 69 二分https://leetcode.com/problems/sqrtx/description/class Solution(object): def mySqrt(self, x): if x==1 or x==0: return x else: left=0 ...

2019-05-16 22:15:36 101

原创 机器学习实战专题(四)Naive Bayes

使用朴素贝叶斯过滤垃圾邮件 说明: 将 `email` 文件夹放在当前目录下。 1.词集模型## 1 词集模型import numpy as npimport pandas as pdimport re# 1.1文件解析及完整的垃圾邮件测试def textParse(text): listofTokens=re.split(r'\w...

2019-05-16 16:16:54 224

原创 leetcode 练习(一)

leetcode 455 贪心https://leetcode.com/problems/assign-cookies/简单的循环判断class Solution(object): def findContentChildren(self, g, s): """ :type g: List[int] :type s: List...

2019-05-15 21:12:37 112

原创 机器学习实战专题 (二)续 Decision Tree

Gini Index基尼系数代表了模型的纯度,基尼系数越小,则纯度越高,特征越好。具体的,在分类问题中,假设有K个类别,第k个类别的概率为, 则基尼系数的表达式为:1.1代码实现 def gini(y): counter = Counter(y) res = 1.0 for num in counter.values(): p = n...

2019-05-15 11:35:40 125

原创 机器学习实战专题(三)LogisticRegression

1.理论快速回顾1.1 模型当y>0.5时,z为TRUE,else 为False模型输出时,根据以上:1--TRUE,0--FALSE1.2 损失函数1.3 优化:梯度下降法求导:向量化2.实战2.1 实现逻辑回归类​import numpy as npfrom sklearn.metrics import accu...

2019-05-15 10:42:38 291

原创 机器学习实战专题二(Decision Tree)

决策树说明: 将数据集文件 ‘lenses.txt’ 放在当前文件夹from math import log2from collections import Counterimport numpy as np1.1 构建决策树1.1.1信息增益def ent(dataset): dataset=np.array(dataset) ...

2019-05-12 20:30:23 196

原创 O2O优惠券复盘(二)

回顾:接O2O优惠券预测复盘(一),对模型进行优化https://blog.csdn.net/weixin_38966454/article/details/90057156优化模型优化模型主要体现在以下几个方面:特征工程 机器学习算法 模型集成本文将尝试采取机器学习算法-----决策树模型进行优化建立决策树模型使用上面的14个特征 训练集:20160...

2019-05-12 20:24:43 459

原创 动态规划专题

LeetCode 70https://leetcode.com/problems/climbing-stairs/算法思路:设置递推数组dp[0…n],dp[i]代表到达第i阶,有?走法,初始化数组为0 设置到达第1阶,有1种走法,到达第2阶有2种走法 利用i循环递推从第三阶到第n阶结果:dp[0]=0dp[1]=1dp[2]=2dp[3]=dp[1]+dp[2]...

2019-05-12 20:15:07 140

原创 O2O优惠券预测复盘(一)

天池o2o优惠券比赛初级版本:使用线性回归模型,后期会持续优化导入相关库import os,sys,pickleimport numpy as npimport pandas as pdfrom datetime import datefrom sklearn.model_selection import KFold,train_test_split,StratifiedKFold...

2019-05-10 14:07:08 837

原创 机器学习面试总结(一)

小米机器学习校招(2018年)一面:讲项目特征选择的常用方法https://blog.csdn.net/SecondLieutenant/article/details/80693765bagging和boosting的区别https://www.cnblogs.com/earendil/p/8872001.html手推逻辑回归https://blog.csdn.net/u0144...

2019-05-09 17:05:48 783

原创 排序算法(Python实现)

一、冒泡排序思想:对相邻元素进行两两比较,顺序相反则交换,每一趟将min/max浮到顶端,最终完全有序def bubble__sort(list): n=len(list) count=0 for j in range(n-1): for i in range(n-1-j): if list[i]>list[i+1]: lsit[i],list[i+1]=list...

2019-05-08 16:51:06 161

原创 机器学习实战专题(一)KNN

KNN算法一、使用 k 近邻算法改进网站的配对效果数据上传百度网盘 https://pan.baidu.com/s/1Jj2WwyD25yhgAaVJw5KSgg 提取码:eihp环境:python3 (jupyter)#导入库import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplot...

2019-05-07 16:41:26 311

原创 leetcode每日一练

Minimum Path Sum(最小路径和)英文版:https://leetcode.com/problems/minimum-path-sum/中文版:https://leetcode-cn.com/problems/minimum-path-sum/Coin Change (零钱兑换)英文版:https://leetcode.com/problems/coin-change...

2019-04-28 19:36:31 556

原创 leetcode每日一练

编程任务7(finally)几种算法思想递归(保留往期第五天任务)通过LeetCode上【70. 爬楼梯】回溯利用回溯算法求解八皇后问题利用回溯算法求解 0-1 背包问题分治利用分治算法求一组数据的逆序对个数动态规划0-1 背包问题最小路径和(详细可看 Minimum Path Sum)编程实现莱文斯坦最短编辑距离编程实现查找两个字符串的最长公共子序列编程实现一个数据序...

2019-04-26 19:43:26 183

原创 leetcode每日一练

DataWhale 编程第6期任务六图实现有向图、无向图、有权图、无权图的邻接矩阵和邻接表表示方法实现图的深度优先搜索、广度优先搜索实现 Dijkstra 算法、A* 算法实现拓扑排序的 Kahn 算法、DFS 算法对应的 LeetCode 练习题Number of Islands(岛屿的个数)英文版:https://leetcode.com/problems/number-of-...

2019-04-22 18:27:00 264 2

原创 leetcode每日一练

DataWhale 编程第6期任务五二叉树实现一个二叉查找树,并且支持插入、删除、查找操作实现查找二叉查找树中某个节点的后继、前驱节点实现二叉树前、中、后序以及按层遍历并完成leetcode上的验证 二叉搜索树(98)及二叉树 层次遍历(102,107)!(选做)(保留往期第四天任务)注:这个跟下面的习题有重复堆实现一个小顶堆、大顶堆、优先级队列实现堆排序利用优先级队列合并 ...

2019-04-19 15:03:39 248 2

原创 leetcode每日一练

DataWhale编程任务四散列表(哈希表)实现一个基于链表法解决冲突问题的散列表# keys函数#!/usr/bin/env python# coding=utf-8 class Dict: def __init__(self, num): self.__solts__ = [] self.num = num for _ in...

2019-04-16 19:22:18 101

原创 leetcode每日一练

DATAWhale 第三个任务(2天)排序实现归并排序、快速排序、插入排序、冒泡排序、选择排序、堆排序(选做)#插入排序def insert_sort(arr): length=len(arr) for i in range(length): k=i for j in range(k,0,-1): if arr[j] < arr[j-1]: arr[j],a...

2019-04-14 21:59:28 200

原创 leetcode 每日一练

DATAwhale编程第六期任务二数组实现一个支持动态扩容的数组实现一个大小固定的有序数组,支持动态增删改操作实现两个有序数组合并为一个有序数组学习哈希表思想,并完成leetcode上的两数之和(1)及Happy Number(202)!(要求全部用哈希思想实现!)字符串实现一个字符集,只包含 a~z 这 26 个英文字母的 Trie 树实现朴素的字符串匹配算法对应的 Leet...

2019-04-11 16:12:08 245

原创 达观杯”文本智能处理挑战赛

回顾任务1-----对数据进行初步的预处理:https://blog.csdn.net/weixin_38966454/article/details/89046445任务2----F-IDF算法实现https://blog.csdn.net/weixin_38966454/article/details/89058683Now任务3—word2vec算法实现1.什么是word2ve...

2019-04-10 17:02:43 214

原创 leetcode每日一练

DATAwhale编程第六期任务一一、任务说明:1、栈用数组实现一个顺序栈用链表实现一个链式栈编程模拟实现一个浏览器的前进、后退功能2、队列用数组实现一个顺序队列用链表实现一个链式队列实现一个循环队列3、链表实现单链表、循环链表、双向链表,支持增删操作实现单链表反转实现两个有序的链表合并为一个有序链表实现求链表的中间结点二、对应的 LeetCode 练习题一、栈1...

2019-04-08 11:19:38 142

原创 达观杯”文本智能处理挑战赛

回顾昨天已对数据进行初步的预处理,接昨天的任务1:https://blog.csdn.net/weixin_38966454/article/details/89046445**第二天 TF-IDF算法实现*一.什么是TF-IDF TF-IDF(Term Frequency-Inverse DocumentFrequency, 词频-逆文件频率),一种用于资讯检索和资讯探勘的常用...

2019-04-06 19:04:07 161

原创 leetcode每日一练

leetcode226. Invert Binary Tree题目描述:解题思路:1.如果非空且根节点存在,则根节点不变,左右子树交换位置2.否则返回根节点python实现:# class TreeNode(object):# def __init__(self, x):# self.val = x# self.left = None#...

2019-04-06 17:28:12 122

原创 达观杯”文本智能处理挑战赛

竞赛信息1.网址http://www.dcjingsai.com/common/cmpt/“达观杯”文本智能处理挑战赛_竞赛信息.html2.任务建立模型通过长文本数据正文(article),预测文本对应的类别(class)3.数据数据包含2个csv文件:train_set.csv:此数据集用于训练模型,每一行对应一篇文章。文章分别在“字”和“词”的级别上做了脱敏处理。共有四列:第...

2019-04-05 18:56:02 435

原创 leetcode每日一练

栈题目源于leetcode20.Valid Parentheses(有效的括号)题目描述:由于只包含字符的字符串’(’,’)’,’{’,’}’,’[‘和’]’,确定输入字符串是有效的。如果输入字符串有效:1.必须使用相同类型的括号关闭左括号。2.必须以正确的顺序关闭打开括号。请注意,空字符串也被视为有效。解题思路:1.利用栈后进先出的性质来进行判断2.首先括号必须是成对出现,...

2019-04-05 17:16:30 160

原创 leetcode每日一练

二叉树的最大深度题目源于leetcode104. Maximum Depth of Binary Tree解题思路:1、递归a.若只有根节点,则深度为1b.左右子树分别递归自身求得最大深度c.取左右最大深度的最大值2.迭代(栈)a.引用栈来存取节点数和深度值b.依次遍历左右子树的节点,将深度值此次记录添加到栈中c.返回左右子树深度值的最大值3.队列a.引用队列b.依次分...

2019-04-04 12:50:30 110

原创 leetcode每日一练

题目源于leetcode.521------最长的罕见子序列题目描述:给定一组两个字符串,您需要找到这组两个字符串中最长的不常见子序列。最长的不常见子序列被定义为这些字符串之一的最长子序列,并且此子序列不应该是其他字符串的任何子序列。子序列是可以从一个序列通过删除一些字符,而不改变剩余元件的顺序的序列。也就是说,任何字符串都是其自身的子序列,空字符串是任何字符串的子序列。输入将是两个字符串...

2019-04-03 15:31:57 131

原创 leetcode每日一练

链表专题题目一:链表的翻转源自leetcode 206. Reverse Linked List题目描述:翻转单链表例:输入: 1-> 2-> 3-> 4-> 5-> NULL输出: 5-> 4-> 3-> 2-> 1-> NULL解题思路:1.用迭代,把指针分别都改成指向前一个元素2.用递归,把指针分别都改成指向前一...

2019-04-02 11:59:52 106

原创 leetcode每日一练

python实现字符串的反转题目源于 leetcode 344------- Reverse String题目描述:编写一个反转字符串的函数。输入字符串以字符数组的形式给出char[]。不要为另一个数组分配额外的空间,你必须这样做修改输入数组 就地用O(1)额外的内存。您可以假设所有字符都包含可打印的ascii字符。例1:输入:[“h”,“e”,“l”,“l”,“o”]输出:[“...

2019-04-01 12:30:21 105

原创 leetcode每日一练

leetcode每日一练Python实现排序数组的正方形题目来源于leetcode 977---------Squares of a Sorted Array1.题目描述:给定A 以非递减顺序排序的整数数组,返回每个数字的平方后的数组,也按有序非递减顺序返回。解题思路:1.设置一个新的数组2.把原数组各数的绝对值平方3.把平方后的各值添加到新的数组4.sorted排序输出实现...

2019-03-31 16:29:57 239

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除