自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Miracle8070

该博客记录学习计算机和人工智能的过程中做出的探索,见证一下自己的成长,同时也把自己踩过的坑和学习到的知识分享出来,大家共同进步,一起交流,一起努力。我们永远年轻,永远热泪盈眶。

  • 博客(18)
  • 资源 (6)
  • 收藏
  • 关注

原创 算法刷题重温(十三): 回归基础数据结构之栈与队列

1. 写在前面今天这篇文章复习栈和队列的相关题目了,栈和队列也是两种非常重要的数据结构,在很多地方都会看到,比如非常重要的dfs和bfs中就是分别用的这两个结构,关于这块的题目,我之前刷的不多, 但是这里有几个很重要的结构,单调栈, 单调队列和优先级队列,一些经典的中等偏上的题目要靠它们来搞定,所有这里会重点看看这几个东西的使用。关于栈,我们需要了解:特点: 栈的最大特点就是后进先出(LIFO)。对于栈中的数据来说,所有操作都是在栈的顶部完成的,只可以查看栈顶部的元素,只能够向栈的顶部压⼊数据,也只

2021-03-30 10:00:09 508

原创 算法刷题重温(十一): 回归基础数据结构之链表

1. 写在前面这篇文章来复习链表,链表这里的操作一般是玩指针了,双指针,三指针齐头并进,快慢指针打破常规, 这里的解题关键无它,先画图,然后找对应的指针进行变换操作即可。这里很容易出bug的地方就是越界,或者指针忘了移动陷入死循环。下面先整理有关链表几个常规操作模板,然后整理具体的题目和代码,最后小总只整理题目,方便后面过思路用。下面开始。2. 题目思路和代码梳理3. 小总LeetCode61: 旋转链表...

2021-03-29 09:04:28 479

转载 机器学习中的评估指标与损失函数

1. 写在前面在准备找工作面试时, 发现机器学习中的评估指标和损失函数是一个经常要问题的话题, 对于一个算法工程师,衡量模型的好坏以及怎么根据出现的问题进行调整是必备的技能,损失函数代表着模型的优化方向, 而评估函数评估模型的表现性能, 这俩还是不太一样的。 之前也写过一些文章,对这些东西进行过整理, 但是发现依然有一些不知道的点,所以这里再转发一篇文章, 因为在里面发现了一些自己之前不知道的内容, 感觉整理的挺好的, 正好和我之前的互补下。文章来自这里https://blog.csdn.net/Yasi

2021-03-29 00:19:25 3794 1

原创 算法刷题重温(十): 回归基础数据结构之数组和哈希表

1. 写在前面这篇文章开始, 准备回归基础数据结构的复习了,主要包括数组,哈希表,链表,字符串,栈与队列的相关题目了,这边的题目相对于前面的算法层面上的那些,会稍微好想一些, 难度会下降,并且有一些很关键的思想,一般会默写了之后就可以解题。比如双指针法, 滑动窗口, 单调栈啊等等。 这篇文章复习数组和哈希表,其实感觉哈希表就是一种辅助工具来解决数组题目,数组这边常用的方法思想:重建数组, 双指针,2. 题目思路和代码梳理3. 小总数组这边的题目稍微简单点,拿出了一天的时间复习,大约10道题目, 总

2021-03-25 11:08:35 748

原创 头条项目推荐的相关技术(十):排序模型进阶与总结

1. 写在前面这里是有关于一个头条推荐项目的学习笔记,主要是整理工业上的推荐系统用到的一些常用技术, 这是第八篇, 上一篇文章介绍了离线排序模型训练与实时计算的相关内容,

2021-03-22 22:51:51 764 3

原创 头条项目推荐的相关技术(九):深度学习推荐系统与TensorFlow框架

1. 写在前面这里是有关于一个头条推荐项目的学习笔记,主要是整理工业上的推荐系统用到的一些常用技术, 这是第八篇, 上一篇文章介绍了离线排序模型训练与实时计算的相关内容,

2021-03-21 19:06:12 841

原创 头条项目推荐的相关技术(八):实时推荐业务流实现与AB测试

1. 写在前面这里是有关于一个头条推荐项目的学习笔记,主要是整理工业上的推荐系统用到的一些常用技术, 这是第八篇, 上一篇文章介绍了离线排序模型训练与实时计算的相关内容,

2021-03-19 22:49:40 983 3

原创 头条项目推荐的相关技术(七): 离线排序模型训练与在线计算

1. 写在前面这里是有关于一个头条推荐项目的学习笔记,主要是整理工业上的推荐系统用到的一些常用技术, 这是第七篇, 上一篇介绍了离线召回与定时更新技术, 这里说的就是根据用户的历史点击行为,基于模型或者是文章内容,从海量的文章中为每个用户在每个频道召回几百篇文章,并存储到HBase,供后面的精排模型所使用。 而今天这篇文章介绍的就是离线排序模型训练与实时计算用到的相关技术。这篇文章使用的数据就是前面召回回来的候选样本集。 主要内容如下:离线排序模型训练基础(CTR预估作用,常见点击率预测种类模型,CT

2021-03-18 20:06:31 807 1

原创 头条项目推荐的相关技术(六): 离线召回与定时更新

1. 写在前面这里是有关于一个头条推荐项目的学习笔记,主要是整理工业上的推荐系统用到的一些常用技术, 这是第六篇, 上一篇介绍了用户画像的计算以及增量更新方式,最后还整理了推荐系统中的特征工程的相关知识, 这篇文章要介绍的技术是离线召回与排序。这个也是推荐系统的核心技术之一了。主要内容如下:召回排序介绍(业务流程, 头条推荐的召回排序设计)离线用户基于模型召回集(ALS模型推荐API使用, StringIndexer的使用,spark完成离线用户基于模型的协同过滤推荐)离线用户基于内容召回集(离

2021-03-17 18:08:21 876

原创 头条项目推荐的相关技术(五): 离线用户画像计算与增量更新

1. 写在前面这里是有关于一个头条推荐项目的学习笔记,主要是整理工业上的推荐系统用到的一些常用技术, 这是第三篇, 上一篇文章整理了离线文章画像的计算与更新的全过程,本篇介绍的技术是离线用户画像的计算, 首先会介绍离线用户画像建立的流程,然后就介绍离线的画像如何计算及更新,最后借鉴王喆老师的书,补充一下推荐系统应该如何选取和处理特征的相关知识, 主要内容如下:离线用户画像建立流程离线用户画像增量更新推荐系统应该如何选取和处理特征(特征工程原则,常用特征,常用特征处理方法以及特征工程与业务).

2021-03-16 20:26:42 959

原创 头条项目推荐的相关技术(四):离线文章画像的增量更新及离线文章相似度计算

1. 写在前面这里是有关于一个头条推荐项目的学习笔记,主要是整理工业上的推荐系统用到的一些常用技术, 这是第三篇, 上一篇文章整理了离线文章画像的计算过程,主要包括TFIDF和TextRank两种技术, 这篇文章介绍下离线画像的增量更新计算(定时更新)以及文章相似度技术的相关计算方法, 由于离线画像计算方法上一篇文章总结了,这里就简单了解下增量更新,也就是新来的文章,应该怎么去计算这些新文章的画像呢? 主要内容如下:离线增量文章画像计算, 这里要把上一篇文章里面的所有代码写成项目代码并放入pych

2021-03-16 14:50:15 700 2

原创 头条项目推荐的相关技术(三): 离线文章画像计算

1. 写在前面这里是有关于一个头条推荐项目的学习笔记,主要是整理工业上的推荐系统用到的一些常用技术, 这是第三篇, 上一篇文章整理了用户的行为日志收集技术, 第一篇文章整理了数据库的迁移技术,这里呢,就真正开始头条推荐项目了, 本篇介绍的技术是离线文章画像的计算, 首先会介绍离线画像的流程,然后就介绍离线的文章画像如何计算。主要包括:离线画像的流程(把握下画像构建在整个推荐系统中所处的位置)离线文章的画像计算原理(文章画像构成, spark tf-idf和TextRank计算工具使用,文章画像计算和

2021-03-13 21:03:27 611 1

原创 AI上推荐 之 DSIN模型(阿里DIEN之上的再探索,Transformer来了)

1. 写在前面这篇文章整理模型,不再使用华丽的前言外表, 也跳出了王喆老师书上的推荐模型, 从前面的各个模型的基础上开始尝试推荐系统领域各个方面的一些新探索和成果了, 后面的这个系列打算采用“小步快跑”的方式,每次研究一个模型,主要是基于原论文和一些不错的博客,然后通过一篇文章把细节进行梳理,这样既兼顾论文总结,也能保持短期更新,逼迫自己快速学习和输出。 但是为了整理清楚每篇论文里面的细节和完成知识的串联,篇幅上可能依然不会减太少,当然,也是视情况而定, 重要的模型多整理(理论和代码), 不太重要的简单总

2021-03-12 17:41:30 3848 8

原创 算法刷题重温(七): 二分查找

1. 写在前面今天复习二分查找,二分查找看似简单,其实变形和细节很多, 所以一定要把握住一个核心叫做:循环不变量,关于这个东西的解释,可以参考这篇文章。这里不解释这个了, 之前我也看过东哥写的算法小抄上的框架模板, 东哥也解释的很清楚,最后还统一了一种写法, 这个看个人习惯和理解吧, 通过之前的刷题,我还是习惯先记忆两种解题思路,每一种思路又有两种代码框架的写法,所以再记住这两种写法,相当于4个代码框架, 就基本能应付这一块的题目了, 我觉得既然是总结,这次应该先从宏观的思路入手,再去分析框架代码的写法,

2021-03-11 09:36:14 617 2

原创 头条项目推荐的相关技术(二):用户的行为收集(从日志经flume到hadoop再Hive操作)

1. 写在前面这里是有关于一个头条推荐项目的学习笔记,主要是整理工业上的推荐系统用到的一些常用技术, 这是第二篇,第一篇介绍的是数据库的迁移技术,也就是mysql中的数据如何导入到Hadoop中,在大数据平台上进行处理, 而这一篇要介绍的技术是用户的行为日志收集,通过flume将业务数据服务器A的日志收集到hadoop服务器的hdfs的hive中。 对于头条文章推荐来说, 用户的行为(点击,收藏,转发等)代表着每一次的喜好反馈,能够了解分析用户的行为,喜好变化,也能为后面为建立用户画像提供依据,所以用户行

2021-03-09 22:54:51 1487

原创 头条项目推荐的相关技术(一): 数据库的迁移与定时迁移技术

1. 写在前面这里是有关于一个头条推荐项目的学习笔记,主要是整理工业上的推荐系统用到的一些常用技术, 这是第一篇, 首先是数据库的迁移技术。主要包括:为什么需要数据库的迁移以及需求如何进行数据库的迁移应用Sqoop完成头条业务数据到Hive的导入Ok, let’s go!2. 为什么需要数据库的迁移及需求我们的web开发和我们的推荐系统所使用的服务器是不同的,这两块肯定是分开的,各自有各自的任务。 因此我们从web开发中获取到的某些业务数据表,往往是没法直接就能在做推荐系统开发的上面直接获

2021-03-09 08:55:54 1146 2

原创 算法刷题重温(六): 深度优先(DFS)和广度优先(BFS)

1. 写在前面今天复习深度优先和广度优先遍历,这两个也是非常重要的思想,应用最多的就是对树和图的相关遍历了。深度优先遍历DFS解决的是连通性的问题,即给定两个点,一个是起始点,一个是终止点,判断是不是有一条路径从起点到终点(这里的起点和终点也可以指起始状态和最终状态)。问题的要求并不在乎是长还是短,只在乎有没有,有时候题目也会要求把找到的路径完整的打印出来广度优先遍历BFS一般用来解决最短路径的问题。和深度优先搜索不同,广度优先的搜索是从起始点出发,一层一层地进行,每层当中的点距离起始点的步数都是相

2021-03-07 15:05:44 1689 1

原创 AI上推荐 之 DIEN模型(序列模型与推荐系统的花火碰撞)

1. 前言随着信息技术和互联网的发展, 我们已经步入了一个信息过载的时代,这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:信息消费者:如何从大量的信息中找到自己感兴趣的信息?信息生产者:如何让自己生产的信息脱颖而出, 受到广大用户的关注?为了解决这个矛盾, 推荐系统应时而生, 并飞速前进,在用户和信息之间架起了一道桥梁,一方面帮助用户发现对自己有价值的信息, 一方面让信息能够展现在对它感兴趣的用户前面。 推荐系统近几年有了深度学习的助推发展之势迅猛, 从前深度学习的传统推荐模型(协

2021-03-06 22:26:23 7321 31

墨尔本气温预测.zip

时间序列数据广泛存在于量化交易, 回归预测等机器学习应用, 是最常见的数据类型。所以这里通过墨尔本十年气温变化预测的任务来整理一个时间序列数据挖掘的模板,方便以后查阅方便。这个模板可以用在大部分的时间序列预测任务,从股票价格波动,到四季气温变化, 从大桥沉降预测,到城市用电预警等。 通过本模板,可以掌握sklearn中常用的工具包以及深度神经网络的搭建Keras,能够学习到处理时间序列的方式,里边还包含了大量的数据可视化的套路。

2020-03-12

深度学习理论知识.zip

这是很全的深度学习理论的知识,是最好的自学深度学习的速查文档和速学方式,里面的内容涵盖深度学习的很多领域,从神经网络的基础,到卷积神经,循环神经,LSTM,递归神经网络,从神经网络的优化方式到各种激活函数,batch正则,最后一个Minist手写数字识别实战,希望能够帮到自学深度学习的小伙伴。

2020-01-05

机器学习理论知识.zip

这是很全的机器学习理论的知识,是最好的自学机器学习的速查文档和速学方式,里面的内容涵盖机器学习的很多领域,从机器学习面试题集锦,到特征工程,正则等基础知识,到sklearn,spark等分布式,从线性回归,逻辑回归,决策树,朴素贝叶斯,adaboost,xgb,lightgbm,GBDT等主流的监督学习算法,到聚类,pca等非监督学习算法,从推荐系统到关联分析,svd等。最后一个OTO实战。 希望能够帮助到自学机器学习的小伙伴。

2020-01-05

AI算法工程师手册.zip

这算是一份手册或者是快速学习的一种方式,里面涵盖基本的机器学习和深度学习算法,从基本介绍,到特征工程,从基本的机器学习算法(决策树,贝叶斯,线性回归,支持向量机,KNN,聚合算法,GBDT,xgb,lightbgm等, 无监督算法pca,聚类等), 到深度学习算法(CNN,RNN)基本上全覆盖。所以有了这一个,能够在应用中快速的查看。希望在自学深度学习和机器学习的路上帮助到大家。

2020-01-05

机器学习、深度学习面试笔试题300+.pdf

最新版的机器学习和深度学习面试题目,从牛客等各大网站整理剖析,整合整理,共300多道经典题目。 涉及机器学习和深度学习理论和实践等各方面的知识,底层的知识偏多一些!

2019-11-24

数据处理之特征选择知识.pdf

用sklearn进行特征选择的一些知识整理, 主要包括如何对数据进行归一化,标准化, 对定性数据怎么描述,如何降维,如何进行特征选择,这些其实sklearn包中都封装好了相关的函数,使用的时候,可以直接来用,所以也是一份随时可以查阅的资料。

2019-11-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除