自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Toby的博客

苟有恒,何必三更起五更眠;最无益,只怕一日曝十日寒。Open your eyes, and you will meet those who are striving on the way like you and feel the way you do.

  • 博客(314)
  • 收藏
  • 关注

原创 读书分享《自尊的六大支柱》[附线下视频节选]

• 1、有意识地生活的实践活在当下,感知(看见 + 知晓 )周围真实的环境,别逃避。你清醒一点。• 2、自我接纳的实践面对真实的自己,理解自己为什么成了现在的你。和自己进入一个和谐的关系。• 3、自我负责的实践你要为自己的愿望、选择、价值观、行为、行动结果负责。没人会来拯救你。• 4、自我肯定的实践尊重自我的愿望、需求和价值观,并把愿望变成现实。• 5、有目的地生活的实践制定目标、采取行动、监控行为是否与目标一致、关注行动结果。• 6、个人诚信的实践。

2024-04-07 11:26:04 619

原创 营销目标人群挖掘实践经验总结

上述展示的群体发现的过程是遵循数据挖掘的方法和框架的。主要流程和框架以下模型、分析方法是可以沉淀成标准化输入输出模版的:1、商品分析模型: 显著性分析、 相关性分析、odds比、Jaccard相关系数、 FP-Growth分析2、画像标签筛选模型: 分类模型特征筛选法、方差筛选法...3、人群分层模型: 排序模型、RFM分层模型、....在有些业务场景下,上述分析方法会失效。

2024-02-27 17:35:25 823

原创 回顾2023年及过去五年的成长经历

结合工作实践、应用经验,总结好用的方法、联想、提炼、升华方法论,并牢记和复用。成功的经验很重要。失败的经验、痛苦的经验更重要。

2024-02-04 16:03:54 993

原创 tf.keras官方API文档框架理解

最近看tensorflow2官方API文档,尤其是tf.keras API文档,梳理下其框架,形成脑图,方便自己记忆,也有助于形成一张相互关联的知识图。如下:

2021-07-23 16:06:54 597

原创 学习TensorFlow的过程和经验总结

近日学习使用TensorFlow搭建神经网络建模终于取得了一些微小的成绩:1、学会了使用Squential \ class 搭建神经网络模型2、学会了使用compile来配置模型训练方法,如损失函数、优化器、准确性评价方法3、学会了一些经典的神经网络模型的实现方法4、学会了各优化器的作用和效果5、学会了搭建神经网络进行训练和学习的整体框架和步骤其实,我学习TensorFlow不止一两周了。我是从今年的2月份就开始学习了。当时报名了一个天池的算法比赛,需要使用CNN和RNN模型进行建模,所以

2021-07-22 21:27:28 1768 7

翻译 理解LSTM模型

写在前面:这是翻译自colah的一篇博客,原文关于LSTM神经网络模型的理解写的非常直观、简单易懂,所以翻译过来帮助大家学习理解LSTM模型。当然我不是按照原文一字不落的翻译,而是摘出其中对模型理解最有帮助的部分,然后用我自己理解的方式和语言来写的博文。这是我翻译博文的一贯做法。有兴趣的可以自行去看原文,比较简短,原博客地址:http://colah.github.io/posts/2015-08-Understanding-LSTMs/一、循环神经网络RNNRNN循环神经网络使用循环核来实

2021-06-22 23:29:37 8959 3

转载 【转】王兴饭否190条思考【世界观、人生观、价值观】

101.对三观的不同排序可能反映了人的不同思维模式。我理解的排序是:世界观、人生观、价值观。转自 《同样是技术出身,深夜看完王兴饭否的190条思考,越想越后怕!》作者l王兴 编辑| 易小飒来源l进击的阿秀(ID:zchxuexi)整理自王兴饭否版权申明:内容来源网络,版权归原创者所有。除非无法确认,都会标明作者及出处,如有侵权,烦请告知,会立即删除并致歉。谢谢!知乎上有个问题:王兴是不是被高估了?有个高赞回答说,王兴是真正值得学习的对象,作为身家 200...

2021-05-02 19:52:59 824

原创 10、《Spark高阶用法之机器学习》笔记

写在前面:在本分类专栏下的1-9翻译文章,和两篇sparkUDF的文章都是属于spark的常规低阶的用法,基本能满足日常的分析功能了。但是这些基本用法并没有涉及、也无法满足机器学习建模的需求。比如拆分特征向量和目标向量,比如生成特征向量,比如使用分类或回归模型,比如使用深度学习模型等....所以,从这篇文章开始,我们开始学习spark的高阶用法,即spark用于机器学习、深度学习。注意要结合官方文档学习,里面有非常详细的API说明和代码示例,非常有助于理解和实践应用。也是日后工作时常备的

2021-04-05 22:48:44 186 1

原创 《深度学习with Keras》笔记

深度学习with Keras

2021-03-22 16:53:49 93

原创 3、学会在人生需要做选择的时刻去做选择,而不是去怀疑当初选择的对错

不需要怀疑当初的选择是对是错。为什么当时的那个选择会成为你现在心心念念责怪或感恩的对象?当时的你为什么会面临选择?驱动你作出选择的生活原因、心理原因又都是什么?当时的选择有给你带来过高光吗?有让你觉得幸福过吗?既然有,那就不要怀疑当初的选择是对是错。它确实拯救了你,给你带来了幸福。而且我更可以肯定的是,当时的你并没有你现在想象中的那么多选择,你当时应该只有这一条路可以走而已。不信你看看你现在的境况,是不是也没有那么多选择?选择不仅仅是口头上的,更是实际行动产生出可评价结果的。你看看自己有

2021-03-12 16:23:06 860 2

转载 【转】如何让技术想法更容易被理解?【费曼4步学习法】

转载文章,原文来自阿里云云栖号,地址:https://mp.weixin.qq.com/s/TXX7OTnxa8iiENMOJr3-cQ我这里是对原文的摘录,删掉了一些内容,只保留了我觉得有收获的地方。原文采用的是一种很经典的写作手法。(我忘记叫什么了,姑且叫做三段式、小故事、或者Q&A的写作手法吧~~)首先,描述一个故事,引出一个问题。其次,就该问题指出应该要做的心态和方法的转变。最后,给出一个可行的行动方法或方式。所以,我摘录的时候几乎舍弃了全部的故事描述,或者仅用一句话来总..

2021-02-03 17:54:36 217

转载 【转】阿里毕玄:提升代码能力的4段经历【无它就是实干】

对于程序员而言,我始终认为代码是展现能力的关键。一个优秀程序员写的代码,和一个普通程序员写的代码是很容易看出差别的,代码是展示程序员硬实力的名片。如何提升写代码的能力,始终是一个关键的话题,不过很遗憾这篇文章其实也不是讲具体的步骤、银弹方法、武功秘籍什么的,这篇文章讲讲我自己印象中,对我写代码能力提升比较大的四段经历,也许可供参考。第一段:第一次感受每天亿级系统的挑战2008年,HSF的第二个版本,在当时淘宝最重要的交易中心上线,上线当天造成淘宝网站访问巨慢,交易类的页面几乎打不开,最后..

2021-01-29 11:30:02 186

转载 【转】Elon Musk 【带着目标学习、第一性原理思维,不去追逐平庸的机会,切身感受“追逐的力量”】

以下文章为转载摘录,作者云游小生最近,世界首富换人了!由于特斯拉股票疯狂暴涨,马斯克成了妥妥的新一届全球首富。同时,钟睒睒也力压印度首富安巴尼(Mukesh Ambani),晋身亚洲新首富。网上有媒体称,世界首富和亚洲首富一个卖车一个卖水!但其实这两人能够登上首富的宝座,早已不只是卖车和卖水的事情了。马斯克背后还有 Spacx、The Boring Company、Neuralink;钟睒睒背后还有万泰生物、养生堂等。但马斯克成为世界首富,给我们带来的启发更大,不..

2021-01-18 00:09:13 918 1

转载 【转】技术人如何加速成长?提升你的思维和学习方式【思想上勤奋、借事修人、第一性原理、结构化思维/金字塔原理、复盘、解构和重组】

原创涵爸阿里技术收录于话题 #技术人成长之路阿里妹导读:每个人都会经历一个新人的阶段,不管是初入职场,还是到一个新的工作环境。作为技术新人,我们常常会面临哪些困惑?普通人和非凡人的差异在哪里?除了体力上的勤奋,还有哪些方法可以加速成长?本文从第一性原理、结构化思维和多维度思考等方面分享如何从思维深度上提升自己,分享关于技术人成长之道的心得体会。一 摘要阿里优秀的人很多,他们身上共同的特质是什么?让我最佩服的是思考力强的人,对事情有深入洞见和观点的人。大多数人还停留在表面看...

2021-01-10 22:56:56 638

原创 2020年我是这么走过来的【目标和渴望、工具和效率、复盘和总结、做人和做事】

2020年很快就过去了。今年对于国家、世界发生了很多大事,对于我个人同样也发生了很多意义非比寻常的事情。2020年,确切地说是2019年的9月-2020年的12月,这一年零四个月的时间对于我来说是非常宝贵的一段人生经历。我满身疲倦的从前家公司离职,全身心地投入到自己喜欢的事情当中。经历无数彻夜奋战,经历了废寝忘食的努力,又经历了社会残忍的拒绝和鞭笞,一次次地失败、一次次的丧、之后又是一次次地爬起来。就在这样普通的日子中,我完成了很多认知上的转变,收获了很多专业上的知识。我放下了一些执念,放下了一些虚妄的

2021-01-10 22:37:40 259 1

原创 快速数据开发和复盘cheat sheet

给我的粉丝们发福利。近期做了一个项目,项目结束后做了复盘。这个过程中总结了快速数据开发手册 和复盘总结方法,得到了领导们的认可。四步法完成正向开发和反向复盘。去掉了与公司和业务相关的信息,只保留最核心最本质的做事和总结方法。...

2020-11-04 14:07:10 167

原创 Mac安装数据科学所需要的全部应用CheckList

入职新公司,全新Mac本,需要重新安装数据科学工作所需要的toolkits。工具安装checklist如下:1、sublime text 官网下载2、anaconda 官网下载:https://www.anaconda.com/分为 graphical 和command-line的版本,前者是图形化安装,后者是命令行安装的,选前者,按照提示安装即可。3、SecureCRT4、Xmind在APP store中搜索下载即可...

2020-09-07 19:21:45 341

转载 【转】机器学习必读TOP 100论文清单:高引用、分类全、覆盖面广丨GitHub 21.4k星

想要入门机器学习,奈何领域的新论文太多,不知道该看哪一篇?自2017年以来,超越SOTA的方法天天有,但往往针对性非常强,不一定是颠覆机器学习圈的重要成果。又回到了熟悉的话题:要想入行,还得看高引用经典论文。这里整合了2012年到2016年的高引TOP 100论文,引用量要求随着年份递减而递增,Hinton、Bengio、何恺明等大牛的论文都在其中,一起来看看吧:清单列表理解、泛化、迁移学习1、Distilling the knowledge in a neural ne...

2020-07-19 19:28:36 281

原创 《特征工程》知识框架

特征工程checklist

2020-07-16 19:10:48 226

转载 【转】做ML项目,自查清单帮你理清思路

原文链接:https://towardsdatascience.com/task-cheatsheet-for-almost-every-machine-learning-project-d0946861c6d0【注:与我之前整理的sklearn 快速建模check list 异曲同工】任何科研项目都是系统性的,机器学习项目也不例外,它包含一系列大大小小、或繁或简的要素和组件,如讨论、准备工作、提出问题、模型构建和优化调整等。在这种情况下,开发者很容易漏掉一些重要的东西。八步完成 ML ..

2020-07-14 05:36:31 248

转载 【转】【较全的CTR模型概览】 推荐算法——CTR预估模型

知乎文章 : 推荐算法——CTR预估模型CTR预估模型可以广泛应用于个性化推荐、信息检索、在线广告等领域,用来学习和预测用户的反馈,用户的反馈主要有点击、收藏、购买等。数据CTR预估模型的特征数据往往包含多个特征,这些特征会根据其自身特点被编译成one-hot编码,然后将多个特征对应的编码向量链接在一起构成特征向量。高维、稀疏、以及多类别是输入给CTR预估模型的特征数据的典型特点。Embedding 表示又叫Distributed representation,相对于高维稀疏的.

2020-07-12 16:49:46 1803

转载 【转】基于知识图谱的推荐系统(KGRS)综述

以下文章来源于AI自然语言处理与知识图谱,作者Elesdspline作者信息Elesdspline目前从事NLP与知识图谱相关工作。导语本文是2020年针对知识图谱作为辅助信息用于推荐系统的一篇综述。知识图谱对于推荐系统不仅能够进行更精确的个性化推荐,而且对推荐也是具有可解释性的,有迹可循。本文汇总了近些年来知识图谱辅助推荐系统的一些研究工作,并按不同的方法进行划分类别(下图是我根据论文画出的大纲方法类别图);除此之外,汇总了不同场景下的知识图谱数据集,涵盖7个场景;最后阐述...

2020-07-09 08:35:35 7004 2

原创 《Sklearn机器学习实用指南》笔记

Sklearn机器学习实用指南

2020-07-07 06:08:43 177

原创 Sklearn快速建模cheat sheet

机器学习项目中,快速使用Sklearn于建模实践的cheat sheet

2020-07-06 05:42:52 283

原创 《吴恩达机器学习》笔记

吴恩达机器学习笔记整理

2020-06-19 04:30:34 180

原创 项量《推荐系统实战》笔记

推荐系统知识框架梳理

2020-06-13 05:37:06 267

原创 《Python基础知识框架》笔记

Python基础知识框架梳理

2020-06-11 01:12:32 456

转载 转载-从ReLU到GELU,一文概览神经网络的激活函数

选自mlfromscratch作者:Casper Hansen机器之心编译在计算每一层的激活值时,我们要用到激活函数,之后才能确定这些激活值究竟是多少。根据每一层前面的激活、权重和偏置,我们要为下一层的每个激活计算一个值。但在将该值发送给下一层之前,我们要使用一个激活函数对这个输出进行缩放。本文将介绍不同的激活函数。在阅读本文之前,你可以阅读我前一篇介绍神经网络中前向传播和反向传播的文章,其中已经简单地提及过激活函数,但还未介绍其实际所做的事情。本文的内容将建立在你已了解前一篇文章.

2020-05-13 22:00:52 1112

原创 3-pytorch数据迁移代码实例:特征提取和微调(基于卷积神经网络retnet18)

在特征提取中,可以在预先训练好的网络结构后修改或添加一个简单的分类器,然后将源任务上预先训练好的网络作为另一个目标任务的特征提取器,只对最后增加的分类器参数进行重新学习,而预先训练好的网络参数不被修改或冻结。实际上,微调要优于特征提取,因为它能够对迁移过来的预训练网络参数进行优化,使其更加适合新的任务。微调的大致过程是在预先训练过的网络上添加新的随机初始化层,此外预先训练的网络参数也会被更新,但会使用较小的学习率以防止预先训练好的参数发生较大改变。常用方法是固定底层的参数,调整一些顶层或具体层的参数。

2024-04-22 18:38:19 339

原创 2-Embedding例子:简单NN网络、迁移学习例子(glove语料预训练)

Embedding简单例子

2024-04-18 20:23:03 241

原创 新房装修后,经验总结和坑点复盘

房子装修的时候,谁在盯着你的钱包?谁想从你这里捞钱?一是负责签合同的装修公司,二是负责实际装修的工地工头。装修公司要从你这份合同里为公司赚取运营成本和利润,工地装修工头要从你这里赚取他私人的利益。在签合同的时候,装修公司的钱从所用材料的单价上、设计师的费用上体现。当然你是可以讨价还价的。而工地装修工头的钱,从合同的小字里标示的不包含项里赚(即恶意漏项)、从偷工减料里赚,从你临时要加的需求里赚。所以,很重要的成本把控点,一个是装修预算合同,一个是现场施工监管。

2024-03-26 12:50:21 386

转载 [转]职场中必备的认知模型摘录

由七个字母组成,分别为Substitute(替代),Combine(合并),Adapt(改造),Modify(调整),Put to other uses(改变用途),Eliminate(去除),Reverse(反向)。做到提早,事情提前做,数据提前找,主动选择而非完全被动等待。将结论凝练成一个个结论要点,论点与论据可以用金字塔的阐述结构,即先陈述论点结论,后以论据作为支撑,先总结所以,后过程因为。介于探索者和防御者之间,根据不同情况,平衡前两者的优先顺序,经常跟随探索性公司,开发出相仿的产品。

2024-02-20 15:51:34 135

转载 [转] 沟通力:一文讲清楚“职场影响力”模型

1)提意愿,对方意愿比较低,比如有更有优先级的活,最有效的方式就是扩大影响面,从利弊两个维度去分享他相关影响的部分,把他原来没有想到的因素都考虑进来,最终目的是让他有个更加全局的视角,而不只有他一开始的视角。还有我也很喜欢组织活动,特别是组织部门活动,甚至跨部门活动,告诉你一个秘诀,如果能参与到公司年会筹划组中,那么一场年会下来,公司的核心人员很快就记住你了,不仅是记住你的脸,还记住了你的能力。还有第二招,就是提供支持,去申请更多的资源参与其中,让他觉得不只是2个人的战斗,而是可以有更多的资源参与进来。

2024-02-18 16:22:25 66

原创 新房装修前须知:装修流程、找装修公司签合同

装修公司的选择一定要多比较再多比较,决定一定要慎重再慎重,不然如果选择了一个不靠谱的装修公司,钱交完了但开始施工的时候发现设计师不负责、项目经理坑人、施工队垃圾,那你这十几万、几十万的钱就算是交学费了。每家装修公司,一般会有2个人,一个设计师、一个助理设计师会去你家现场量房,听听你对房子的大体设计想法或居住需求。包括当地比较有名的装修公司有哪些,他们的装修实力分别在什么档次,对你房子的设计和总体报价大概是多少。3、一定要选择懂装修行业报价、懂得尊重你、靠谱的人一起跟进整个装修过程。

2023-10-20 21:01:17 255

原创 在使用nohup命令后台训练pytorch模型时,关闭ssh窗口导致的训练任务失败解决方法

ssh终端 nohup 后台进程不终止

2023-10-10 11:34:51 1746 1

原创 HuggingFace开源的自然语言处理AI工具平台

Transformers:一个提供了数千种预训练好的NLP模型(如BERT、GPT-3等)以及相应工具包(如PyTorch、TensorFlow等)接口的库,可以方便地加载、使用、修改、分享这些模型;HuggingFace是一个开源的自然语言处理AI工具平台,它为NLP的开发者和研究者提供了一个简单、快速、高效、可靠的解决方案,让NLP变得更加简单、快速、高效、可靠。Hub:一个提供了一个在线的模型和数据集的仓库,可以方便地浏览、搜索、下载、上传、分享自己或他人的NLP模型和数据集;

2023-08-16 15:08:13 1709

原创 pyspark训练ALS模型注意事项

而用于隐式反馈时,每个评分代表的是用户会和给定产品发送交互的置信度(比如随着用户访问一个网页次数的增加,评分也会提高),预测出来的也是置信度。rank: 使用的特征向量的大小,更大的特征向量会产生更好的模型,但是也需要话费更大的计算代价,默认10。用于显式评分时,每个用户对于一个产品的评分需要是一个得分(例如1到5星),而预测出来的评分也是得分。MLlib/ ml中包含交替最小二乘法(ALS)的一个实现,这是一个协同过滤的常用算法,可以很好的。产品的页面但是没有对产品评分)交互皆可。

2023-08-15 19:08:29 317

原创 使用Spark ALS模型 + Faiss向量检索实现用户扩量实例

使用Spark ALS模型 + Faiss向量检索实现用户扩量实例

2023-08-10 16:39:22 1063

原创 pyspark使用XGboost训练模型实例

pyspark训练Xgboost模型

2023-08-04 19:42:15 1184 1

转载 Tensorflow: feature_column处理特征列,模型实现Demo

tf.feature_column 模块转换特征列

2023-07-27 11:24:18 221

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除