自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

wenyusuran的专栏

做个专注的人,永不放弃

  • 博客(41)
  • 资源 (10949)
  • 问答 (8)
  • 收藏
  • 关注

原创 Flink从入门到精通100篇(十五)-Flink SQL FileSystem Connector 分区提交与自定义小文件合并策略 ​

本文先通过源码简单过一下分区提交机制的两个要素——即触发(trigger)和策略(policy)的实现,然后用合并小文件的实例说一下自定义分区提交策略的方法。PartitionCommitTrigger在最新的 Flink SQL 中,FileSystem Connector 原生支持数据分区,并且写入时采用标准 Hive 分区格式,如下所示。 path└── datetime=2019-08-25...

2020-10-31 07:51:29 1265

原创 如何做好运营?运营类产品经理必须知道的几个常用功能设计方案

今天我们聊聊运营类产品经理身边最常出现的一组功能设计,简单的描述一下你就能把这几种设计对号入座,因为它们几乎遍布整个系统的每个角落。运营类产品经理身边最常出现的一组功能设计,他们分别是检索列表、错误提醒、弹出确认框、树形菜单、消息通知和系统首页,设计的效果优劣不在我们的交流范围,我主要想表达一下这些功能背后隐藏的问题。一、没有设计之检索列表上下结构为主,上边一块区域是基于各种表格字段的检索区域(你也可以叫数据过滤)。下边是一张数据表格最后一列经常性的放着操作区,多半都是删除,修改或查看..

2020-10-30 08:45:57 1362 1

原创 说了这么久中台,那你知道中台是什么?在治什么病吗?

在中台概念火热之后,很多似是而非的产品都在往中台上靠,很多已经在市面流通许久的产品也改头换面成某某中台。过于宽泛的定义会促使泡沫的产生,所以在行文之前,我们有必要进一步梳理与明确:中台究竟是什么?从形式上看,中台有业务中台、数据中台、技术中台与组织中台等多种称呼。从实施意义与作用来看,中台是可以支撑多个前台业务且具备通用性的平台产品。作为先行者的阿里将在线业务中台称之为业务中台,即为前台提供组件化产品与业务功能支撑等服务,而将数据治理与数据建设等数据管理活动为特征的中台称之为数据中台,为..

2020-10-28 17:16:57 1265

原创 tableau必知必会之学做常用的倾斜图(slopegraph)

倾斜图 slopegraph(又名斜线图或斜率图)可以展示单指标不同时期的变化。既能展示值的大小变化,也能同时展示排名的变化。例如下图,我们以“赛队名次”为指标查看以下20支赛队的预测名次与实际名次的变化。左边是预测名次、右边是实际名次;颜色表示名次进步或退步(橙红色表示进步、灰蓝色表示退步);连线的粗细表示差距的多少,线条越粗表示实际名次比预测相差越大。那么,在 Tableau 如何实现这样的倾斜图呢?我们就用上面的示例,为大家分享方法吧!为方便学习,栗子使用一个简单的赛队排名的数据源.

2020-10-28 08:33:11 1740

原创 2020必知的 10 大顶级 python 库

作为数据科学和机器学习相关的研究和开发人员,大家每天都要用到 python。在本文中,我们将讨论一些 python 中的顶级库,开发人员可以使用这些库在现有的应用程序中应用、清洗和表示数据,并进行机器学习研究。我们将讨论以下 10 个库: TensorFlow Scikit-Learn Numpy Keras PyTorch LightGBM Eli5 SciPy Theano Pandas ..

2020-10-27 14:49:27 1433

原创 2020年阿里大数据一面面经,看看你还有啥不知道的?

一、PV和UV是怎么计算的,UV怎么进行去重的?不用ES该如何实现去重?思路:首先要理解PV、UV的基本概念。去重分两种,一种是基本的数据结构(Hashset等),另外一种是借助框架去实现(bigmap、hyperloglog等)。二、说说 flink,spark streaming,storm 的区别?三、讲一讲spark的调度执行逻辑,stage,宽依赖和窄依赖,容错机制 ?这部分由于内容太多,只提供部分重点答案。1.调度执行逻辑:...

2020-10-26 10:23:55 1045

原创 Flink从入门到精通100篇(十一)-Java SPI 机制在 Flink SQL 中的应用

Java SPI 机制简介Java SPI机制,即Java Service Provider Interface,是Java提供的基于“接口编程 + 策略模式 + 配置文件”组合实现的动态加载机制。调用者可以根据实际使用需要,来启用、扩展或者替换框架的现有实现策略。在Java中,基于该SPI思想,提供了具体的实现,ServiceLoader,利用该类可以轻松实现面向服务的注册与发现,完成服务提供与使用的解耦。Java SPI机制常见的例子,如: 数据库驱动接口实现类的加载:JDBC可以根据实际

2020-10-26 07:22:49 1123

原创 最全 Prometheus 踩坑集锦

监控系统的历史悠久,是一个很成熟的方向,而 Prometheus 作为新生代的开源监控系统,慢慢成为了云原生体系的事实标准,也证明了其设计很受欢迎。本文主要分享在 Prometheus 实践中遇到的一些问题和思考,如果你对 Kubernetes 监控体系或 Prometheus 的设计还不太了解,可以先看下容器监控系列[1]。几点原则 监控是基础设施,目的是为了解决问题,不要只朝着大而全去做,尤其是不必要的指标采集,浪费人力和存储资源(To B商业产品例外)。 需要处理的...

2020-10-25 09:47:03 1436

原创 SpringBoot 源码解析 —— SpringApplication 源码分析

正常的 SpringBoot 应用程序一个正常的 SpringBoot 项目的启动类中常见代码如下:@SpringBootApplicationpublicclassSpringbotApplication{publicstaticvoidmain(String[]args){SpringApplication.run(SpringbotApplication.class,args);}}上面的代码也就两个比较引人注意的地方: @SpringBoo...

2020-10-24 07:42:48 1072

原创 Java 应用线上问题排查思路、常用工具小结

前言本文总结了一些常见的线上应急现象和对应排查步骤和工具。分享的主要目的是想让对线上问题接触少的同学有个预先认知,免得在遇到实际问题时手忙脚乱。毕竟作者自己也是从手忙脚乱时走过来的。只不过这里先提示一下。在线上应急过程中要记住,只有一个总体目标:尽快恢复服务,消除影响。不管处于应急的哪个阶段,我们首先必须想到的是恢复问题,恢复问题不一定能够定位问题,也不一定有完美的解决方案,也许是通过经验判断,也许是预设开关等,但都可能让我们达到快速恢复的目的,然后保留部分现场,再去定位问题、解决问题和复盘。在

2020-10-23 10:35:17 1051

原创 你是一个合格的数据分析师吗?教你如何提升自己的product sense?

一、什么是product sense先抛出几个问题,在面试和工作中,作为数据分析师,尝尝会遇到这样的问题。你会用什么样的指标评价一款产品?如何评价推荐算法的效果?如果一款产品需要上线一个新功能,你觉得是否有必要?有人就说了?我是面试数据分析,或者从事数据分析的工作?你问我或者要求我解决一些关于产品业务的问题,数据分析师不是处理EXCEL,SQL,PYTHON,R语言,敲代码,可视化数据就行了嘛?为了了解这个问题,我们从数据相关的职业进行剖析!在人人喊大数据的时代,对于职业的了解和自我定位至关重.

2020-10-22 08:41:03 1218

原创 tableau必知必会之如何在Tableau server中实现工作薄的自动刷新

Tableau 的企业用户,可能会遇到类似的应用场景:当业务数据迭代频繁或者业务数据分析需实时监控时,我们就要经常在服务器中刷新工作簿。如果能实现工作簿的自动刷新,绝对是事半功倍的!那么,如何实现呢?码农们的第一反应:这个要写代码做集成吧。其实,写代码做集成也是一种方法。但是,如果有更简单的方法,岂不更好呢?1、打开 Tableau desktop,选择连接数据库。2、选择所需数据模型,点击实时连接,点击立即更新。3、制做工作表并发布至 Tableau server。.

2020-10-22 08:34:06 2841

原创 化整为零,一步一步教你搭建Prometheus监控报警系统

什么是Prometheus?Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB)。Prometheus使用Go语言开发,是Google BorgMon监控系统的开源版本。2016年由Google发起Linux基金会旗下的原生云基金会(Cloud Native Computing Foundation), 将Prometheus纳入其下第二大开源项目。Prometheus目前在开源社区相当活跃。Prometheus和Heapster(Heapster是K8S的

2020-10-21 08:20:55 1178 2

原创 最新技术资讯,你必须知道的Python 3.9新功能

Python 3.9,来了!过去一年,来自世界各地的开发者们一直在致力于Python3.8的改进。Python 3.9 beta版本已经存在了一段时间,第一个正式版本于2020年10月5日发布。每个Python版本都包含新开发和改进的功能,Python 3.9也不例外。下面介绍Python 3.9几个主要的新功能。1. 字典(合并&更新)运算符字典是Python中最基础的数据结构之一,并且随着python版本的迭代,性能得到不断地优化。Python3.9中,合并(|)和更

2020-10-20 11:13:06 1018

转载 一部手机失窃引发的惊心动魄的战争,你是个合格的程序猿吗?

9月4日 ——7:30:正带着大娃在理发店理发,老婆过来告诉我,她在小区门口推着二娃蹲下买水果时婴儿车袋子里的手机被偷了。这时看到P40 pro上市,一年一度的换机季又到来了。说是丢失后就用其他手机拨打,但对方接通后关机。当时不知道我怎么想的,觉得可能还有机会能找回,没有未立即挂失手机卡,设置了华为找回手机的上线通知(这个不果断的决定,导致了后续悲剧的发生)。8:51:对方把卡取出来插在其他手机开机,后面通过查询通话和短信详单才知道,才一个小时多点的时间,对方从高新区直奔成华区,以周五成..

2020-10-20 09:09:37 2255 1

原创 Flink从入门到精通100篇(七)-如何基于 Flink 搭建一个实用有效的在线实时反欺诈平台?

在大数据时代,金融科技公司通常借助消费数据来综合评估用户的信用和还款能力。这个过程中,某些中介机构会搜集大量的号并进行“养号”工作,即在一年周期里让这些号形成正常的消费、通讯记录,目的是将这些号“培养”得非常健康,然后卖给有欺诈意向的用户。这类用户通过网上信息提交审核,骗到贷款后就“销声匿迹”了。那么,如何更快速地预防或甄别可能的欺诈行为?如何从超大规模、高并发、多维度的数据中实现在线实时反欺诈?这些都是金融科技公司当下面临的主要难题。针对这些问题,InfoQ 专访玖富集团,揭秘基于 Flink .

2020-10-19 07:36:01 1602 2

原创 从无到有算法养成篇-双向链表与双向循环链表

一、双向链表1、定义:从下图中的定义结点的代码我们能发现,双向与单向最明显的区别就是是否可以反向查找上一结点。定义2、创建:大致和单向的创建差不多,区别在于多了prior的处理步骤:1、*L 指向头结点2、新增数据:2.1.创建1个临时的结点2.2.为新增的结点建立双向链表关系① temp 是p的后继② temp 的前驱是p③ p 要记录最后的结点的位置,方便下一次插入创建新链表3、插入:步骤:1. 插入的位置不合法 为0或者为负数2.

2020-10-19 07:33:46 1007

原创 产品运营必须知道的几个概念,如何进行用户转化?

前几期,我们根据GA报表的逻辑从了解网站用户群体特征开始,到这些用户是通过什么渠道进入自己的网站,然后进入网站后又有什么样的交互,逐渐地了解自己的网站。那么最后,就是我们最最关注的转化问题。不管你是什么岗位,产品、运营、推广等,转化率都是你的重点关注对象。因为转化率是网站最终能否盈利的核心之一,提升网站转化率是网站综合运营实力的结果,你之前做的一切都是为了最后的转化。GA转化模块分为目标、电子商务、多渠道路径、归因四大板块,接下来一一讲述四大板块的作用。目标目标是指身为网站产品或者是运营

2020-10-18 07:17:08 1867

原创 Tableau 必知必会之使用环境的配置需求

最近很多用户问:Tableau 对硬件及系统的要求高吗?可不可以给我一些配置建议呢?其实,任何软件对所使用的环境都是有要求的,配置当然是越高越好。可是,如果使用过于高的配置,只会白白浪费企业的预算,杀鸡焉用牛刀?那么,究竟 Tableau 需要的环境配置是什么呢?这里,我们将分四部分,来详述 Tableau Desktop、Tableau Server、Tableau Reader和浏览器的配置需求。一、Tableau Desktop 配置需求操作系统/虚拟环境- Micros.

2020-10-18 07:16:21 2168

原创 产品运营必须知道的几个概念,什么是用户群体?

大家在做营销或者是项目的时候,是否有遇见过不知道如何开始的情况?无论是做电商或者是其他行业,每一个项目开始之前我们都应该做好准备。不仅为了和其他部门对接时撕逼更有底气,更主要是为了自己项目有成果。怎么样合理的分析网站的情况,又应该去遵循一个什么样的逻辑呢?首先,我们应该想清楚为什么要去看这些数据,明确自己的目的。其次我们应该了解自己的用户群体,这些用户又是通过什么样的渠道进入网站,进入网站后又是在什么地方和网站产生了交互,交互后产生了什么样的价值。最后,我们应该怎么运用这些数据。其实简单可以用一张图来展

2020-10-17 07:36:09 2585

原创 tableau必知必会之拖拽功能失效是怎么回事

大家反馈的问题如上图所示,可以发现,原本正常的拖拽功能失效了。数据粉们别着急,这不是 Bug。首先,我们来看一下你可能遇到的拖拽失效的几种情况:一、维度、度量无法拖入标记卡二、维度、度量无法拖入行列功能区三、无法通过拖曳功能快捷创建分层结构四、无法在计算字段编辑对话框中通过拖曳度量来编写公式常见原因 & 解决对策如果你遇到上述的几种拖拽失效的情况,可通过以下几种方法进行设备自查并解决:一、是否使用录屏软件常见原因:...

2020-10-17 07:34:54 2287

原创 从无到有算法养成篇-利⽤栈思想解决问题

一、什么时候用到栈思想?栈的思想应⽤数据是线性的,问题可以利⽤栈的特性先进后出去解决问题!二:思想实战1.括号匹配检验:假设表达式中允许包含两种括号:圆括号与⽅括号,其嵌套顺序随意,即() 或者[([][])]都是正确的.⽽这[(]或者(()])或者([()) 都是不正确的格式. 检验括号是否匹配的⽅法可⽤”期待的急迫程度"这个概念来描述.例如,考虑以下括号的判断: [ ( [ ] [ ] ) ]思路:s1:遍历data,遍历内做s2、s4、s5操作,遍历完进行s6操作;s2:取.

2020-10-16 08:33:20 1006

原创 Tableau必知必会之妙用Fixed函数聚合分析维度

最近,很多零售行业的用户反馈了一个共同的问题:我们有很多的门店和商品。不同大类的商品,按照不同属性又会分为很多的小类。在做销售分析的时候,我只想看某些门店或商品大类的销售额,但在大类的后面会有子类别信息。有办法可以在不去掉子类别的情况下,方便的查看大类吗?确实,例如下图,你只想看办公用品的销售额,但后面子类别和产品名称却会影响你查看大类数据。如果你只想看大类的数据情况,但又不想去掉子类别,有一个函数可以帮你解决这个问题,它就是:Fixed。利用Fixed函数,可以在不去掉子类别的前提下,

2020-10-16 08:32:13 3973

原创 Word2Vec ——gensim实战教程

最近斯坦福的CS224N开课了,看了下课程介绍,去年google发表的Transformer以及最近特别火的Contextual Word Embeddings都会在今年的课程中进行介绍。NLP领域确实是一个知识迭代特别快速的领域,每年都有新的知识冒出来。所以身处NLP领域的同学们要时刻保持住学习的状态啊。笔者又重新在B站上看了这门课程的第一二节课。这里是课程链接。前两节课的主要内容基本上围绕着词向量进行。所以这篇文章笔者想简单的介绍一下词向量,以及如何利用python的gensim训练一个自己的词向量。

2020-10-15 08:10:46 1169

原创 Tableau必知必会之巧用 Index 函数查看数据类别详情

日常工作中,对业务数据进行分析,不只要知道总体情况。某些时候,通过查看数据类别详情,可以更容易找到问题所在。但是,想要直观的查看数据类别详情,也不是一件简单的事情。刚开始,我很难让产品的类别、子类别、产品名称同时清晰的出现在同一张工作表上。后来,我发现:当类别比较少的时候,下面的这种条形图也可以呈现数据类别详情。可是,一旦类别非常多,就需要另辟蹊径了。大量类别存在的情况,相对于条形图,下面这种散点图的呈现会更直观:能清晰的看到每个大类别下,精确到每种产品名称的销售情况(每个点代表一个

2020-10-15 08:08:57 1687

原创 如何阅读英文文献,有哪些高效的方法或者辅助工具?

目录1.如何阅读英文文献,有哪些高效的方法或者辅助工具?2.评判聚类效果好坏的指标是什么?3.有git的入门资料推荐么?如何阅读英文文献,有哪些高效的方法或者辅助工具?1.方法先是通读文献综述(理解专业术语和基本概念),起初时应以泛读为主;再研读自己研究领域的经典论文50篇+;确定研究方向之后,要以精读为主,要做到边读文献边做笔记,尤其是在文献中遇到的疑惑点(可以查看参考文献)做出Hightlight标记,因为这些疑惑点将是...

2020-10-14 09:09:09 1869

原创 深度学习核心技术精讲100篇(十一)-Google利器超强特征提取网络(Transformer)

谷歌于2017年提出Transformer网络架构,此网络一经推出就引爆学术界。目前,在NLP领域,Transformer模型被认为是比CNN,RNN都要更强的特征提取器。Transformer算法简介Transformer引入了self-attention机制,同时还借鉴了CNN领域中残差机制(Residuals),由于以上原因导致transformer有如下优势:模型表达能力较强,由于self-attention机制考虑到了句子之中词与词之间的关联, 抛弃了RNN的循环结构,同时借用了CN

2020-10-14 08:35:46 1419

原创 Tableau必知必会之用 Page 功能创建你的动态视图

其实,类似的动态图就是让图表像动画一样播放,让数据变得有生命,适合趋势性分析。当我们要分析很多数据点之间的相关性时,使用动态图功能来观察一系列视图的连续变化会比盯着一整幅视图去分析更有效,也更易看清数据点之间的关联。那么,如何创建一个动态视图呢?这里,我们需要用到Tableau的Page 功能。为方便学习,我们使用Tableau自带的超市数据。具体步骤如下:一、创建播放菜单Tableau要使用动态播放功能,需要将视图基于某个变化的字段拖放至 页面 框中。按住 Ctr...

2020-10-14 08:33:58 1442

原创 见光死怎么办?如何提升用户对网站的好感,提升转化?

不知道大家有没有过面基的经历?如果有的话,相信大家都希望自己能在面基的时候给对方留下一个好的印象。因为一旦给对方留下一个好印象,那么接下来的相处都会变得轻松,愉悦;相反如果第一次见面就给对方留下了不好的或者一般的印象都有可能导致后面的故事提前结束。其实,网站或者APP对于新用户来说都算是一次面基的经历。推广或者免费渠道帮你们获得了新用户,获得了流量,但是网站的着陆页或者APP的启动页,首页没有获得流量的好感。那他们来了,又走了,然后你还想有故事吗?不存在的…那么,有什么办法可以提升用户对网站的好

2020-10-13 08:44:04 1013

原创 技术面试时该反问面试官什么问题?小伙整理了灵魂50问,GitHub日入2500星

看了那么多技术类岗位面试攻略,好不容易到了最后一步。部门leader/HR反问一句:你还有什么要问我的?没有问题,略显尴尬,显得你对这份工作不上心。如何问出水平,问出更多信息,加强自己对工作的理解就很重要了。但Leetcode里好像没有这些呀?于是,一位叫viraptor的小哥,整理了一份求职反问手册,从岗位职责、基础设施、团队情况、公司技术发展、公司变现途径、是否坐班、办公室情况等角度,罗列了可问问题。不多不多,也就50个吧,保证你用起来绰绰有余……对于面试,程序员们有话说,有话问

2020-10-12 10:11:55 1293

原创 五分钟搭建一个基于BERT的NER模型

BERT 简介BERT是2018年google 提出来的预训练的语言模型,并且它打破很多NLP领域的任务记录,其提出在nlp的领域具有重要意义。预训练的(pre-train)的语言模型通过无监督的学习掌握了很多自然语言的一些语法或者语义知识,之后在做下游的nlp任务时就会显得比较容易。BERT在做下游的有监督nlp任务时就像一个做了充足预习的学生去上课,那效果肯定事半功倍。之前的word2vec,glove等Word Embedding技术也是通过无监督的训练让模型预先掌握了一些基础的语言知识,但是wo

2020-10-12 08:39:28 2025

原创 深度学习核心技术精讲100篇(二)-图网络中的社群及社群发现算法

导读:本文来自作者的学习笔记。主要讲解Graph中社群的概念,然后介绍了一种简单的社群发现算法Louvain Algorithm,最后提供可重叠的社群发现,提出BigCLAM算法,用来识别节点从属关系。01Granovetter's theory马克·格兰诺维特(Mark Granovetter,1943年10月20日-),美国社会学家,斯坦福大学教授。格兰诺维特是论文被引用最多的学者之一,根据 Web of Science 的数据,社会学论文被引数排名第一和第三的文章皆出自格兰诺维特之手。格兰

2020-10-10 09:09:34 2181

原创 MySQL 的 Binlog 日志处理工具(Canal/Maxwell/Databus/DTS)对比

Canal定位:基于数据库增量日志解析,提供增量数据订阅&消费,目前主要支持了mysql。原理: canal模拟mysql slave的交互协议,伪装自己为mysql slave,向mysql master发送dump协议 mysql master收到dump请求,开始推送binary log给slave(也就是canal) canal解析binary log对象(原始为byte流) 整个parser过程大致可分为几步: Connection获取.

2020-10-09 08:37:49 1269

原创 深度学习核心技术精讲100篇(二十一)-深入理解Dirichlet分布及过程

Dirichlet分布(Dirichelt Distribution)和Dirichlet过程 (Dirichlet Process)广泛应用于信息检索、自然语言处理等领域,是理解主题模型的重要一步。而且它作为一种非参数模型(non-paramatric model),和参数模型一样有着越来越广泛的应用。文本提供了一种对Dirichlet 过程的理解。本文适合了解高斯过程,对Dirichlet过程有一定了解,但又有些困惑的同学。希望读完这篇文章能进一步提升对Dirichlet的理解。随机过程粗略

2020-10-08 08:46:33 1640

原创 “加班文化“到底是如何流行起来的

说起互联网行业,大家最先想到的都是弹性工作制度,薪资诱人,夜宵福利,晚上报销打车费这些标签,但是作为一个扎根互联网行业的资深战士。我只想告诉大家,这些福利,都是在为互联网行业的陋习:“加班”,打着幌子。  容我给大家细细说来:    弹性工作制度分为两个部分:第一个部分是核心时间,就是所有员工都必须到岗的时间,另一部分是弹性时间,员工可以在这段时间自由选定上下班时间,弹性工作制度原意是减少工作人员的事、病假及迟到早退等现象,提高工作效率。但是,现在大部分的公司都是拿着鸡...

2020-10-07 07:47:54 1341

原创 深度学习核心技术精讲100篇(八)-keras 实战系列之深度学习中的多任务学习(Multi-task learning)

多任务学习(Multi-task learning)简介多任务学习(Multi-task learning)是迁移学习(Transfer Learning)的一种,而迁移学习指的是将从源领域的知识(source domin)学到的知识用于目标领域(target domin),提升目标领域的学习效果。 而多任务学习也是希望模型同时做多个任务时,能将其他任务学到的知识,用于目标任务中,从而提升目标任务效果。如果我们换个角度理解,其实多任务学习,其实是对目标任务做了一定的约束,或者叫做regulariza

2020-10-07 07:07:47 2185

原创 推荐算法矩阵分解实战——keras算法练习

当今这个信息爆炸的社会,每个人都会面对无数的商品,无数的选择。而推荐算法的目的帮助大家解决选择困难症的问题,在大千世界中推荐专属于你的商品。推荐系统算法简介这里简单介绍下推荐系统中最为主要的协同过滤算法,大致分为如下几类:基于用户的协同过滤(给用户推荐与他相似的人购买的物品) 基于商品的协同过滤(给用户推荐和他之前喜欢的物品相似的物品) 基于模型的协同过滤:关联算法,聚类算法,分类算法,回归算法,矩阵分解,神经网络,图模型以及隐语义模型都属于这个范畴。而本次实战使用的是矩阵分解算法。矩阵分

2020-10-06 09:11:54 1167

原创 难道是我洞悉了CSDN网站订阅专栏收益的秘密?带你看看网站专栏一天营收几何?

10月4号,当你们都在欢度国庆的时候,作为一个苦逼攻城狮,我还在默默滴加着班。唯一能让我老怀宽慰的是,一直默默耕耘的专栏订阅还能给自己每天加个鸡腿。但是,不知道是网站的开发国庆玩嗨了还是急着过节留下了一个大bug,我的订阅突然翻了几十倍,是不是很意外,是不是很惊喜,然鹅,这只是停留在纸面上的数字啊,废话不多说,上图我翻看了一下,这些订阅基本上是9月30号当天的订阅,难道是把整个网站当天的专栏订阅都统计给了我?不知道CSDN会不会补足我缺失的那个订阅金额64000,哈哈哈这个大bug就留给

2020-10-04 09:35:41 3082

原创 搜索功能:洞悉产品的绝佳入口

提到搜索功能,想必所有人都不会感到陌生。有关搜索功能的文章有很多,它们大多谈论的是搜索的方式,搜索结果的优化等。不过今天我们将从全新的角度来看待搜索,将它作为洞悉产品的绝佳方式,充分利用该功能,能够迅速得知一款产品的实力以及特点。搜索功能的诞生让用户更加简单的从庞大数据中找到自己所需要的,庞大的数据量并不是搜索功能必须的条件,但数据量偏少的情况下,设计搜索功能可能让用户体验变得更加糟糕,绝对是得不偿失的做法。对于数据量很大的产品,搜索功能将会为用户提供极大的便利。以人人都会接触到的电商..

2020-10-04 09:13:48 1108

原创 FastText情感分析和词向量训练实战——Keras算法练习

FastText是facebook开源的一个词向量与文本分类工具 ,其最大的优点就是快,同时不失精度。 此算法有两个主要应用场景:文本分类 词向量训练工业界碰到一些简单分类问题时,经常采用这种简单,快速的模型解决问题。FastText原理简介FastText原理部分有3个突出的特点:模型简单,其结构有点类似word2vector中的CBOW架构,如下图所示。FastText将句子特征通过一层全连接层映射到向量空间后,直接将词向量平均处理一下,就去做预测。 模型架构 使用了n

2020-10-02 08:59:38 1450

图机器学习峰会-6-5 基于图的视觉分类模型的可解释性.pdf

图机器学习峰会-6-5 基于图的视觉分类模型的可解释性.pdf

2022-07-05

图机器学习峰会-5-2 图神经网络与推荐预训练模型.pdf

图机器学习峰会-5-2 图神经网络与推荐预训练模型.pdf

2022-07-05

图机器学习峰会-3-6 Relational Reasoning with Rule Discovery.pdf

图机器学习峰会-3-6 Relational Reasoning with Rule Discovery.pdf

2022-07-05

图机器学习峰会-1-1 Graph Neural Networks for Learning Simulations.pdf

图机器学习峰会-1-1 Graph Neural Networks for Learning Simulations.pdf

2022-07-05

中国“互联网+”大学生创新创业大赛-(样本模板)“互联网+”大学生创新创业大赛项目计划书.zip

中国“互联网+”大学生创新创业大赛-(样本模板)“互联网+”大学生创新创业大赛项目计划书

2022-06-21

中国“互联网+”大学生创新创业大赛-(往届获奖项目)互联网+2018.zip

中国“互联网+”大学生创新创业大赛-(往届获奖项目)互联网+2018

2022-06-21

中国“互联网+”大学生创新创业大赛-(热点问题)首届中国“互联网+”大学生创新创业大赛热点问题解答.zip

中国“互联网+”大学生创新创业大赛-(热点问题)首届中国“互联网+”大学生创新创业大赛热点问题解答

2022-06-21

中国“互联网+”大学生创新创业大赛-(往届获奖项目)第三届中国“互联网+”大学生创新创业大赛全国总决赛获奖名单.zip

中国“互联网+”大学生创新创业大赛-(往届获奖项目)第三届中国“互联网+”大学生创新创业大赛全国总决赛获奖名单

2022-06-21

中国“互联网+”大学生创新创业大赛-(热点问题)第三届中国“互联网+”大学生创新创业大赛的新变化.zip

中国“互联网+”大学生创新创业大赛-(热点问题)第三届中国“互联网+”大学生创新创业大赛的新变化

2022-06-21

中国“互联网+”大学生创新创业大赛-(评审规则)第三届中国“互联网+”大学生创新创业大赛全国总决赛评审规则.zip

中国“互联网+”大学生创新创业大赛-(评审规则)第三届中国“互联网+”大学生创新创业大赛全国总决赛评审规则

2022-06-21

中国“互联网+”大学生创新创业大赛-(热点问题)第三届互联网+创新创业大赛.zip

中国“互联网+”大学生创新创业大赛-(热点问题)第三届互联网+创新创业大赛

2022-06-21

中国“互联网+”大学生创新创业大赛-(大赛通知)关于对第三届中国“互联网+”大学生创新创业大赛“的实施方案.zip

中国“互联网+”大学生创新创业大赛-(大赛通知)关于对第三届中国“互联网+”大学生创新创业大赛“的实施方案

2022-06-21

中国“互联网+”大学生创新创业大赛-(评审规则)第二届中国“互联网+”大学生创新创业大赛全国总决赛评审规则.zip

中国“互联网+”大学生创新创业大赛-(评审规则)第二届中国“互联网+”大学生创新创业大赛全国总决赛评审规则

2022-06-21

互联网+商业计划书样本-智能移动网络--中科智达.商业计划书.zip

互联网+商业计划书样本-智能移动网络--中科智达.商业计划书

2022-06-21

互联网+商业计划书样本-数据管理--SaaS领域70万用户【超级表格】Pre-A轮商业计划书.zip

互联网+商业计划书样本-数据管理--SaaS领域70万用户【超级表格】Pre-A轮商业计划书

2022-06-21

互联网+商业计划书样本-人工智能导购--豆扣网商业计划书.zip

互联网+商业计划书样本-人工智能导购--豆扣网商业计划书

2022-06-21

互联网+商业计划书样本-互联网医疗--医云互动商业计划书.zip

互联网+商业计划书样本-互联网医疗--医云互动商业计划书

2022-06-21

互联网+商业计划书样本-互联网美学服务--鲁班艺术.商业计划书.zip

互联网+商业计划书样本-互联网美学服务--鲁班艺术.商业计划书

2022-06-21

互联网+商业计划书样本-互联网健康管理--主动式老年健康管理商业计划书.zip

互联网+商业计划书样本-互联网健康管理--主动式老年健康管理商业计划书

2022-06-21

互联网+商业计划书样本-工程咨询行业的京东-易前期网商业计划书.zip

互联网+商业计划书样本-工程咨询行业的京东-易前期网商业计划书

2022-06-21

图机器学习峰会-6-5 基于图的视觉分类模型的可解释性.zip

图机器学习峰会-6-5 基于图的视觉分类模型的可解释性

2022-07-05

图机器学习峰会-5-2 图神经网络与推荐预训练模型.zip

图机器学习峰会-5-2 图神经网络与推荐预训练模型

2022-07-05

图机器学习峰会-Graph4NLP:A Library for Deep Learning on Graphs for NLP

图机器学习峰会-3-1 Graph4NLP:A Library for Deep Learning on Graphs for NLP

2022-07-05

图机器学习峰会-2-5 复杂认知图神经网络及其应用.zip

图机器学习峰会-2-5 复杂认知图神经网络及其应用

2022-07-05

图机器学习峰会-2-1 复杂图上的机器学习研究.zip

图机器学习峰会-2-1 复杂图上的机器学习研究

2022-07-05

图机器学习峰会-2-3 You are AllSet!超圖GNN的新視角.zip

图机器学习峰会-2-3 You are AllSet!超圖GNN的新視角

2022-07-05

图机器学习峰会-1-6 深度图卷积神经网络模型探索.zip

图机器学习峰会-1-6 深度图卷积神经网络模型探索

2022-07-05

图机器学习峰会-1-1 Graph Neural Networks for Learning Simulations.zip

图机器学习峰会-1-1 Graph Neural Networks for Learning Simulations

2022-07-05

图机器学习峰会-1-2 Fairness and Explainability in Graph Learning.zip

图机器学习峰会-1-2 Fairness and Explainability in Graph Learning

2022-07-05

图机器学习峰会-8-3 表征学习及其在药物研发上的应用.pdf

图机器学习峰会-8-3 表征学习及其在药物研发上的应用.pdf

2022-07-05

图机器学习峰会-3-7 基于图表征学习的跨领域情感分析方法.pdf

图机器学习峰会-3-7 基于图表征学习的跨领域情感分析方法.pdf

2022-07-05

图机器学习峰会-Translation between Molecules and Natural Language

图机器学习峰会-Translation between Molecules and Natural Language

2022-07-05

图机器学习峰会-3-4 基于事件图结构的文本-视觉理解.pdf

图机器学习峰会-3-4 基于事件图结构的文本-视觉理解.pdf

2022-07-05

图机器学习峰会-Graph4NLP:A Library for Deep Learning on Graphs for NLP

图机器学习峰会-Graph4NLP:A Library for Deep Learning on Graphs for NLP

2022-07-05

图机器学习峰会-2-4 集成多关系图神经网络.pdf

图机器学习峰会-2-4 集成多关系图神经网络.pdf

2022-07-05

图机器学习峰会-2-3 You are AllSet!超圖GNN的新視角.pdf

图机器学习峰会-2-3 You are AllSet!超圖GNN的新視角.pdf

2022-07-05

图机器学习峰会-1-6 深度图卷积神经网络模型探索.pdf

图机器学习峰会-1-6 深度图卷积神经网络模型探索.pdf

2022-07-05

图机器学习峰会-1-5 分布外鲁棒图学习的一些新进展.pdf

图机器学习峰会-1-5 分布外鲁棒图学习的一些新进展.pdf

2022-07-05

图机器学习峰会-Beyond Homophily in Graph Neural Networks

图机器学习峰会-Beyond Homophily in Graph Neural Networks

2022-07-05

图机器学习峰会-1-2 Fairness and Explainability in Graph Learning.pdf

图机器学习峰会-1-2 Fairness and Explainability in Graph Learning.pdf

2022-07-05

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除