自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

李博Garvin的专栏

云厂商人工智能平台产品经理

  • 博客(363)
  • 资源 (40)
  • 论坛 (8)
  • 收藏
  • 关注

原创 谈谈AI的ToB市场,我的新书《B端产品经理修炼手册》正式出版

2020年是特殊的一年,得益于这次疫情,在2月份有一个大长假,当时被封锁在东北老家的小出租屋内,于是就起笔开始写这本书,其实也是在心理早就有构思的,差不多用了十来天的时间完成了第一版。名字想了好久,最终选定叫《B端产品经理修炼手册》。这本书跟我的第一本书区别挺大的,第一本《机器学习实践应用》是站在工程师的角度思考如何将算法应用于业务中去。这本新书,其实是站在市场的角度,讲的是如何以市场的视角去构建一个AI产品。这本书的内容的本质来源于这8年,我在做AI相关的创业以及AI平台产品经理过程中的思考,商业模式、产

2021-01-16 09:35:33 94

原创 20行代码实现电影评论情感分析

背景情感分析有很多的应用场景,比如做一个电商网站,卖家需要时刻关心用户对于商品的评论是否是正面的。再比如做一个电影的宣传和策划,电影在键盘侠们中的口碑也至关重要。互联网上关于任何一个事件或物品都有可能产生成千上万的文本评论,如何定义每一个文本的情绪是正面或是负面的,是一个很有挑战的事情。挑战体现在以下几个方面,区别于结构化数据,评论数据的长短不一,很难限定到固定的维度。另外很难通过某个词判断用户的...

2018-03-09 09:33:17 9944 10

原创 用深度学习做球星颜值打分完整案例(一)

已经上传了完整的代码和数据,数据比较少,大家可以帮忙补充。项目地址(记得给个start):https://github.com/jimenbian/face_rank先来说一下项目的背景,这次做的是一个最基础的图像识别案例,通过训练一个模型来给NBA球星的颜值打分,嗯,楼主麦迪、艾弗森球迷。选择NBA的数据是因为,NBA球星都有正装照,比较好收集。我们最终呈现的效果是这样的:先收集球星大脸照,标记

2018-01-18 09:32:27 4604 2

原创 深度学习RNN实现股票预测实战(附数据、代码)

背景知识最近再看一些量化交易相关的材料,偶然在网上看到了一个关于用RNN实现股票预测的文章,出于好奇心把文章中介绍的代码在本地跑了一遍,发现可以work。于是就花了两个晚上的时间学习了下代码,顺便把核心的内容翻译成中文分享给大家。 首先讲讲对于股票预测的理解,股票是一种可以轻易用数字表现律动的交易形式。因为大数定理的存在,定义了世间所有的行为都可以通过数字表示,并且存在一定的客观规律。股票也不例外

2017-12-23 17:01:02 60600 35

原创 为什么要写《机器学习实践应用》这本书

预售地址: https://item.jd.com/12114501.html历经了10个月,《机器学习实践应用》这本书终于面世了。首先呢,因为我的工作比较忙,只能抽一些周末或者是下班以后的时间进行写作,另外书的发布流程是一个漫长的过程。所以当这本书出版的时候,我感到熟悉又陌生,熟悉是因为书中的内容经过了多次校对已经印到我的脑子中了,陌生是距离刚开始写这本书已经过去接近一年,对于当时的状态有一些陌

2017-07-03 08:59:56 7887 5

原创 拿到大厂产品经理offer的应届生都是什么水平?

过完年又到春招了,作为应届进入大厂的产品经理答一波,最近几年每年也会负责应届生的面试。从学历、实习经历、能力这三方面聊一聊。1.学历基本上大厂的产品经理应届生的学历都是相对出色的,底线应该是普通211学校,上限就上不封顶了,PHD或者清北的都有。专业的话一般ToC的产品对于专业没有太大的要求,ToC更看重行业经历和能力。但是ToB的话因为要做客户服务,一般会要求是对口专业,比如计算机、通信、工业设计等。学位的角度,我自己的感觉,从招聘者看,我肯定希望要在学校沉淀久一些的同学,比如硕士和博士,因为

2021-01-24 20:37:40 170 4

原创 阿里云计算平台招AI解决方案产品经理

候选人欢迎投递我的邮箱:594167264@qq.com团队介绍计算平台是阿里巴巴集团数据平台的基础技术设施,提供一站式数据采集、加工、分析、挖掘的平台服务,及完善的配套数据开发、数据管理工具,支持离线分布式计算、在线流计算、图计算、实时多维分析、机器学习、深度学习等多种业界领先的计算服务。对外支撑阿里云全套大数据服务,对内作为集团统一的数据仓库支撑阿里巴巴集团、蚂蚁金服、菜鸟的数据集市,是业界排名top的大数据服务平台。为了帮助客户更加高效地使用大数据产品,发挥数据价值,现招募AI产品经理,欢

2021-01-21 13:33:42 127

原创 AI新浪潮:截止2022年,全球74%的计算将来自端侧

根据Gartner的报告,今天91%的数据是在中心化的数据存储中心做计算。但是,截止到2022年,全世界74%的数据将在端侧进行分析和计算。有一种误解是边缘计算会取代云计算,相反,边缘+云计算的结合会是未来的主趋势,边缘计算甚至会进一步带动云计算的发展。把规模的数据计算一定是在云端处理,而与直接数据产生者相关的部分计算会被分配到端。接下来就具体分析下端侧计算的一些优势:1.数据隐私性个性化推荐等业务越来越被普遍应用到广大APP中,其本质是对用户行为数据的收集,并在云端进行统一分析。这种.

2021-01-20 15:39:18 68

原创 深度解析蔚来ET7自动驾驶技术

我个人是个汽车迷,每天都会看大量汽车相关的信息,最近蔚来发布了ET7这款车,看宣传是有机会实现L4自动驾驶,有不了解自动驾驶技术的同学可以看下以下信息:除了传统的依靠视觉模型做自动驾驶的实现以外,本次蔚来ET7也搭载了Aquila超感系统。也就是说ET7是包含了:视觉自动驾驶技术+雷达波自动驾驶技术。接下来分别聊下ET7在这两方面技术的一些功能点。视觉自动驾驶技术ET7搭载了4颗NVDIA Drive Orin芯片以及800万像素的摄像头,这两个硬件设备是视觉自动驾驶技术实现的根..

2021-01-12 22:10:56 3140 2

原创 来自过气科技网红的2020年终总结

今年过得很快,转眼又到了年终总结的时候了。今年是我写科技类文章的第8个年头,很有意思的是,之前在学生时代做过的很多能挣钱的创业项目都没坚持下来,写文章这件事却坚持下来了。虽然现在我的文章可能没法像以前那样登上CSDN首页,或者说入围知乎圆桌会议,再或者在微信号有几千的点击。但是每周记录下学习的内容,已经是我生活里的仅存的一份仪式感。2020年我感觉自己改变很大,主要体现在思想上。仿佛现在自己已经有点被社会磨平了棱角,当年还是个想改变世界的少年,现在每天看看股票、车什么的,已经过上了中年大叔的油腻生活。打

2020-12-31 21:27:27 302 1

原创 AutoGL:浅谈未来非常有前景的自动图机器学习相关概念

最近一年图神经网络网络的概念很火,也有很多相关的工作诞生。今天重点介绍下AutoGL,也就是Auto Graph Learn方面的基础概念。首先还是说下图计算和之前传统的非图类结构化数据计算的区别。Graph建模的特点以推荐系统为例,传统的结构化数据,其实比较好的描述的场景是user对item的单点关系,比如user A买了一个item B,那么可以把A和B的特征通过表的形式展示出来:A_f1 A_f2 B_f1 B_f2 label -- -- --

2020-12-27 11:33:46 296

原创 比SkLearn更好用的机器学习工具-PyCaret

今天试了试pycaret这个机器学习库,感觉简直是个建模宝藏啊,从数据预处理、特征工程、建模、自动优化、模型部署,所有功能基本全部覆盖。它的原理大概就是封装了Sklearn,XGBoost,LightGBM,Spacy,Shap,PyOD,Gensim,WordCloud等工具,几乎包括机器学习所有的使用场景和方法(不含深度学习)。异常检测Anomaly Detection,关联规则Association Rules,分类Classification,回归Regression,聚类Clustering,自然

2020-12-20 17:22:28 2015 5

原创 特征训练、预测一致性管理工具:开源项目Feast

在机器学习的流程大体可以分成模型训练和模型服务两个阶段。无论是训练和服务阶段,其实都需要进行特征工程相关的工作,这块的技术挑战就是如何保证训练和预测过程中使用的特征是一致的。这个问题困扰了很多机器学习从业者,比较典型的场景就是推荐场景。在推荐业务中往往要用离线数据做特征工程然后输入到算法中训练生成推荐模型,在实际业务侧也需要按照同样的特征样本拼接方式生成预测样本,输入给模型做实时预测并拿到推荐结果。今天要介绍的Feast其实是一个特征管理工具,他通过一套封装好的sdk保证了Model Serving和M

2020-12-11 19:22:09 152

原创 AWS re-Invent最新发布AI产品解析:场景为王

看了最近的re-Invent大会,会上AWS像以往一样发布了很多新的东东,今年的发布与往年发布有一个很大的不同点,往年更多地发布一些产品,今年发布的内容更多是“解决方案+产品”的结合体。我个人一个非常深的感触就是,当国内厂商还在发布牛逼技术的时候,AWS已经开始发力行业解决方案类产品了。“市场很公平,一定会选择真正尊重它的玩家。”回过头来看今年发布的几款产品,仔细想想其背后的技术,感觉没有特别出人意料的,但是这几款产品充分暴露AWS在AI方面的思考,场景为王,深入行业,接下来一一介绍一下。Dev

2020-12-06 10:16:28 3270 1

原创 浅谈用户营销模型AIPL

进入互联网下半场,由于人口红利带来的流量越来越珍贵,作为C端厂商,获取流量的成本变的越来越高,如何经营好已有的流量变的关键。在经营用户方面有个例子我觉得特别有意思,小时候东北家家都爱吃大酱,有一个牌子的大酱特别有名,但是有一天在市场上突然买不到这个大酱了,后来听说是厂子爆炸了。但是过了一年,这个大酱再次上市,销量并没有受到太大影响,原因是这个牌子的大酱早已深入人心,他的核心资产并不是自己的大酱,而是他的用户群。那如何经营已有的客户呢?非常关键的一点是构建营销模型,将客户分层,今天介绍下业内的一款经典

2020-11-27 13:46:17 410

原创 推荐业务多目标建模算法介绍:MMOE、OMOE、Shared-Bottom

在推荐业务中经常有“既要、也要、还要”的场景,比如做视频推荐业务的时候既要提升用户对于视频的点击率,也希望同时提升用户观看视频的时长。面对这样的诉求,通常需要在推荐系统中使用多目标建模算法。多目标建模目前业内有两种模式,一种叫Shared-Bottom模式,另一种叫MOE,MOE又包含MMOE和OMOE两种。MMOE也是Google提出的一套多目标学习算法结果,被应用到了Google的内部推荐系统中,接下来分别介绍下这些多目标算法的结构。算法结构介绍上图基本能把Shared-Bottom、O

2020-11-23 17:29:55 240

原创 浅谈字节最新开源联邦机器学习平台Fedlearner

最近联邦机器学习越来越火,字节也正式对外宣讲开源了联邦机器学习平台Fedlearner。这次头条开源的Fedlearner与我之前分析过得华为、微众的联邦机器学习平台有什么不同呢?主要体现在以下几个方面: 产品化:Fedlearner的代码里有大量的js、Html模块,也是第一次让我们可以直观的看到联邦机器学习平台大概是什么样的,如果做成产品需要长成什么样。 业务多样化:之前华为、微众更多地强调联邦机器学习在风控业务的落地。头条开始强调联邦学习在推荐、广告等业务中的落地,并且给了很明确的数据

2020-11-09 19:14:00 851 1

原创 通过AI技术研究网红对其粉丝的消费品牌意识的影响

网红伴随着现在各种自媒体、直播平台的兴起已经越来越多的开始影响我们的生活。网红经济同时也成为一种新的商家品牌曝光的平台,像我平时也会买李子柒螺蛳粉这样的网红带货产品。但是网红究竟是如何影响粉丝的呢?最近看到一篇论文,通过AI技术详细介绍了网红是怎么对粉丝的消费品牌意识产生影响的。这篇论文叫做<The effects of visual congruence on increasing consumers’ brand engagement: An empirical investigation of

2020-11-04 21:17:03 148 1

原创 浅析神经协同过滤NCF在推荐系统的应用

NCF在推荐领域应用背景CF,也就是协同过滤,在推荐领域有极其广泛的应用,应该没有谁的智能推荐系统是没用到过CF的。CF其实就是挖掘user和item的交互关系,然后生成I2I或者U2I表示向量。传统的CF从数学角度上还是偏行为统计计算的,没有用到很复杂的网络。因为深度学习很火,也是有一些关于Neural Collaborative Filtering的工作。今天介绍一下最近看的叫《Neural Collaborative Filtering》这篇论文。也有一个对应的开源项目,地址:https://

2020-10-17 21:47:02 130

原创 利用TensorFlow2.0为胆固醇、血脂、血压数据构建时序深度学习模型(python完整源代码)

背景数据描述胆固醇、高血脂、高血压是压在广大中年男性头上的三座大山,如何有效的监控他们,做到早发现、早预防、早治疗尤为关键,趁着这个假期我就利用TF2.0构建了一套时序预测模型,一来是可以帮我预发疾病,二来也可以体验下TF2.0的特性。先来看下数据结构: date表示的是测量日期 cholesterol代表胆固醇数值 blood_fat代表血脂 blood_pressure代表血压 整个的建模思路就是将这三个数值一起构建时序模型,因为这三个指标不能独.

2020-10-07 12:16:06 1177 2

原创 2020互联网校招薪资列表及谈薪注意事项

(以上列表来自网友收录,仅供参考)校招生谈薪要注意以下几点:1.公司是否提供五险一金,以及缴纳比例很多小公司是不交五险一金的大家一定要注意,另外缴纳比例一定要问,12%是最上限,有些公司只给缴纳6%左右,这样里外里会少很多保障2.不要光看月薪,要看薪资月份一般工资包含月薪和年终奖,年终奖的月份数是很关键的,一般公司都会提供2个月以上的薪资作为年终,所以年终奖的月数是要考虑的3.期权是否是废纸有的公司会提供期权来充当部分年薪,这种公司一定要小心。有的公司的期权...

2020-10-07 11:20:51 15763 20

原创 解析:IEEE批准首个联邦机器学习框架标准

最近1个多月内出现了一个可能对后续人工智能行业有着深远影响的事件,现在这件事件还没有发酵起来,是因为联邦学习还没有真正步入企业生产行列。这个事件就是IEEE批准了国际首个联邦机器学习框架标准。《IEEE Approved Draft Guide for Architectural Framework and Application of Federated Machine Learning》这个标准的介绍文档大家可以在这里去买:https://www.techstreet.com/ieee/stan

2020-09-29 20:21:01 628

原创 浅谈湖仓一体化对上层机器学习业务的促进

背景概述最近湖仓一体化的概念在大数据圈子突然蹿红,知乎上很多大神已经分析了湖仓一体化主要的革新点,今天主要介绍下湖仓一体化对机器学习业务的影响。还是简单讲下“湖”和“仓”的区别。湖有点像一个开放的储物空间,可以存放结构化数据、非结构化数据、半结构化数据,存储成本很低,很灵活。仓更像是一个有无数小格子的储物间,所有数据需要按照要求放到小格子里。湖的优势是很灵活,什么样的数据直接扔进去就好了,但是如果想查某个结构化数据,甚至做ETL工作,就会效果很差,因为所有数据都是随机摆放的。仓的优.

2020-09-19 22:08:38 246

原创 解析KDTCN:知识图谱和深度学习模型联合实现股票预测

背景概述今天看了一篇论文我觉得挺有意思,一方面是讲的股票预测相关,另一方面是把深度学习和知识图谱相结合解决一个问题。通常知识图谱和深度学习很少有交集,一般是独立发展的两个人工智能领域解决问题的手段,两者如何一起解决问题呢?这个也引发了我的好奇心,因为一直对知识图谱这个领域念念不忘,在《机器学习实践应用》最后一章还要特意加入知识图谱的内容。论文的名字叫:<Knowledge-Driven Stock Trend Prediction and Explanation via Temporal Co

2020-09-12 16:51:10 308 1

原创 黄金价格预测:如何将时序数据处理成监督学习数据

背景概述今天介绍下如何将时序数据处理成监督学习可用的训练样本。比较典型的场景是黄金的原始数据,一般黄金走势数据是由两个字段组成,分别是时间字段和价格字段。走势图如下:顺便安利一个黄金数据的下载网址:https://fred.stlouisfed.org/series/GOLDAMGBD228NLBM数据滑动窗口原理那这种时序数据如何转换成包含特征和目标列的监督学习训练样本呢?今天介绍一个叫“数据滑动窗口”的方法。在数据滑动窗口这个方法中,把当前日期叫做t,前一天是t-1,后一

2020-09-08 10:55:58 741

原创 微信公众号文章质量评分算法详解

作为一个多年的微信公众号作者,了解微信公众号文章打分的机制是十分有必要的。微信在后台其实有一整套的打分机制,今天基于腾讯的这篇Paper《Cognitive Representation Learning of Self-Media Online Ariticle Quality》为大家介绍下文章质量打分背后的算法理论。在这篇paper中其实重点分享了两个方面,一方面是文章质量分的深度学习模型设计方法,另一方面是训练数据的构造法。1 文章质量分模型架构设计方法整个模型的设计分为两层,第一层是

2020-08-25 17:16:21 1110

原创 开源在线机器学习Online Learning/Incremental Learning库-creme介绍

最近在学习实时机器学习或者说增量学习相关的内容,目前中文资料相关的介绍非常少,今天借着creme这个库介绍下Online Learning的原理,以及Online Learning和Batch Learning的一些区别。1 Online Learning和Batch Learning的区别Batch就是目前常用的计算模式,需要离线数据,离线训练,离线评估,然后上线。离线的好处就是比较稳定,可以用大的数据量去训练和评估,如果模型效果不好也方便替换。OnlineLearning更多地是一个实时

2020-08-13 19:51:29 448

原创 详解下一代神经网络-无监督对比学习框架SimCLR

背景今天介绍下SimCLR,也是Hinton老爷子在今年提出的工作。首先介绍下为什么下一代神经网络需要无监督对比学习。目前整个人工智能行业的落地,其实都依赖于监督学习模式,无论是OCR、ASR、TTS、ImageDetection,如果没有大量的标注,是很难训练出商业化程度的模型的。这个模式需要被打破,因为世界上存在太多的未知场景,完全依赖人肉标注是不行的。所以未来无监督学习大势所趋。其实在这方面之前已经有了一些工作,比如Bert模型,就可以基于大量的unlabeled数据训练,然后在小...

2020-08-09 20:09:11 1418 2

原创 浅析人类最贵、最大的机器学习模型GPT-3及背后隐含的商业逻辑

GPT-3一诞生就成了业内议论的焦点,因为这个模型大概是目前人类历史上最大且最贵的机器学习模型。究竟有多大呢,这个模型有1750亿余个参数,虽然OpenAI没有开源这个pre-train的模型,但是可以预估模型体积在700G左右。这是什么概念,就是假设OpenAI把这个模型放出来开放下载,也很少有机构有能力让这个模型serving起来。那这个模型有多贵呢,训练它用了3640petaflops-day,相当于每秒钟做千万亿次浮点运算,计算了3640天。约等于500个A100卡算1个月,实际消耗的计算资

2020-08-05 17:37:06 1896 1

原创 浅谈最广泛应用的金融风控算法-评分卡

背景信用是一切社会金融体系的根本,有了每个人的信用我们才可以进行放贷、共享充电宝、共享单车等业务。如果可以准确的给每个社会成员的信用做一个打分,将对金融业务的推进有很大作用,很多相关业务的企业也在探索如何实现信用分。目前业内最通用的方案是评分卡算法,这个算法底层其实就是简单地二分类模型,将逻辑回归或者xgboost进行封装。但是为什么不能直接使用xgboost甚至深度学习算法做信用评估呢?因为金融业务有自己的特殊性,要求模型需要有强解释性,所以评分卡解决方案经常包含分箱和评分两个模块。就是.

2020-08-03 20:26:57 1028 1

原创 详解TF-Ranking:Google开源的排序框架,应用于邮件检索、推荐系统等场景

今天分享的是一个有关LTR框架的介绍,LTR是Learning-To-Rank,解决的是排序问题。排序问题在人工智能领域应用很广,比如在Gmail里搜索一个关键词,返回最匹配的邮件。再比如进入Google Drive后的一些文章推荐。傲海的分享主要参考Google2019年发布的一篇论文《TF-Ranking:Scalable TensorFlow Library for Learning-to-Rank》,蛮长的,看了小一周才学习完。这个库已经开源了,大家可以在下方地址访问并使用:https://

2020-07-26 11:24:16 667

原创 Google AutoML最新技术解析:AutoML-Zero,从0构建模型

AutoML是我一直很关注的领域,也实际设计过相关的很多功能,但是目前AutoML在商业化层面落地的还不多。一个关键因素是AutoML现在在Feature生成或者调参方面有一些应用,但是这些应用更多地是建模的辅助。目前的AutoML技术很难实现从0构建一个算法。如果AutoML希望大规模的应用,一定要在NAS,也就是网络探索上有建树。这也是Google最新发表的这篇文章的原因,他提出AutoML-Zero,从零起步去构建算法。接下来作者会给大家分享下一些看法。定义算法生成的流程这篇论文比较有意思的一

2020-07-17 17:25:30 561

原创 最全推荐系统Embedding召回算法总结
原力计划

最近特别忙,工作日几乎没什么时间学习。平时攒了一堆推荐相关的文章,趁周末整体学习了一下。主要是参考了网上的一篇技术文章(迄今为止我看到的比较好的推荐Embedding总结)以及我自己的一些理解。​Embedding概念首先一些概念性的内容要科普下。推荐系统分召回和排序,召回为将每个用户找出他可能喜欢的物品的候选集,排序是对候选集按照用户的喜爱程度进行排序,最终得出给用户推荐的结果。在推荐系统的召回阶段,需要对每个用户和每个被推荐物品做数学层面的表示,目前比较主流的方法是通过向量,也就是Em.

2020-07-05 12:14:36 1714

原创 互联网男士穿搭推荐-2020年新版

本文仅限互联网行业。因为根据我混迹本行业多年的经验,大部分同学的穿搭都有待提升,特别是程序员。另外,因为互联网行业对于着装没有什么要求,所以本文以休闲服饰为主。所有介绍的品牌都是作者自己平时经常穿的牌子。不能帮大家变成潮男,可以让大家穿的稍微阳光点1 开篇首先,挑衣服就跟选基金一样,要先挑基金经理,然后买这个对应基金经理的基金就ok了。穿搭一定要先选品牌,选好自己喜欢的牌子,再挑这些牌子下的各种款式的衣服。另外,轻易不要网购,最好实体店购买。这样可以搭配同一家店的多件衣服,挑上身效果比较好的。而

2020-06-24 23:08:28 3125 2

原创 实操将TensorFlow模型部署成Docker服务化

背景深度学习模型如何服务化是一个机器学习领域工程方面的热点,现在业内一个比较主流的做法是将模型和模型的服务环境做成docker image。这样做的一个好处是屏蔽了模型对环境的依赖,因为深度学习模型在服务的时候可能对各种框架版本和依赖库有要求,解决运行环境问题一直是个令人头痛的事情。将模型通过docker服务化后意味着深度学习模型可以在各种环境使用,比如云端直接通过k8s调度拉起,或者在一些IOT领域,比方说一些智能摄像头也可以通过拉起镜像服务的方式使用模型。看来一些网上的资料,发现大.

2020-06-19 17:49:22 473

原创 浅谈主动学习(Active Learning)

1背景概述在机器学习领域有很多学习模式,比方说监督学习、半监督学习、强化学习、无监督学习等。平时大家接触比较多的一般都是监督学习,在监督学习里面,比方说要做个人和鱼的图像分类模型,假设有200张图片,那就需要把这200张样本都打好标记再训练。监督学习存在很多问题,比如最直接的一点,当样本打标成本很高的时候,比如要标记一个人脸,可能需要在图片上打上百个点,用监督学习很消耗资源。主动学习(Active Learning)很好地解决了这个问题,主动学习的本质是让训练样本的利用率最大化,今天就来介.

2020-06-18 17:25:08 542

原创 开源机器学习模型管理工具DVC介绍

算法工程师往往在使用算法的过程中要不断地调整参数去找到最好的效果,俗称“调参民工”。在不断的调参过程中,会产生各种各样的模型,如何记录好这些参数与模型效果对应的关系,往往另算法工程师很头疼。所以大家都在呼唤一款实用的模型管理工具,因为有了版本管理机制才能更好的做效果比对,甚至多人协同开发。今天就介绍一款开源的模型管理工具-DVC:https://dvc.org/doc/tutorials/get-started/experiments1模型版本控制的误区在设计模型版本管理功能的时候有一个误区,.

2020-06-05 18:23:41 700

原创 支付宝扫一下就能体验的深度学习模型

背景我们最近跟支付宝合作做了一款应用,挺有意思的分享给大家。这个产品好玩的一点就是把ToB产品赋予了ToC的属性,任何没有算法背景的同学,只要做简单的标记就可以生成一个图像相关的模型,拿支付宝扫下二维码就可以体验效果。不信拿出你的支付宝扫下这个二维码打开应用,然后在应用中扫下下面这个图你会发现图像模型自动的识别出了名为BANGO的小吃,并且在画面中框了出来,像下图这样,是不是很好玩。自己动手搞一个制作这样的一个模型只需要10分钟,最近公测免费,并且不需要任何算法背景.

2020-05-22 17:01:36 577

原创 独家解析英伟达最新GPU-A100对AI行业带来的影响

最近英伟达发布了最新GPU-A100,当我们先后经历了K系列、M系列、P系列、V系列之后,这一次的A系列发布又会带来哪些影响,未来行业的走势如何,新入行的同学究竟选择哪个领域入门比较合适。今天我将从3个方向为大家一一剖析, 计算力变强了,会给行业带来什么影响 计算力变便宜了,会给行业带来什么影响 英伟达的野心在哪里,对行业有什么影响 1 计算力变强的影响这次新的GPU在算力方面变强的幅度是比较夸张的,根据官方数据显示,在Bert模型的场景下,训练和预测都有大幅度的提升。

2020-05-16 17:42:41 964 1

原创 运筹学vs机器学习

在西方一些国家,运筹学是非常热门的一个领域,很多公司都会保留大量的运筹学专家。但是在国内,运筹学理论除了在考研中有一些声音,在企业的业务中的应用还不算多,特别是相比于算法工程师的数量,运筹学专业的从业者相对较少,后续随着工业数字化的提升,运筹学一定会成为热点业务交叉度运筹学研究的问题可以归纳为:“依照给定条件和目标,从众多方案中选择最佳方案。”所以也有人称之为最优化技术。机器学习研究的问题是如何从历史的经验数据,通过数据建模的方式生成经验模型。从业务角度来看,运筹学和机器学习有很大的交.

2020-05-14 19:48:08 616

android执行adb shell命令源码

android执行adb shell命令源码,亲测可用!

2014-02-18

JDBC数据库实现源码

具体使用方法可以看我博客中的关于数据库的介绍。

2014-04-11

android SQLite代码

android SQLite代码,使用介绍可以看我的博客-android SQLite数据库用法图文详解(附源码),have fun!

2014-03-27

android4.3系统截屏代码

这个必须看我的博客说明才能使用,因为使用步骤有点复杂。

2014-03-24

ndk jni实例源码

请结合我的博客讲解使用,亲测可用!http://blog.csdn.net/buptgshengod

2014-03-13

java策略模式源代码

对应我博客的策略模式的源代码,可以参见我的博客!

2014-02-06

android ocr配套英文语言包

android ocr配套语言包,使用请参见我的博客,have fun!

2014-01-27

android ocr-tess实例源码

android ocr的实例源码,用法请见博客。因为要自己加一些包,在评论前请确定认真阅读了相关博客内容,谢谢。

2014-01-27

android嵌入百度广告代码

android嵌入百度广告源代码,我的博客有讲解1

2013-11-08

cocos2d碰撞检测代码

碰撞检测源代码,自己写的亲测可用,在博客中讲的用法

2013-10-23

cocos2d粒子效果源代码

自己写的cocos2d粒子效果源代码,博客中讲了使用方法!

2013-10-21

Particle Designer 破解版

Particle Designer 破解版,亲测可用,我的博客讲了使用方法!

2013-10-21

cocos2d实现屏幕背景滚动

cocos2d屏幕滚动的源代码,自己写的确定可用,我的博客有详细介绍!

2013-10-20

cocos2d摇杆控制源代码

cocos2d的摇杆控制源代码,xcode5下运行,自己写的肯定可以运行!

2013-10-20

mac下TexturePacker破解版

mac下TexturePacker的破解版,亲测可用!

2013-10-16

vim配置文件

自己用的vimrc文件,是vim的配置文件,觉得好用,分享一下,里面有注释!

2013-09-09

TortoiseSVN

TortoiseSVN,比较主流的一款版本管理软件!

2013-09-06

wubi系统安装软件

wubi软件,我自己的ubuntu就是用这个安装的!Have fun!

2013-09-03

谁是卧底android源代码

保证绝对能用的谁是卧底android源代码。have fun!

2013-08-26

谁是卧底Axure模型以及android apk

谁是卧底Axure模型以及android apk,havefun!

2013-08-26

android翻转手机闹铃停止源码

开发的安卓应用,闹钟响的时候,旋转闹铃实现声音停止。

2013-08-23

校招信息爬虫源代码(有短信提醒功能)

能爬取校招信息并且短信提醒的爬虫源代码,不懂得可以看我的博客!Have fun!

2013-08-23

android重力感应实例代码

一款android重力感应源代码,里面有详细的讲解。

2013-08-23

百度应用统计功能sdk使用文档

百度移动统计 SDK(ANDROID)是百度官方推出的移动统计 SDK 在 ANDROID 平 台上的版本(以下简称 SDK)。SDK 的发行版本中包括 JAR 包、文档、示例以 及您正在阅读的用户手册。 以下使用<SDK_PATH>代表 SDK 包解压后的根目 录。  JAR 包:<SDK_PATH>/ANDROID_API.JAR,开发过程中导入 ANDROID 项目;  文档:<SDK_PATH>/ANDROID_DOC,提供开发帮助信息;  示例:<SDK_PATH>/ANDROID_DEMO,统计示例程序代码,帮助您迅速熟 悉 SDK 的使用方式;  用户手册:本文档。 如果阅读完还没有领会,请导入我们的 DEMO 实例到您的工程中,参考使 用。

2013-08-25

Mini U-NET

这个项目,几乎用到了所有c#常用的控件,是一套可以用来学习的完整代码,其中还有调用的百度地图api实例。

2013-08-20

sublime text2

自己在用的sublime text2,可替代记事本,比记事本好用很多

2013-08-14

个人网站模板

个人网站模板,非常的好用!谢谢大家

2013-08-14

github客户端

本人亲测能用的github客户端,欢迎大家下载试用。我的博客中配有使用说明。

2013-08-14

c#24点游戏

是自己写的24点游戏,我的博客中有教程可以看。可以用,可以联机,存储,希望对您有帮助!

2013-07-18

c#五子棋游戏源代码

一款用c#开发的五子棋游戏,可以实现局域网联机

2013-07-11

c#计算器源代码

用c#写的有界面的计算器,可以实现string到数值的转换

2013-07-11

c#局域网通信聊天源代码

c#实现的局域网互通聊天软件,亲测可用,内附server以及client 的源代码

2013-07-11

c#上机考试题

c#上机考试题.里面有24点游戏的要求,还有一些相关的题目

2013-07-11

email系统python

用python语言开发的email系统,可以用来学习。内附源代码

2013-07-12

贪食蛇游戏-c

贪食蛇游戏,内涵全部c语言源代码.可以使用

2013-07-12

五子棋游戏

五子棋游戏,使用的是c语言,想用就来下吧,一分很便宜。

2013-07-12

android email系统

android email系统,使用的是java语言开发,可以下载学习!

2013-07-12

语音质量评估系统(含源代码)

基于KPI/KQI的语音质量评估系统,用java语言在eclipse上编写,上面有详细的代码说明,谢谢!

2013-06-25

VS2010使用教程及下载地址

VS2010使用教程及迅雷下载地址,本资源是word版本很详细

2013-02-02

通信原理教程

北邮的通信原理教程,对学习通信原理.及相关的编程很有帮助

2013-01-23

李博Garvin的留言板

发表于 2020-01-02 最后回复 2020-04-07

关于多线程的问题

发表于 2015-03-04 最后回复 2015-03-04

python做web服务器的问题

发表于 2014-10-22 最后回复 2015-03-04

关于python字符转换问题

发表于 2014-09-23 最后回复 2014-09-23

关于mysql两个表比对

发表于 2014-06-02 最后回复 2014-06-03

sql合并表的简单问题

发表于 2014-05-15 最后回复 2014-06-02

android关于屏幕取词的实现

发表于 2014-01-16 最后回复 2014-06-02

新立得软件包管理器到底在哪啊

发表于 2013-01-27 最后回复 2014-03-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除