自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(164)
  • 收藏
  • 关注

原创 《人工智能(第二版)》入门新人必读的一本神书(文末送书)

直接进入主题,今天送书!对于支持咕泡人工智能的粉丝,我们向来是忠诚的。今天要送的这本书叫《人工智能(第二版)》作者简介:史蒂芬·卢奇(Stephen Lucci)  拥有纽约市立大学的博士学位,目前在纽约市立大学教授计算机科学课程。他曾在高性能计算领域发表了多篇论文,并且是NASA发起的MU-SPIN项目的学术带头人。MU-SPIN项目旨在为NASA培养下一代*尖的科...

2019-08-16 22:01:08 1534 4

原创 干货分享!价值6亿的代码到底长什么样子?

价值6亿美刀的代码量是多少?如果一个工程师写代码要赚6亿美元,那他大概需要写多少代码呢?前段时间,Google工程师RaymondFarias在社交媒体说道,一名高效的谷歌工程师每天大概会写 100-150行代码。倘若以这个谷歌工程师为例,全年无休不间断写代码,一年时间写的代码量预估为54750行。而据领英数据统计,谷歌工程师薪酬一般在20万-100万美元不等。倘若这个工程师是10...

2019-08-16 14:10:13 626

原创 那些百万年薪的算法工程师,都是经历了哪些九死一生?

从前段时间的“上班996,住院ICU”,到如今甲骨文被裁员工因为年龄大不愿加班而没有公司肯要,市场对于程序员要求越来越高,行业内竞争压力也越来越大。前有滴滴、HTC宣布裁员,后有Oracle裁员大补偿,在到BAT缩招,小公司减员的情况下,大家都小心翼翼不敢轻易跳槽,那些身经百战的程序员们到底该如去何从呢?是继续在现有的领域里深耕,迎接一波又一波后起之秀的挑战?还是选择合适的时机...

2019-05-24 11:30:11 11260 3

转载 逆天!996程序员有救了,竟是价值3亿美元AI帮的忙!

最近,IBM公司CEO罗睿兰在采访中说:“我们拥有35万名员工,每天都会收到超过8000份简历。”人多必然面临着管理问题。但他们开发了一套“AI黑科技”,据称可以准确预测员工离职动向,准确度达95%!目前,这个AI已为IBM省了近3亿美元的员工留存成本!罗睿兰表示,让每一个员工清晰地看到职业发展很重要。但很多公司一味加班,只会让这个问题变得越来越严重。程序员在996的情况下...

2019-05-08 10:06:23 401

原创 脸盲的东哥从分不清老婆到分不清兄弟,于是用AI进行无人办公!

前言2018年,作为人生赢家的东哥开始了美国的游学生活,因为脸盲,睡错了姑娘,于是染上了官司。当时闹的满城风雨,一度蝉联各大热搜第一,虽然说后来经过一番讨价还价和危机公关,终于打点上下,得以顺利过关,但某东股价大跌,多年经营的自强不息,以一己之力扛起反击阿里垄断大旗的人设崩塌。而到2018年底,京东开始爆出大范围裁员,今年年初京东宣布“小集团,大业务”转型,10%的京东高管按照末尾淘汰...

2019-04-10 21:19:38 476

转载 AI换脸火了 支付宝还安全吗?官方回应

近日,一段AI技术将朱茵扮演的黄蓉换成杨幂的脸视频热传,网友惊叹“AI换脸大法”毫无违和感的同时,也担忧该技术会被用于不法行为。据了解,这段视频的制作者是B站UP主,为避免侵犯肖像权,目前已经将视频下架。UP主表示,“这次的热度对我们所有人也是一个警示,AI换脸应该被用以正确的方式,大家应尊重版权与肖像权,专注于技术本身。”除了侵犯隐私之外,AI换脸还可能引发更大的安全问题,那就是目前的人...

2019-02-28 16:46:52 1237

转载 平均年薪70万?刚刚,这类程序员又涨薪了

据全球最大职业社交网站LinkedIn发布的《全球人工智能领域人才报告》,人工智能领域的人才需求在过去3年间增长了8倍。国内互联网三巨头BAT、科大讯飞等科技公司正在积极布局人工智能领域,大量招募AI高端人才,那么,2018年的AI开发者薪酬究竟如何呢?本文通过历年来AI岗位薪资变化,为大家展示AI高薪岗位都有哪些及原因! 平均年薪70万,年后将再涨!AI人才大满贯,拿下三个薪酬榜...

2019-02-21 14:43:18 571

原创 解密:十个机器学习的成功案例

人工智能(AI)和机器学习(ML)(人们曾认为这两者是公司不切实际的项目)正在成为主流。有越来越多的企业正在利用这种模仿人类思维的技术来吸引客户并加强业务运营。而这种趋势只会越来越受欢迎。Forrester的研究称,全球数据和分析技术决策者中有53%的人正在实施实施人工智能或大规模使用人工智能,另有20%的人计划在未来12个月内实施人工智能。无论是好是坏,通过人工智能、机器学习和机器人所实...

2019-01-22 14:58:50 894

原创 2019年AI计算机视觉将继续承担哪些作用?

前言 随着深度学习的快速发展,计算机视觉已成为人工智能领域最重要的技术。计算机视觉被视为人工智能的重要分支,它就等同于人工智能的大门,在人工智能中视觉信息比听觉、触觉重要得多。人类大脑皮层的70%活动都在处理视觉信息,而既然人工智能旨在让机器可以像人那样思考、处理事情,因此计算机视觉技术承担了很大的作用。随着深度学习的快速发展,计算机视觉已成为人工智能领域最重要的技术。计算机视觉被视为...

2019-01-10 15:03:19 558

原创 基于FCBF特征选择和粒子群优化的模糊神经网络视听情感识别翻译

前言:人类使用面部、言语和身体手势等多种方式来表达自己的情感。因此,使情感计算机和人机交互(Hci)更自然地和友好的。最后,计算机应该能够利用语音和视觉信息来理解人类的感受。本文利用模糊ARTMAP神经网络从音视频信息中识别情感。 网络(FAMNN)音频和视觉系统融合在决策和特征级别。最后,利用粒子群优化算法确定了选择参数(α)的最优值、警戒参数(ρ)和学习率(β)。实验结果表明,特征级和决策...

2019-01-07 20:17:19 1038

原创 一个例子了解迁移学习

迁移学习对于传统机器学习而言,要求训练样本与测试样本满足独立同分布,而且必须要有足够多的训练样本。而迁移学习能把一个领域(即源领域)的知识,迁移到另外一个领域(即目标领域),目标领域往往只有少量有标签样本,使得目标领域能够取得更好的学习效果。   迁移方式样本迁移,在源领域中找出与目标领域相似的样本,增加该样本的权重,使其在预测目标与的比重加大。 特征迁移,源领域与目...

2018-12-13 14:50:02 2158

原创 线性回归数学推导

一、数学基础1、似然函数概率(probability):描述已知参数时的随机变量的输出结果;似然函数(likelihood):用来描述已知随机变量输出结果时,未知参数的可能取值。似然函数和密度函数是完全不同的两个数学对象,前者是关于的函数,后者是关于的函数。2、高斯分布数学期望(mean):试验中,每次可能结果的概率乘以其结果的总和。(伯努利)大数定律:当试验次数足...

2018-12-12 19:26:19 376

原创 Python 的枚举类型

起步Python 的原生类型中并不包含枚举类型。为了提供更好的解决方案,Python 通过 PEP 435 在 3.4 版本中添加了 enum 标准库。枚举类型可以看作是一种标签或是一系列常量的集合,通常用于表示某些特定的有限集合,例如星期、月份、状态等。在没有专门提供枚举类型的时候我们是怎么做呢,一般就通过字典或类来实现:Color = { 'RED' : 1, ...

2018-12-11 17:43:13 377

原创 一天造出10亿个淘宝首页,阿里工程师如何实现?

双11手淘首页的几个重要推荐场景截图如下: 如上图所示,左一场景为AIO综合会场,包括AIO日常场景(淘抢购、有好货、清单等)、双11人群会场及行业会场;中间为AIOplus场景卡片综合会场,包括5张会场卡片,每张卡片融入了行业主分会场、标签会场,该业务涉及到20多个日常业务以及标签、行业会场的分发;右三为主会场入口所见所得,用两个素材轮播的方式给双11主会场进行引流。双十一当天整体点...

2018-12-07 14:02:50 384

原创 自己动手实现神经网络分词模型

分词作为NLP的基础工作之一,对模型的效果有直接的影响。一个效果好的分词,可以让模型的性能更好。在尝试使用神经网络来分词之前,我使用过jieba分词,以下是一些感受:分词速度快 词典直接影响分词效果,对于特定领域的文本,词典不足,导致分词效果不尽人意 对于含有较多错别字的文本,分词效果很差后面两点是其主要的缺点。根据实际效果评估,我发现使用神经网络分词,这两个点都有不错的提升。本...

2018-12-05 15:12:25 680

原创 如何简单高效地部署和监控分布式爬虫项目

需求分析初级用户:只有一台开发主机 能够通过 Scrapyd-client 打包和部署 Scrapy 爬虫项目,以及通过 Scrapyd JSON API 来控制爬虫,感觉命令行操作太麻烦,希望能够通过浏览器直接部署和运行项目专业用户:有 N 台云主机,通过 Scrapy-Redis 构建分布式爬虫 希望集成身份认证 希望在页面上直观地查看所有云主机的运行状态 希望能...

2018-11-15 15:13:00 568

原创 爬取斗图网表情包之后斗图会输?不存在的

  前言:本文非常浅显易懂,可以说是零基础也可快速掌握。如有疑问,欢迎留言,笔者会第一时间回复。一、分析表情包网址  1、进入斗图啦网址,点击**“最新表情”**,再点击第二、第三页,得出规律如下: 第一页:www.doutula.com/photo/list/… 第三页:www.doutula.com/photo/list/… 第四页:www.d...

2018-11-10 11:16:38 1703

原创 爬虫优化

1.随机休眠在爬虫的工作过程中,自然是爬得越快越好,但是如果你的目标网站有比较完善的防爬系统,而你却只有一个对外IP地址。那么在这个时候你就应该考虑到随机休眠,而不是定时休眠。当一个真实用户在浏览某个网站的过程中,发生的每一次操作、页面跳转应该都是无时间规则的。所以我们在爬虫中应该模拟真实用户的这一特征2.User-Agent往往我们都会写一堆 User-Agent,然后在每次请...

2018-11-08 19:33:43 737

原创 深入浅出运维自动化体系演化

马上要进入双十一倒计时了,这里有必要对我们的”运维自动化体系”,有所回顾及展望。一、运维自动化发展通常划分 如果把运维自动化发展按上图作划分,在过去一年多的时间里,我们通过努力,逐渐从第一阶段迈进到第三阶段;二、回顾过去一年贝聊运维自动化体系演化一年之前的贝聊运维的情况: 一年之后的,我们通过努力成达的目标:1、 顺利完成基础网络架构调整及VPC迁移,提升了整体网...

2018-11-06 20:03:15 489 1

原创 深度学习-自然语言模型随记

为什么要研究深度学习?   语言模型   看概率!    n-gram  一行一行看,比如第一行,i后面接i的出现次数,i后面接want的出现次数。上面表表示词后面接某词的次数,下面表表示词后面接某词的概率。   N表示预料库的大小,小n在建模时一般取2,3就可以,也可以取到4,再大就会...

2018-11-05 14:54:20 358

原创 机器学习实现双十一购物清单的自动商品标签归类

双十一购物狂欢节马上又要到来了,最近各种关于双十一的爆品购物列表在网上层出不穷。如果是网购老司机,一定清楚通常一件商品会有很多维度的标签来展示,比如一个鞋子,它的商品描述可能会是这样的“韩都少女英伦风系带马丁靴女磨砂真皮厚底休闲短靴”。如果是一个包,那么它的商品描述可能是“天天特价包包2016新款秋冬斜挎包韩版手提包流苏贝壳包女包单肩包”。每个产品的描述都包含非常多的维度,可能是时间、产地、款...

2018-11-01 22:02:30 629

原创 如何构建一个分布式爬虫:理论篇

前言本系列文章计划分三个章节进行讲述,分别是理论篇、基础篇和实战篇。理论篇主要为构建分布式爬虫而储备的理论知识,基础篇会基于理论篇的知识写一个简易的分布式爬虫,实战篇则会以微博为例,教大家做一个比较完整且足够健壮的分布式微博爬虫。通过这三篇文章,希望大家能掌握如何构建一个分布式爬虫的方法;能举一反三,将celery用于除爬虫外的其它场景。目前基本上的博客都是教大家使用scrapyd或者scra...

2018-10-31 14:47:56 314

原创 心中无码:这是一个能自动脑补漫画空缺部分的AI项目

图像修复在应用上非常吸引人,通常设计师需要使用 Photoshop 根据图像周围修复空缺部分。这一过程非常耗时和细致,因此很早就有研究尝试使用机器学习模型自动化这一过程。这篇文章介绍了 DeepCreamPy 项目,它可以自动修复漫画图像中的空缺部分和马赛克。该项目主要基于几个月前 Nvidia 提出使用部分卷积修复图像不规则空缺的研究。本文将简要介绍这项研究与 DeepCreamPy 实...

2018-10-30 16:31:34 2451

原创 分布式爬虫的部署之Gerapy分布式管理

我们可以通过Scrapyd-Client将Scrapy项目部署到Scrapyd上,并且可以通过Scrapyd API来控制Scrapy的运行。那么,我们是否可以做到更优化?方法是否可以更方便可控?我们重新分析一下当前可以优化的问题。 使用Scrapyd-Client部署时,需要在配置文件中配置好各台主机的地址,然后利用命令行执行部署过程。如果我们省去各台主机的地址配置,将命令行对接图形界...

2018-10-30 14:47:20 512

原创 如何学爬虫,如何学数据分析,如何学人工智能并转到这些行业?

最近有个朋友给我留言,和我聊天,分享了他这段时间在培训Python编程这一块,今天整理这篇文章,会详细介绍0基础学python该如何学,帮助到更多想学习python的朋友,给广大同学朋友规划个适合学习规划。他大学学习的应用化学,后来毕业做了2年全栈设计师(PS:设计和前端都不熟练的那种)后来出于对爬虫开发的喜欢(爬图片,爬视频)还有人工智能,机器学习,大数据的火热程度的追捧,毅然决然报了培...

2018-10-22 17:31:32 1683

原创 妈妈再也不用担心爬虫被封号了!手把手教你搭建Cookies池

很多时候,在爬取没有登录的情况下,我们也可以访问一部分页面或请求一些接口,因为毕竟网站本身需要做SEO,不会对所有页面都设置登录限制。但是,不登录直接爬取会有一些弊端,弊端主要有以下两点。 设置了登录限制的页面无法爬取。如某论坛设置了登录才可查看资源,某博客设置了登录才可查看全文等,这些页面都需要登录账号才可以查看和爬取。 一些页面和接口虽然可以直接请求,但是请求一旦频繁,访问...

2018-10-19 15:14:32 2279

原创 百度大牛分享Django ORM 数据库生命周期规则

起因有时在线上会遇到“MySQL Server gone away”的错误,但是是以一定概率出现的,今天又遇上了,不得不逼迫自己彻底去解决这个事情。老实说,一般遇到这种看不懂的错误,心里还是挺懵的。一来这种错误一般暴露自己底层知识理解不够透彻;二来是框架毕竟封装了太多,让人看得见森林却看不见树木,比如 Django 这种封装很完善的框架。要命的是第一种,基础知识不是一下子就能补回来的,又不是调...

2018-10-19 15:03:53 492

原创 关于phantomjs爬取需要登录页面并截图(页面包含一些异步请求的数据)

项目有个需求是需要捕获某个页面的数据(后端完成),因为之前用过phantom,所以就毫不犹豫的选择了它,关于phantom的介绍,安装和简单使用百度很容易找到,这里就不再赘述了。 之后就开始大刀阔斧的码起来了,兴致冲冲的利用网上找到的截取某网页的代码(见附录1)测试。'use strict';var page = require('webpage').create(), system...

2018-10-18 15:29:31 2395 1

原创 大牛深入浅出帮你落地网络 HTTP

了解 Web 及网络基础  对端传输  发送端在层与层间传输数据时,没经过一层都会被加上首部信息,接收端每经过一层都会删除一条首部  多种协议作用  IP 协议,TCP 协议和 DNS 服务在使用 HTTP 协议过程中发挥的作用简单的 HTTP 协议请求报文和响应报文客户端像服务器发起请求时会生成一段请求报文,请求报文是由请求方法...

2018-10-16 15:59:35 358

原创 2018年最常见的Python面试题&答案(上篇)

Python新手在谋求一份Python编程工作前,必须熟知Python的基础知识。编程网站DataFlair的技术团队分享了一份2018年最常见Python面试题合集,既有基本的Python面试题,也有高阶版试题来指导你准备面试,试题均附有答案。面试题内容包括编码、数据结构、脚本撰写等话题。本文为上篇。Q 1:Python有哪些特点和优点?作为一门编程入门语言,Python主要有以下特点和...

2018-10-16 13:54:50 524

原创 百度HR教你优雅的回答 Python面向对象之访问控制

Python从设计之初就是一门面向对象的语言,面向对象思想的第一个要素就是封装。所谓封装,通俗的讲就是类中的属性和方法,分为公有和私有,公有可以被外界访问,私有不能被外界访问,这就是封装中最关键的概念——访问控制。访问控制有三种级别:私有、受保护、公有私有(Private):只有类自身可以访问 受保护(Protected):只有类自身和子类可以访问 公有(Public):任何类都可以访问...

2018-10-15 17:38:04 315

原创 理解metaclass并实现一个简单ORM框架

metaclass除了使用type()动态创建类以外,要控制类的创建行为,还可以使用metaclass。metaclass,直译为元类,简单的解释就是:当我们定义了类以后,就可以根据这个类创建出实例,所以:先定义类,然后创建实例。但是如果我们想创建出类呢?那就必须根据metaclass创建出类,所以:先定义metaclass,然后创建类。连接起来就是:先定义metaclass,...

2018-10-15 14:54:50 426

原创 阿里资深架构师解析python-外观模式

外观模式说明 外观模式又叫做门面模式。在面向对象程序设计中,解耦是一种推崇的理念。但事实上由于某些系统中过于复杂,从而增加了客户端与子系统之间的耦合度。例如:在家观看多媒体影院时,更希望按下一个按钮就能实现影碟机,电视,音响的协同工作,而不是说每个机器都要操作一遍。这种情况下可以采用外观模式,即引入一个类对子系统进行包装,让客户端与其进行交互。 外观模式(Facade Pattern):外部与...

2018-10-13 16:03:29 321

原创 阿里资深架构师解析python-访问者模式

访问者模式访问者模式,是行为型设计模式之一。访问者模式是一种将数据操作与数据结构分离的设计模式,它可以算是 23 中设计模式中最复杂的一个,但它的使用频率并不是很高,大多数情况下,你并不需要使用访问者模式,但是当你一旦需要使用它时,那你就是需要使用它了。 访问者模式的基本想法是,软件系统中拥有一个由许多对象构成的、比较稳定的对象结构,这些对象的类都拥有一个 accept 方法用来接受访问者对象...

2018-10-13 16:00:37 313

原创 大牛教你使用dlib中的深度残差网络(ResNet)实现实时人脸识别

opencv中提供的基于haar特征级联进行人脸检测的方法效果非常不好,本文使用dlib中提供的人脸检测方法(使用HOG特征或卷积神经网方法),并使用提供的深度残差网络(ResNet)实现实时人脸识别,不过本文的目的不是构建深度残差网络,而是利用已经训练好的模型进行实时人脸识别,实时性要求一秒钟达到10帧以上的速率,并且保证不错的精度。opencv和dlib都是非常好用的计算机视觉库,特别是dli...

2018-10-13 10:29:48 7758 7

原创 斯坦福NG机器学习:K-means笔记

K-means 聚类算法:K-means聚类算法算法流程,我们首先有训练集,但是训练集我们没有类标签,我们想把数据聚类成一些cluster ,这是一种无监督学习方法。具体步骤:1. 首先初始化cluster centroid 2. 迭代的找每一个数据集点到最近cluster centroid,然后把该点给到最近cluster centroid所在的cluster,然后在更新cluster ...

2018-10-13 09:44:56 369

原创 Python从入门到入坟进阶-那些容易被忽略的问题

前言哈喽,大家好,入门部分连载一路走过来,得到了很多好评原因主要是:1.通俗易懂2.幽默风趣我将延续这个传统,继续进阶部分的连载如果还没看过我的入门连载部分,可以点击这条获取免费的讲解视频int()强制转换浮点数在int()的强制转换浮点数时候,不管是正数还是负数,只取整数部分。注意:这里不是向上或者向下取整,也不是四舍五入。无限递归还记得我们讲的俄...

2018-10-12 17:38:24 362

原创 Python从入门到入坟(三)-Python的基本数据类型

前言上篇忘了讲文件改名了这篇加上Python的基本数据类型Python有着很多种数据类型,什么叫数据类型呢我搜了一下粘贴过来:数据类型在数据结构中的定义是一个值的集合以及定义在这个值集上的一组操作。 变量是用来存储值的所在处;它们有名字和数据类型。这里说的变量又是啥???如果你学过编程语言,例如大学理工科学的C和其他专业学的VB,很好理解如果你从来没学过...

2018-10-12 16:43:32 561

原创 Python从入门到入坟(二)jupyter的常用操作

前文说了学Python先安装anaconda的环境我们现在来看看安装完之后怎么用我已经迫不及待写代码了洋洋洒洒几千行喂,烙铁,你的口水都流出来了,快醒醒【用力拍不积跬步无以至千里,不积小流无以成江海。对吧 Jupyter notebook的常用操作在弹出的网页(怎么弹出的请看上文)中按照红圈操作: 弹出一个新的页面这样我们就可以开始写点代码了 ...

2018-10-12 16:11:06 702

原创 Python从入门到入坟(一)安装环境

安装环境n年前我初学Python的时候(n可能=1)那时 没有花香,没有树高,我是一只无人指导的菜鸟当时我在群里问学派森要装什么有人说装个anaconda我想:这人说的和派森听起来没关系啊原来是我当年太年轻现在,我带大家装anaconda而不是装Python因为Python英文是蟒蛇,anaconda是水蟒(这算啥理由)大家和我一起搜索一下anaconda:...

2018-10-12 15:54:19 536

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除