人工智能
文章平均质量分 60
生一先生
这个作者很懒,什么都没留下…
展开
-
计算机研究生就业方向之去大厂做人工智能
10,去互联网公司做销售和营销(这块如果是好学校的研究生,去了大企业,好好干,前途无量,我见过的发大财的都是做销售的,尤其是大公司的,好学校的研究生做销售,资产上亿的我都见过,我只恨我自己当年学生气太重没去做)7,去银行,证券,保险等金融类央企,国企做技术开发(这块真的不错,需要学历好,或者家里有人,我的一个师弟在二线城市的中国银行技术开发去年拿了48万比互联网舒服,稳定,钱还多,不信有图为证)你想从事这个方向,以现在的行情,不是清北复交,不是C9,没有几篇顶会,就别搞了,真的,原创 2022-12-12 20:37:36 · 1087 阅读 · 0 评论 -
NLP简介
NLP是什么?•NLP( Natural Language Processing ) 是 自然 语言 处理 的 简称,是研究人与 计算机交互的语言问题的一门学科。机器理解并解释人类写作与说话方式的能力。近年来, 深度学习技术在自然语言处理方面的研究和应用也取得了显著的成果。NLP能做什么?•NLP技术已经无处不在如:提问和回答、知识工程、语言生成、语音识别,语音合成, 自动分词,句法分...原创 2020-03-30 23:31:30 · 882 阅读 · 0 评论 -
第01课:中文自然语言处理的完整流程
第一步:获取语料语料,即语言材料。语料是语言学研究的内容。语料是构成语料库的基本单元。所以,人们简单地用文本作为替代,并把文本中的上下文关系作为现实世界中语言的上下文关系的替代品。我们把一个文本集合称为语料库(Corpus),当有几个这样的文本集合的时候,我们称之为语料库集合(Corpora)。(定义来源:百度百科)按语料来源,我们将语料分为以下两种:1.已有语料很多业务部门、公司等组织随着业务发...原创 2018-06-26 13:44:07 · 15511 阅读 · 5 评论 -
风控,反欺诈方向的几个职位要求整理
数据科学家25k-50k职位描述:岗位职责1、负责理解业务需求,并利用机器学习、数据挖掘的方法发现并提取新的维度特征;2、负责深入业务,对核心数据设计和实施机器学习算法,并利用对数据的理解支撑客户的数据决策;3、紧跟机器学习相关技术的业界发展,研究创新方法以突破常规算法的瓶颈;和其它数据科学家和业界专家共同对反欺诈领域的问题进行研究和探讨;任职要求1、计算机科学,数学或统计相关硕士以上学位;2年以...原创 2018-05-29 15:40:00 · 5143 阅读 · 0 评论 -
一些比较有用的github案例
个人对话机器人:https://github.com/juliali/WeatherBot 反欺诈场景:https://github.com/DannyHoo/droolshttps://github.com/pythonnewbird/Anti-Fraudhttps://github.com/fanzhihai/Financial-fraud-predictionhttps://github.c...原创 2018-05-29 15:33:58 · 1718 阅读 · 0 评论 -
机器学习常用「微积分」知识速查手册
转载李烨姐姐的文章,以备自己查询李烨姐姐是刘鹏老师同事,都是我的偶像一元函数先来看最最简单的一元函数的情况:【导数】:函数y = f(x) 在点x0的某个邻域内有定义, 则当自变量x在x0处取得增量 deltax,函数输出值也相应取得增量deltay。如果deltay与deltax的比值在delta_x趋于0时的极限存在,则f(x)在x0处的导数存在,即f(x)在x0处可导。该极限即为f(x)在x...转载 2018-05-28 20:45:46 · 563 阅读 · 0 评论 -
中文分词之HMM模型详解
关于HMM模型的介绍,网上的资料已经烂大街,但是大部分都是在背书背公式,本文在此针对HMM模型在中文分词中的应用,讲讲实现原理。尽可能的撇开公式,撇开推导。结合实际开源代码作为例子,争取做到雅俗共赏,童叟无欺。没有公式,就没有伤害。HMM(Hidden Markov Model): 隐式马尔科夫模型。HMM模型可以应用在很多领域,所以它的模型参数描述一般都比较抽象,以下篇幅针对HMM的模型参数介绍...转载 2018-04-27 14:18:50 · 482 阅读 · 0 评论 -
Usage of API documented as @since 1.7+ less... (Ctrl+F1) This inspection finds all usages of method
程序中出现了这样的错误,查看依赖,没有缺少,单独引用也没有问题,但是最后一段代码在idea中就是错误,后来发现是打包编译设置的问题,在maven中加入了一段build代码就可以了。<build> <plugins> <plugin> <groupId>org.apache.maven.plugins&l...原创 2018-04-23 14:31:48 · 2283 阅读 · 0 评论 -
我对于准确率---p值,召回率R值以及F值的理解
再互联网广告的推荐系统和反作弊的实践中经常遇到准确率,召回率,F值几个东西,刚入行的时候,我经常搞混,直到后来我逐渐明白了。举个列子!我们用一个模型去判断一段时间的作弊流量,假设该段时间的流量是100个,作弊的是25个,没有作弊的是75个,假设这里正样本为没有作弊的流量。然后我们用lstm模型去预测,结果是70个没有作弊的,但是经检查,我们把其中69个正样本预测为没有作弊,把1个负样本预测为没有作...原创 2018-04-11 16:17:00 · 4620 阅读 · 0 评论 -
医疗,医药人工智能需要知道的几件事情
人工智能蓬勃发展,对各行各业都产生了影响,那么人工智能对医疗保健行业的影响会是怎么样的呢。我结合freshbenies首席战略官的文章,并加入自己的理解,联系国内的实际情况谈谈人工智能对医疗保健行业的发展。一机器学习(包括深度学习)和人工智能是有区别的机器学习使用人工智能算法来处理大量的数据,并允许机器自己学习。如电子邮箱中的垃圾邮件分类,而机器学习在医疗行业的应用主要局限于医疗影像行业。如CT影...原创 2018-04-03 11:25:57 · 1448 阅读 · 0 评论 -
AdaBoost算法的简单例子
Bootstrapping算法主要思路:i)重复地从一个样本集合D中采样n个样本ii)针对每次采样的子样本集,进行统计学习,获得假设Hiiii)将若干个假设进行组合,形成最终的假设Hfinaliv)将最终的假设用于具体的分类任务(2)Bagging算法主要思路:i)训练分类器从整体样本集合中,抽样n* < N个样本 针对抽样的集合训练分类器Ciii)分类器进行投票,最终的结果是分类器投票的优...原创 2018-04-02 19:03:19 · 1099 阅读 · 0 评论 -
LSTM的神经网络keras实现
加载keras模块from keras.models import Sequentialfrom keras.layers import LSTM, Densefrom keras.datasets import mnistfrom keras.utils import np_utilsfrom keras import initializationsdef init_weights(...原创 2018-04-02 18:47:51 · 2434 阅读 · 0 评论 -
搭建sparkmllib开发环境的一些坑-----
sparkmlib是spark用于机器学习开发的包,实现了在分布式的大数据集群上做机器学习的功能,是目前对分布式支持较好的机器学习框架,除此之外支持分布式的机器学习框架还有tensorflow和deeplearning4j,但sparkmllib天生和hadoop无缝结合,不过sparkmllib的短板是无法支持深度学习,而tensorflow和deeplearning是支持深度学习的。好了废话不...原创 2018-04-02 18:44:50 · 5533 阅读 · 3 评论