- 博客(6)
- 收藏
- 关注
原创 自然语言处理中的Attention机制
Attention in NLPAdvantage:integrate information over timehandle variable-length sequencescould be parallelizedSeq2seqEncoder–Decoder framework:Encoder:ht=f(xt,ht−1)h_t = f(x_t, h_{t-1})ht...
2018-10-14 13:21:29 1830
原创 文本分类
应用:垃圾邮件分类、主题分类、情感分析workflow:https://developers.google.com/machine-learning/guides/text-classification/model使用字符级 ngram 的词袋模型很有效。不要低估词袋模型,它计算成本低且易于解释。RNN 很强大。但你也可以用 GloVe 这样的外部预训练嵌入套在 RNN 模型上...
2018-10-14 13:14:28 859
原创 关于广告、推荐中的CTR的学于思
CTRCTR预测就是对用户是否点击广告进行预测,其实可以看成二分类问题,即点和不点。logistics回归(LR):logistics输出的是概率,可以较为直观的解释用户点击广告的几率计算目标函数的复杂度O(N),计算速度快,所以比较适合处理大数据没有考虑特征之间的相关性,没有特征进行组合为了提高模型性能,在模型训练之前,需要做很多的特征工程GDBT+LR:使用...
2018-10-10 21:08:47 1581
原创 关于信息检索(IR)、搜索引擎的学与思
平台建设(工程、数据、算法)面对大数据业务挑战,AI·OS至多能起到30%的作用,随后是算法解决30%+,其余的靠产品和机缘,只不过AI·OS的30%是个前提条件,AI·OS发展的核心线索是优化算法迭代效率。TPP推荐业务平台、RTP深度学习预测引擎、HA3搜索召回引擎、DII推荐召回引擎、iGraph图查询引擎集群物理资源的调度任务:中台容器和隔离技术与搜索工程交汇之地,更是模型训练P...
2018-10-10 18:06:37 2458 1
原创 关于问答系统(Q&A)、对话系统(Chatbot)的学与思
AnyQAnyQ(ANswer Your Questions) 开源项目主要包含面向FAQ集合的问答系统框架、文本语义匹配工具SimNet。(检索式回答)AnyQ系统框架主要由Question Analysis、Retrieval、Matching、Re-Rank等部分组成,框架中包含的功能均通过插件形式加入,如Analysis中的中文切词,Retrieval中的倒排索引、语义索引,Match...
2018-10-10 18:03:21 10855
原创 关于智能运维(AIOps)的学与思
AIOps降低运维成本,提升系统效率,如:异常检测,故障发现,异常定位,异常报警聚合,异常根因分析,快速止损,异常自动修复故障预测,容量预测、智能扩容(阈值动态调整,弹性扩缩),趋势预测,热点分析AIOps要解决的是“系统+算法”问题。解决任何一个AIOps中的模块或场景,都需要有“AIOps架构师”把复杂的场景和需求拆解成具体的功能模块: “眼”、“手”、“脑”。“眼”解决那些通...
2018-10-10 17:43:11 5771
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人