- 博客(5)
- 资源 (21)
- 收藏
- 关注
原创 【每周一文】Factorization Machines
概述 在使用线性模型,例如LR模型时,特征工程是很大一块工作,有时为了产生较好的效果需要人工进行一些特征的二维或者三维交叉。FM(Factorization machines)提供了一种思路可以自动进行特征交叉,同时能够处理非常稀疏数据,线性时间复杂度,计算简单。 由于FM实现简单效果非常好,而且应用范围非常广,FM是近期非常火的技术,在比赛或者大公司都非常常见。FMF
2016-02-16 23:48:45 2314
原创 【每周一文】Supervised Sequence Labelling with Recurrent Neural Networks
概述 序列化标注是NLP领域非常常见的问题,很多问题都可以归结为序列化标注问题,例如分类可以看做多对一的标注;词性标注属于一对一的标注;机器翻译属于多对多的标注。 深度学习在NLP上取得不错的效果,常用的模型有前向神经网络(FNN)、卷积神经网络(CNN)、循环神经网络(RNN、BIRNN)、LSTM、关注度模型(AM)等,对于特定任务还有相关变形 本文主要科普下各个模型的结构
2016-02-16 23:47:55 5881
原创 【每周一文】Natural Language Processing (almost) From Scratch
概述本文介绍了一个统一的神经网络架构用于解决自然语言处理各种的各种任务,主要是序列标注任务,包括词性标注(POS)、词语组块分析(Chunking)、命名实体识别(NER)以及语义角色标注(SRL)等。本文主要介绍如何构建这个统一的神经网络以及如何运用一些技巧去提高效果,结论是不需要特殊构建特征工程就可以得到State-of-art结果。统一标识为方面后续介绍,提前介绍各类标识。
2016-02-16 23:46:43 5912 1
原创 【每周一文】A Few Usefull Things to know about Machine Learning
概述机器学习被普遍认为任何一个IT民工必备的工具之一,和学习任何语言工具一样,简单的体验一下或许非常简单。但这并不代表你能真正驾驭它,如果想深入不是一年两年能搞得定事情,本文作者总结了对于刚入门机器学习者需要注意一些事项。什么是学习机器学习包括无监督、半监督、监督、强化学习等,但是对于很多初入门的MLer可能就是监督学习,即给定训练样本和标签,学习出某个模型进行新样本预测。学习
2016-02-16 23:45:27 648
原创 MAC 上配置 SecureCRT快捷键
概述 在Windows系统是经常使用SecureCRT进行远程服务连接,切换到mac上,虽然也破解版的SecureCRT,但是一些快捷键和windows系统差很多。本文主要介绍如何配置SecureCRT和之前使用方式相同。配置详情Mac上如何安装SecureCRT,可以自行搜索,网上一大堆。下面以如何配置切换tab(标签)保证和Windows系统下使用方式一样。打开SecureCRT,菜单栏
2016-02-15 23:29:05 6100
Eclipse3.5,升级添加BPEL Designer插件l时需要的两个包
2010-06-29
BPEL学习实例,Apache-ODE,Eclipse-BPEL
2010-06-29
rabin-hash-function(rabin的随机多项式摘要算法)
2010-06-18
httpclient需要的jar包,合订版(httclient.jar,commons-codec,commons-logging)
2010-05-11
Heritrix,Mohr-et-al-2004.pdf,其作者谈其优劣
2010-03-31
HtmlAdaptorServer所需要的JAR包(com.sun.jdmk.comm.HtmlAdaptorServer)
2010-03-23
OA系统的毕业设计的毕业论文
2009-02-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人