长见识
文章平均质量分 64
蓁蓁尔
A goal is a dream with a deadline.
展开
-
深度学习并不是在“模拟人脑”--周志华
2016年12月18日,KDD China技术峰会在深圳举行,周志华教授当天做报告《关于机器学习研究的讨论》。详细见:http://mp.weixin.qq.com/s/5YZi2NONhLT5F5Hhbk5psg 下面是自己理解了的部分,如果文章中有错误,please have no hesitate to tall me, 感谢! 1. 机器学习不是万能的(1)特征信息不充分:例如重要特征数据原创 2017-01-01 14:39:17 · 6046 阅读 · 0 评论 -
滴滴人工智能调度系统简单学习
腾讯大数据峰会暨 KDD China 技术峰会中,滴滴研究院副院长、密歇根大学终身教授叶杰平博士现场演讲学习。详细见:http://weibo.com/ttarticle/p/show?id=2309351000224058145168203763 下面是自己理解了的部分,如果文章中有错误,please have no hesitate to tall me, 感谢!2015年滴滴成立了机器学习研究原创 2017-01-01 14:07:21 · 11729 阅读 · 2 评论 -
聊天机器人相关中文资料
聊天机器人三代:第一代可以理解为:大量的if then else then,典型的特征工程。第二代可以理解为:对话检索,给定一个问题或者聊天,检索库中已有的答案与之最匹配。比如:小黄鸡。第三代可以理解为:生成对话,流行的做法是seq2seq+attention,是一种神经网络模型。经过大量数据的训练,根据输入生成输出。比如:google的这篇paper A Neural Convers原创 2017-02-20 11:22:06 · 867 阅读 · 0 评论 -
中文语料库and分词
北京大学计算语言学研究所: 《人民日报》切分/标注语料库中文对白语料:可用作聊天机器人训练语料THUOCL:清华大学开放中文词库 (1) http://thuocl.thunlp.org/ (2)一篇微信文章THULAC:一个高效的中文词法分析工具包专栏 | 中文分词工具测评 http://chuansong.me/n/1205988942333原创 2017-02-25 16:45:25 · 6594 阅读 · 0 评论 -
《这就是搜索引擎-核心技术详解》简单梳理+一些知识图谱的知识
《这就是搜索引擎-核心技术详解》,我挺喜欢这本书的,深入浅出让读者明白一个搜索引擎的大体架构和各个部分的经典技术手段。一、相关概念(1)搜索引擎的3个核心问题:理解用户真正的需求(主要第九章用户查询意图分析,再一个是情景搜索,即此时此地此人,获取用户发生查询的时间、地点、周围环境等+之前的用户模型,根本目的还是要理解当前用户当前情境下的需求)判断相关性,目前主要是基于关键词的匹配,VSM+TF*原创 2017-08-07 17:05:02 · 8681 阅读 · 0 评论