智能客服
洪洪
这个作者很懒,什么都没留下…
展开
-
NLTK学习笔记
学习参考书: http://nltk.googlecode.com/svn/trunk/doc/book/ 1. 使用代理 下载数据 nltk.set_proxy("**.com:80") nltk.download() 2. 使用sents(fileid)函数时候出现:Resource 'tokenizers/punkt/english.pickle' not转载 2017-05-16 16:23:57 · 337 阅读 · 0 评论 -
如何利用深度学习技术训练聊天机器人语言模型?
第一篇传送门:聊天机器人的发展状况与分类 第二篇传送门:基于规则和检索的聊天机器人引擎 本篇文章以这个开源项目为主线进行。 数据预处理 模型能聊的内容也取决于选取的语料。如果已经具备了原始聊天数据,可以用SQL通过关键字查询一些对话,也就是从大库里选取出一个小库来训练。从一些论文上,很多算法都是在数据预处理层面的,比如Mechanism-Aware Neural Machine f转载 2017-05-27 10:16:50 · 847 阅读 · 0 评论 -
结巴中文切词
中文分词工具:结巴分词 github地址:https://github.com/fxsjy/jieba 分词功能 精确模式(默认):试图将句子最精确地切开,适合文本分析;全模式,把句子中所有的可以成词的词语都扫描出来,但是不能解决歧义; 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,该方法适合用于搜索引擎构建倒排索引的分词,粒度比较细。 注意:jieba.cut以及转载 2017-05-17 13:01:02 · 763 阅读 · 0 评论 -
Python中list、tuple、str和dict之间的相互转换
1、字典(dict) dict = {‘name’: ‘Zara’, ‘age’: 7, ‘class’: ‘First’} 1.1 字典——字符串 返回: print type(str(dict)), str(dict)11 1.2 字典——元组 返回:(‘age’, ‘name’, ‘class’) print tuple(dict)11 1.3 字典——元组 返回:(7,转载 2017-07-13 23:47:04 · 421 阅读 · 0 评论 -
基于Html5 websocket和Python的在线聊天室
一、什么是WebSocket API WebSocket API是下一代客户端-服务器的异步通信方法。该通信取代了单个的TCP套接字,使用ws或wss协议,可用于任意的客户端和服务器程序。WebSocket目前由W3C进行标准化。WebSocket已经受到Firefox 4、Chrome 4、Opera 10.70以及Safari 5等浏览器的支持。 WebSock转载 2017-07-17 13:38:08 · 2376 阅读 · 0 评论