编程心得
文章平均质量分 59
Tonylamam
菜,还要继续努力
展开
-
自然语言处理编程方面小笔记
数据结果的保存 #a为一维或二维数组 numpy.savetxt("filename.txt",a) b = numpy.loadtxt("filename.txt")原创 2017-02-23 17:10:46 · 245 阅读 · 0 评论 -
常用正则表达式
常用的正则表达式 ^abc 以abc开头的字符串 abc& 以abc结尾的字符串 .* 匹配任意长度字符(最长) .*? 匹配任意长度字符(最短) \ 为转义字符,后面加上符号可以表示符号 \d 任意数字 持续更新...原创 2017-02-22 16:34:52 · 238 阅读 · 0 评论 -
Python机器学习及NLP库
机器学习方面: Scikit-Learn 可用于分类、特征选择、特征提取和聚集。还拥有自然语言处理特征提取的能力、词袋、tf-idf算法、预处理等。 Matplotlib 可以用于快速可视化。 Statsmodels 主要用于预测性和探索性分析。可以拟合线性模型,进行统计分析或预测性建模。 PyMC 做贝叶斯曲线的工具。 Shogun 主要用于支持向量机(SVM) Gensim 用于主原创 2017-02-23 23:54:26 · 1723 阅读 · 0 评论 -
Word2Vec (Part 1): NLP With Deep Learning with Tensorflow (Skip-gram)
Tensorflow上其实本来已经有word2vec的代码了,但是我第一次看的时候也是看得云里雾里,还是看得不太明白。并且官方文档中只有word2vec的skip-gram实现,所以google了一下,发现了这两篇好文章,好像也没看到中文版本,本着学习的态度,决定翻译一下,一来加深一下自己的理解,二来也可以方便一下别人。第一次翻译,如有不当,欢迎指出。 原文章地址: Word2翻译 2017-04-13 21:34:57 · 1914 阅读 · 0 评论 -
Word2Vec (Part 2): NLP With Deep Learning with Tensorflow (CBOW)
Tensorflow上其实本来已经有word2vec的代码了,但是我第一次看的时候也是看得云里雾里,还是看得不太明白。并且官方文档中只有word2vec的skip-gram实现,所以google了一下,发现了这两篇好文章,好像也没看到中文版本,本着学习的态度,决定翻译一下,一来加深一下自己的理解,二来也可以方便一下别人。第一次翻译,如有不当,欢迎指出。 原文章地址: Word2翻译 2017-04-14 12:01:02 · 1790 阅读 · 0 评论