- 博客(5)
- 资源 (38)
- 收藏
- 关注
原创 0.python-简单的爬虫示例(ip138)
import requestsimport xml.etree.ElementTree as ETfrom xml.parsers.expat import ParserCreateclass DefaultSaxHandler(object): def __init__(self, provinces): self.provinces = provinces...
2018-08-19 21:38:39 1215
原创 AI-NLP-3.Word2Vec实战案例课
目录安装notebooks1.文本情感分析 英文 && 中文Data SetFile descriptionsData fields第一种方式:bag_of_words_model用pandas读入训练数据对影评数据做预处理,大概有以下环节:清洗数据添加到dataframe里抽取bag of words特征(TF,用sklearn的Count...
2018-08-15 15:15:22 2144 1
原创 AI-NLP-2. Word2Vec理论基础
目录NLP常见任务NLP处理方法词编码需要保证词的相似性简单 词/短语 翻译向量空间子结构 在计算机中表示一个词 离散表示: One-hot表示离散表示: Bag of Words离散表示: Bi-gram和N-gram语言模型N元模型离散表示的问题分布式表示 (Distributed representation)共现矩阵 (Cocu...
2018-08-12 13:48:13 607
原创 AI-NLP-1.NLP理论基础
目录Windows安装安装Python3.7安装Numpy安装NLDKNLTK自带语料库文本处理流程Tokenize中英⽂NLP区别中文分词 分词之后的效果有时候tokenize没那么简单社交⽹络语⾔的tokenize纷繁复杂的词形词形归⼀化NLTK实现StemmingNLTK实现LemmaStopwordsNLTK去除sto...
2018-08-08 10:41:54 1004
debug.exe在win7-64下模拟
2015-08-25
SetStretchBltMode测试
2011-09-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人