![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
自然语言处理
AIbanana
女神就要有女神的样子
展开
-
欢迎使用CSDN-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦: Markdown和扩展Markdown简洁的语法 代码块高亮 图片链接和图片上传 LaTex数学公式 UML序列图和流程图 离线写博客 导入导出Markdown文件 丰富的快捷键 快捷键 加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl原创 2017-03-08 20:27:08 · 199 阅读 · 0 评论 -
网络爬虫之request的使用
requests库的应用 1.requests库中有几个常用的方法, (1)requests.request()是构造一个请求,支撑以下各个方法的基础方法。 (2)requests.get()是获取html网页 的主要方法,对应与http的get方法。是爬取网页的最基本的方法,也是最常用的。 (3)requests.head()是获取头信息的方法,对应与http的head,也是经常使用的方法原创 2017-03-08 20:41:32 · 2952 阅读 · 0 评论 -
网络爬虫之requests库中两个重要的对象
当我们使用resquests.get()时,返回的时response的对象,他包含服务器返回的所有信息,也包含请求的request的信息。 首先: response对象的属性有以下几个, r.status_code是http请求的返回状态,200表示连接成功,404表示连接失败,这时候应该抛出异常,进行处理。 r.text是url对应的页面内容 r.encoding是从http的heade原创 2017-03-08 20:53:41 · 1456 阅读 · 0 评论 -
网络爬虫之盗之有盗
网络爬虫的尺寸: 一般来讲,这个尺寸可以分为三类, 第一类是比较小规模的,数据量小爬取的速度不敏感,一般用的是requests库,适用于我们自己爬取网页,玩转网页, 第二类是中规模的,数据规模较大的,爬去速度敏感的scrapy库,适用于我们进行爬取网站。 第三类是大规模的,搜索引擎爬取的速度关键,这样的,一般需要定制开发 网络爬虫的限制: 1,来源原创 2017-03-08 21:14:31 · 841 阅读 · 0 评论 -
网络爬虫之简单例子
网络爬虫的简单例子###京东页面的简单爬取 import requests url="http://item.jd.com/2967929.html"try: r=requests.get(url) r.raise_for_staus() r.encoding=r.apparent_encoding print(r.text[:1000]) except: p原创 2017-03-09 08:40:41 · 470 阅读 · 0 评论 -
深度学习之tensorflow的探索
Tensorflow的使用方法和代码演示 第一部分 tensorflow的运行流程,主要分2步,分别是构造模型和训练 Tensorflow 中的几个概念是tensor,variable,placeholder,训练阶段需要session 1,tensor的意思是张量,其实就是矩阵,tensorflow 中的矩阵表示形式, a=tf.zeros(shape=[1,2]) 不过要注意,转载 2017-06-06 09:19:42 · 792 阅读 · 0 评论 -
斯坦福-CS224N-自然语言处理初介绍
什么是自然语言处理? 自然语言处理是一门交叉学科包含,计算机科学、人工智能以及语言学的交叉学科。虽然语言只是人工智能的一部分,但是它非常独特的一部分。自然语言处理的目标是让计算机处理或者说“理解”自然语言,以完成有意义的任务,比如订机票购物或者QA等。完全理解和表达语言是极其困难的,完美的语言理解等效于人工智能。 自然语言处理设计几个层次 ...转载 2018-11-30 11:17:26 · 1086 阅读 · 0 评论 -
CS224N连载系列_word2vec作业的解析(2)
所有的语言模型的发展都离不开最基础的模型,统计语言模型是最重要的一环,word2vec也是如此,统计语言模型是用来计算一个句子的概率的概率模型,通常是基于一个语料库来构建,那什么叫一个句子的概率呢? 1、softmax softmax 函数通常处理机器学习分类问题的输出层的激活函数,它的输入是一个实数向量,输出向量的长度是与输入向量相同,但所有的取值范围是(0,1),且所有元素的和为1,输出向...原创 2018-12-17 10:18:28 · 369 阅读 · 0 评论 -
西瓜书——决策树
决策树(DT)是用于分类和回归的非参数监督学习方法。目标是创建一个模型,通过学习从数据特征推断出的简单决策规则来预测目标变量的值。 例如,在下面的示例中,决策树从数据中学习以使用一组if-then-else决策规则来近似正弦曲线。树越深,决策规则越复杂,模型越适合。 决策树的一些优点是: 易于理解和解释。树木可以看到。 需要很少的数据准备。其他技术通常需要数据规范化,需要创建虚...转载 2018-12-11 09:35:45 · 574 阅读 · 0 评论