自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 python爬虫学习-task3

IP代理为什么会出现IP被封:网站为了防止被爬取,会有反爬机制,对于同一个IP地址的大量同类型的访问,会封锁IP,过一段时间后,才能继续访问如何应对IP被封的问题有几种套路:修改请求头,模拟浏览器(而不是代码去直接访问)去访问采用代理IP并轮换设置访问时间间隔如何获取代理IP地址从该网站获取: https://www.xicidaili.com/inspect ->...

2020-04-25 18:55:05 200

原创 python爬虫学习-task2

一、Beautiful Soup库入门

2020-04-23 18:06:08 216

原创 python爬虫学习-task1

网页组成网页是由 HTML 、 CSS 、JavaScript 组成的。HTML 是用来搭建整个网页的骨架,而 CSS 是为了让整个页面更好看,包括我们看到的颜色,每个模块的大小、位置等都是由 CSS 来控制的, JavaScript 是用来让整个网页“动起来”,这个动起来有两层意思,一层是网页的数据动态交互,还有一层是真正的动,比如我们都见过一些网页上的动画,一般都是由 JavaScript...

2020-04-21 17:19:44 203

原创 动手学深度学习 Task5 学习

卷积神经网络基础;leNet;卷积神经网络进阶一、卷积神经网络基础二维互相关运算二维互相关(cross-correlation)运算的输入是一个二维输入数组和一个二维核(kernel)数组,输出也是一个二维数组,其中核数组通常称为卷积核或过滤器(filter)。卷积核的尺寸通常小于输入数组,卷积核在输入数组上滑动,在每个位置上,卷积核与该位置处的输入子数组按元素相乘并求和,得到输出数组中相应...

2020-02-19 21:20:26 202

原创 动手学深度学习 Task4 笔记

机器翻译及相关技术;注意力机制与Seq2seq模型;Transformer2.15-2.19一、机器翻译及相关技术定义:机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)。 主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能与源序列的长度不同。数据预处理分词建立词典载入数据集二、注意力机制与Seq2seq模型...

2020-02-19 21:13:30 252

原创 动手学深度学习 Task3 笔记

过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸;循环神经网络进阶2.15-2.19一、过拟合、欠拟合及其解决方案1、过拟合问题模型的训练误差远小于它在测试数据集上的误差,我们称该现象为过拟合(overfitting)。产生过拟合的可能原因模型复杂度过高训练数据过少,特别是比模型参数数量(按元素计)更少解决过拟合的方案降低模型复杂度增加训练数据在计算资源允许的范围之内,我们通常...

2020-02-19 21:03:09 142 1

原创 动手学深度学习 Task2学习笔记-文本预处理等

文本预处理;语言模型;循环神经网络基础2.11-2.14一、文本预处理(1)读入文本import collectionsimport re#逐行读取文本def read_time_machine(): with open('/home/kesci/input/timemachine7163/timemachine.txt', 'r') as f: lines ...

2020-02-14 19:32:35 226

原创 动手学深度学习 Task1笔记-线性回归

# 线性回归;Softmax与分类模型、多层感知机参加datawhale与伯禹学习平台及K-Lab合作的《动手学深度学习》的Pytorch版本。2.11-2.14一、线性回归线性模型假设价格只取决于房屋状况的两个因素,即面积(平方米)和房龄(年)。探索价格与这两个因素的具体关系。线性回归假设输出与各个输入之间是线性关系:损失函数在模型训练中,需要衡量价格预测值与真实值之间的误差。通...

2020-02-14 19:02:09 229

原创 Task 1 - 线性回归算法梳理(学习整理笔记)

1、概念机器学习中比较活跃的四大应用领域:数据挖掘、计算机视觉、自然语言处理、机器人决策机器学习的两大基本问题:回归问题、分类问题机器学习模型:ffeatureslabel样本数据集2、有监督学习(supervised learning)把训练和分类的结果一并丢给计算机分析。 计算机进行学习之后,再丢给它新的未知的数据,它也能计算出该数据导致各种结果的概率,给你一个最接近正确的结...

2019-08-07 15:46:24 193

原创 Python5

1、类和类的对象https://www.cnblogs.com/studyDetail/p/6446180.html2、正则表达式https://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html3、re模块http://blog.sina.com.cn/s/blog_a15aa56901017liq.htm4、datatime模块...

2019-05-19 17:05:21 142

原创 Python 4

1、函数关键字https://www.cnblogs.com/hyesc/p/7766015.html3、函数、参数、作用域http://www.cnblogs.com/whych/p/9630389.html4、函数返回值https://www.cnblogs.com/i-honey/p/7679897.html6、Os模块https://www.cnblogs.com/yufei...

2019-05-17 21:31:44 165

原创 统计 4

2019-05-17 21:28:22 187

原创 统计 3

2019-05-15 21:41:19 139

原创 Python 3

1、Dict字典https://www.runoob.com/python/python-dictionary.html2、集合https://www.cnblogs.com/suendanny/p/8597596.html3、判断语句http://www.91ri.org/7659.htmlhttp://www.php.cn/python-tutorials-409020.html...

2019-05-15 21:38:42 96

原创 统计 2

2019-05-13 20:58:00 167

原创 Python2

1、列表(List)学习链接:“https://blog.csdn.net/sinat_34474705/article/details/68947131”“https://www.cnblogs.com/panwenbin-logs/p/5497771.html”2、元组“https://www.cnblogs.com/spiritman/p/5141824.html”3、string...

2019-05-13 17:07:18 80

原创 Python 1

1、注释方法当行注释:在任何代码行前面加上‘#’符号就可以把它变成一个注释。行末注释:可以在一行代码的最后加注释。多行注释:有时可能想使用多行注释,在每行前面都有一个#字符。三重引号字符串:只需建立一个没有名字的三重引号字符串。2、pep8介绍(1)缩进与换行 每级缩进使用四个空格(2)限制每行的最大长度为79个字符(3)空行顶层函数和类之间使用两个空行类的方法之间用一个空...

2019-05-11 21:04:20 175

原创 统计学 1

2019-05-11 20:57:11 281

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除