Python
文章平均质量分 69
StarCoder_Yue
求知若渴,虚怀若谷
展开
-
《动手学深度学习》Task02 文本预处理;语言模型;循环神经网络基础
Task02:文本预处理;语言模型;循环神经网络基础1.文本预处理文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤:(1)读入文本例:我们用一部英文小说,即H. G. Well的Time Machine,作为示例,展示文本预处理的具体过程。import collectionsimport redef read...原创 2020-02-13 22:14:20 · 302 阅读 · 0 评论 -
《动手学深度学习》Task01线性回归;Softmax与分类模型、多层感知机
首先感谢伯禹教育、Datawhale、和鲸科技和各位志愿者给我们的这个机会来组织大家一起学习,本次学习的内容是《动手学深度学习PyTorch版》。Task01:线性回归;Softmax与分类模型、多层感知机1.线性回归: ** **线性回归的基本要素:**模型:对于线性回归,我们需要确定其模型,我们初设为输出与各个输入之间是线性关系,确定了模型之后再来确定模型的参数。数据集:我...原创 2020-02-13 17:16:09 · 468 阅读 · 0 评论 -
决策树熵公式推导
学习打卡内容:学习Datawhale对《李宏毅机器学习》决策树章节补充的内容:Additional References(熵的理解) 个人需得推导其中的公式,对熵的概念理解透彻 计算负责人提供的数据集的shangnonEnt 2 熵考虑另一个问题,对于某个事件,有nn种可...原创 2019-06-05 12:25:23 · 1424 阅读 · 0 评论 -
机器学习基础概念
任务目录:理解偏差和方差学习误差为什么是偏差和方差而产生的,并且推导数学公式过拟合,欠拟合,分别对应bias和variance什么情况学习鞍点,复习上次任务学习的全局最优和局部最优解决办法有哪些梯度下降学习Mini-Batch与SGD学习Batch与Mini-Batch,SGD梯度下降的区别如何根据样本大小选择哪个梯度下降(批量梯度下降,Mini-Batch)写出SGD和Mi...原创 2019-05-17 15:31:54 · 342 阅读 · 0 评论 -
python基础任务五 打卡
任务五 时长:2天1.filea.打开文件方式(读写两种方式)open() 方法Python open() 方法用于打开一个文件,并返回文件对象,在对文件进行处理过程都需要使用到这个函数,如果该文件无法被打开,会抛出 OSError。注意:使用 open() 方法一定要保证关闭文件对象,即调用 close() 方法。open() 函数常用形式是接收两个参数:文件名(f...原创 2019-04-09 15:58:14 · 252 阅读 · 0 评论 -
python基础 任务二 打卡
任务二 时长:2天1.Python列表(List)序列是Python中最基本的数据结构。序列中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。Python有6个序列的内置类型,但最常见的是列表和元组。序列都可以进行的操作包括索引,切片,加,乘,检查成员。此外,Python已经内置确定序列的长度以及确定最大和最小的元素的方法。...原创 2019-04-02 23:16:44 · 298 阅读 · 0 评论 -
python基础任务六 打卡
任务六 时长:2天啥是佩奇代码复现参考链接:https://mp.weixin.qq.com/s/whtJOrlegpWzgisYJabxOg https://www.cnblogs.com/nowgood/p/turtle.htmlpython2.6版本中后引入的一个简单的绘图工具,叫做海龟绘图(Turtle Graphics),tur...原创 2019-04-11 12:46:36 · 299 阅读 · 0 评论 -
python基础任务四 打卡
任务四 时长:1天1. 函数关键字函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。函数能提高应用的模块性,和代码的重复利用率。函数代码块以def关键词开头,后接函数标识符名称和圆括号()。 任何传入参数和自变量必须放在圆括号中间。圆括号之间可以用于定义参数。 函数的第一行语句可以选择性地使用文档字符串—用于存放函数说明。 函数内容以冒号起始,并且缩...原创 2019-04-06 09:52:22 · 227 阅读 · 0 评论 -
python基础任务三 打卡
任务三 时长:2天1. dict字典a. 定义字典是另一种可变容器模型,且可存储任意类型对象。字典的每个键值key=>value对用冒号:分割,每个键值对之间用逗号,分割,整个字典包括在花括号{}中 ,格式如下所示:b. 创建访问字典元素就是字典名加方括号里面写要访问的键(key)键一般是唯一的,如果重复最后的一个键值对会替换前面的,...原创 2019-04-05 19:49:16 · 247 阅读 · 0 评论 -
python基础任务1打卡
任务一 时长:2天1. 环境搭建a) anaconda环境配置我是在Mac 环境下直接下载安装的Anaconda,(因为是很久之前装好的,所以这里给出一些截图) b) 解释器这里用的是Pycharm,两种Python解释器:Python3.6与python2.72. python初体验 a)print and input3. python...原创 2019-03-31 11:44:07 · 318 阅读 · 0 评论 -
更改jupyter 代码字体大小及自动补全
以前总觉得jupyter的界面不美观,也没有自动补全,找了很久终于解决了这个问题。 首先说自动补全: 操作步骤: 1.通过anconda navigator界面,选择environments,选择对应环境名,选择open terminal。 2.安装nbextensionspip install jupyter_contrib_nbexten...原创 2019-01-19 10:17:19 · 10342 阅读 · 2 评论 -
机器学习实战——KNN学习笔记
K近邻算法概述:K最近邻(k-Nearest Neighbor,以下简称KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。(来自百度词条)利弊分析:KNN 是分类数据最简单最有效的算法,他的核心思想是基于实例的学习,使用时我们必...原创 2018-11-17 12:19:22 · 507 阅读 · 0 评论 -
网络爬的是什么虫(一)
我对爬虫的理解是,互联网是一张网,那么爬虫就是一只趴在这个网上的虫子,爬呀爬呀去找自己想找的东西,爬虫可以由多种语言来实现,其中Python用的较多。从网页上抓取内容大致分3步:1、模拟浏览器访问,获取html源代码2、通过正则匹配,获取指定标签中的内容3、将获取到的内容写到文件中然后我跟着网络上的一些教程去写了一些实战,发现很有意思,比如每天爬一下自己所在原创 2017-08-14 15:34:37 · 842 阅读 · 0 评论