- 博客(7)
- 收藏
- 关注
原创 Task5基于深度学习的文本分类#DataWhale NLP自然语言处理
通过word2vec学习词向量。word2vec模型背后的基本思想是对出现在上下文环境里的词进行预测。对于每一条输入文本,我们选取一个上下文窗口和一个中心词,并基于这个中心词去预测窗口里其他词出现的概率。因此,word2vec模型可以方便地从新增语料中学习到新增词的向量表达,是一种高效的在线学习算法(online learning)。word2vec的主要思路:通过单词和上下文彼此预测,对应的两个算法分别为:Skip-grams (SG):预测上下文Continuous Bag of Words (C
2020-07-31 21:09:24 151
原创 Datawhale python基础 Task 3 异常处理
好好学习,报错再不用翻译软件。。异常就是运行期检测到的错误。计算机语言针对可能出现的错误定义了异常类型,某种错误引发对应的异常时,异常处理程序将被启动,从而恢复程序的正常运行。Python 标准异常总结BaseException:所有异常的 基类Exception:常规异常的 基类StandardError:所有的内建标准异常的基类ArithmeticError:所有数值计算异常的基类FloatingPointError:浮点计算异常OverflowError:数值运算超出最大限制Zer
2020-07-25 22:07:33 164
原创 Datawhale python 基础
异常就是运行期检测到的错误。计算机语言针对可能出现的错误定义了异常类型,某种错误引发对应的异常时,异常处理程序将被启动,从而恢复程序的正常运行。天天改错误快瞎。加深印象。Python 标准异常总结BaseException:所有异常的 基类Exception:常规异常的 基类StandardError:所有的内建标准异常的基类ArithmeticError:所有数值计算异常的基类FloatingPointError:浮点计算异常OverflowError:数值运算超出最大限制ZeroDi
2020-07-25 21:09:25 112
原创 Datawhale python 文本分类算法
完成 赛题的数据数据刚刚结束,咋就又交作业了。还好顺利完成,对python 也比较熟悉了。今天学习用机器学习算法对新闻分类。基于机器学习的文本分类在本章我们将开始使用机器学习模型来解决文本分类。机器学习发展比较广,且包括多个分支,本章侧重使用传统机器学习,从下一章开始是基于深度学习的文本分类。学习目标学会TF-IDF的原理和使用使用sklearn的机器学习模型完成文本分类机器学习模型机器学习是对能通过经验自动改进的计算机算法的研究。机器学习通过历史数据训练出模型对应于人类对经验进行归纳的过程,
2020-07-25 21:06:16 204
原创 Datawhale NLP自然语言处理 Task3
今天按照群内打开要求,学习了TF-IDF的原理和使用+使用sklearn的机器学习模型完成文本分类。机器学习是对能通过经验自动改进的计算机算法的研究。机器学习通过历史数据训练出模型对应于人类对经验进行归纳的过程,机器学习利用模型对新数据进行预测对应于人类利用总结的规律对新问题进行预测的过程。在机器学习算法的训练过程中,假设给定NNN个样本,每个样本有MMM个特征,这样组成了N×MN×MN×M的样本矩阵,然后完成算法的训练和预测。同样的在计算机视觉中可以将图片的像素看作特征,每张图片看作hight×wid
2020-07-25 21:02:16 114
原创 Datawhale python学习 循环语句
第三次python学习。能够自己干活的循环语句while 循环while语句最基本的形式包括一个位于顶部的布尔表达式,一个或多个属于while代码块的缩进语句。while 布尔表达式:代码块while循环的代码块会一直循环执行,直到布尔表达式的值为布尔假。如果布尔表达式不带有<、>、==、!=、in、not in等运算符,仅仅给出数值之类的条件,也是可以的。当while后写入一个非零整数时,视为真值,执行循环体;写入0时,视为假值,不执行循环体。也可以写入str、list或任何序
2020-07-23 21:22:45 522
原创 Datawhale task3 循环结构-python入门
今天学习了循环语句。while 循环while语句最基本的形式包括一个位于顶部的布尔表达式,一个或多个属于while代码块的缩进语句。while 布尔表达式:代码块while循环的代码块会一直循环执行,直到布尔表达式的值为布尔假。如果布尔表达式不带有<、>、==、!=、in、not in等运算符,仅仅给出数值之类的条件,也是可以的。当while后写入一个非零整数时,视为真值,执行循环体;写入0时,视为假值,不执行循环体。也可以写入str、list或任何序列,长度非零则视为真值,执
2020-07-23 21:17:17 459
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人