机器学习NLP
agsddd
这个作者很懒,什么都没留下…
展开
-
liunx pytroch安装(离线安装)
liunx pytroch安装(离线安装)#pip3 --default-timeout=100 --no-cache-dir install torch==1.4.0 加--default-timeout=10无法解决timeout问题选择离线安装https://pypi.tuna.tsinghua.edu.cn/packages/47/69/7a1291b74a3af0043db9048606daeb8b57cd9dea90b9df740485f3843878/torch-1.4.0...原创 2020-11-30 09:50:00 · 230 阅读 · 0 评论 -
安装NLTK SSL证书验证失败问题(certificate verify failed(Python3.4.3))
原创 2018-05-24 19:00:04 · 1487 阅读 · 0 评论 -
NLP_chattot 项目中特征工程(词袋模型,词向量)
词袋模型(Bag of Word, BOW),只考虑词表(文本中所有出现词的set)中单词在这个句子中的出现次数,统计词频这只是最基本的方式,TF-IDF 是词袋模型的一个经典用法。词向量是将字、词语转换成向量矩阵的计算模型。目前为止最常用的词表示方法是 One-hot,这种方法把每个词表示为一个很长的向量。这个向量的维度是词表大小,其中绝大多数元素为 0,只有一个维度的值为 1,这个维度就代...原创 2019-02-16 23:05:27 · 444 阅读 · 0 评论 -
NLP_chattot项目 数据预处理
四大方面 通过数据洗清、分词、词性标注、去停用词四个大的方面来完成语料的预处理工作。1.数据洗清(不感兴趣的视为噪音的内容清洗删除): a.繁体转简体 b. emjoi表情符以及各种特殊字符(参见百度贴吧类似)以及\n \t 空格符 c.标点符号 d.drop 句子中不包含中文的句子/ drop 3<长度<30的句子2....原创 2019-02-16 21:55:10 · 159 阅读 · 0 评论 -
深度学习入门—基于python的理论与实现笔记
感知机感知机的例子:x1、x2是输入信号,y是输出信号,w1、w2是权重(w是 weight 的首字母)。图中的○称为“神经元”或者“节点”。输入信号被送往神经元时,会被分别乘以固定的权重(w1x1、w2x2)。神经元会计算传送过来的信号的总和,只有当这个总和超过了某个界限值时,才会输出 1。这也称为“神经元被激活”。这里将这个界限值称为阈值,用符号θ表示。 w1和w2是控...原创 2019-03-05 16:04:46 · 1705 阅读 · 0 评论 -
mac 终端 安装及运行 jupyter notebook
pipinstall jupyter notebook 输入 jupyter notebook ,ok!原创 2019-03-05 22:58:03 · 3006 阅读 · 0 评论 -
吴恩达机器学习笔记
机器学习定义:一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,有个经验E后,经过P的评判,程序在处理T时的性能有所提高。经验E是机器上万次的自我练习的经验,任务T是下棋,性能度量值是P回归问题是通过之前数据来推出一个连续的输出,分类问题是推出一组离散的结果。单变量线性回归函数:只含有一个特征/输入变量建模误差:模型所预测的智与训练集中的实际值之间的差距,目标是选出使建模误...原创 2019-02-27 11:56:40 · 194 阅读 · 0 评论 -
python安装tensorflow出现No matching distribution found for tensorflow
pip install -ihttps://pypi.tuna.tsinghua.edu.cn/simple/--upgrade tensorflow原创 2019-03-12 17:23:05 · 6036 阅读 · 2 评论