20.11-情感分析NLP
文章平均质量分 70
情感分析NLP
HIT_SunJiankun
人类的差异性来自于认知阶层的差别,人生的进步在于训练、反馈、优化、迭代
展开
-
深度学习数学理论学习(一)-神经网络结构介绍
参考书籍:《深度学习的数学》Q1:输出层一定是个数吗?两位数真的一定局限于这种输出0还是1的实际问题吗?隐藏层有不同的喜好,神经网络的特性,用来描述传输的权重差异Q3:啥玩意包含Q4:输入的学习数据一直有点懵逼主要结论:图片输入的大小决定了pooling池化层的上限2的n次方——神经元的数量底层网络很限制网络能力,第一层数量不能太少主要学习途径:(1)其他论文的设计 (2)自己的反复试验修正Q5:pooling池化层是干什么的?...原创 2021-12-06 09:09:12 · 203 阅读 · 0 评论 -
基于基础神经网络的实战演练(二)-简单的神经网络搭建
《参考书籍》95-神经网络与深度学习-邱锡鹏98-动⼿学深度学习-9月最新版十、人工神经网络介绍,十一、训练深层神经网络,十二、分布式TensorFlow感知器,输入的数字和权重相连,形成总和,然后再用阶跃函数去处理其总和训练感知器就是在训练其权重上图就是最简单的单一的LTU,是作为简单的线性二元分类Q1:bias神经元?Q2:LTU中,当两个神经元具有相同的输出时,他们之间连接的权重就会增加——不加强导致错误输出的连接?Q4:每个输出神经元的决策边界是线性..原创 2021-12-03 19:51:54 · 1287 阅读 · 0 评论 -
基于神经网络的实战演练(一)-启动,运行与解读TensorFlow
本期主题:启动并运行TensorFlow参考书籍:【AO-AZ-90-蜥蜴书-中文版-Hands on Machine Learning with Scikit Learn and Tensorflow】审核目标:成功跑通蜥蜴书中的前馈神经网络框架,并且成功带入给定的数据集进行分析——注意是实习公司的数据集,不再是原来购买的数据集本小节整体框架——TensorFlowQ1:为什么TensorFlow中有创建图谱这种操作?很本元的一个问题Q3:batch和epoches的含义.原创 2021-12-02 16:07:30 · 886 阅读 · 0 评论 -
文本数据清洗
新闻文本数据中不仅包括了中文字符,还包括了数字、英文字符、标点等非常规字符,这些都是无意义,并且需要处理的数据,清洗的方法使用的是正则表达式。方法一:借助Unicode编码,16进制筛出中文字符匹配规则为:[\u4e00-\u9fa5],\un匹配n,其中n是一个用四个十六进制数字表示的Unicode字符,而4e00-9fa5之间的Unicode编码表示的是20000多个中文字符。具体编码如下:#匹配[^\u4e00-\9fa5]def find_chinese(text): ...原创 2021-11-24 22:59:31 · 6008 阅读 · 0 评论 -
文本特征提取——one-hot
独热编码即 One-Hot 编码,又称一位有效编码。其方法是使用 N位状态寄存器来对 N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。 One-Hot 编码是分类变量作为二进制向量的表示。(1) 将分类值映射到整数值。(2) 然后,每个整数值被表示为二进制向量,除了整数的索引之外,它都是零值,它被标记为1。是一种十分常用的类别处理手段,当特征是离散的,无序的,就可以通过one hot 进行特征数字化,比如一个特征有高、中、低三个值,通过独热编码,就可以分...原创 2021-11-25 09:21:17 · 1477 阅读 · 0 评论