神经网络文本分类案例

1 数据来源

实验过程中,从中国期刊网上下载了600篇Web文档作为实验数据,实验数据中包括政治、经济、军事、法律、教育、体育、娱乐、科技、外语、计算机等10个主题,每个主题的数据包括60篇文档。再选择500篇文档作为训练集合。另外100篇作为测试集合。

2 数据预处理

对实验数据进行预处理及特征提取
SVD(Singular Value Decomposition) 奇异值分解 降维

3 设计网络拓扑结构

首先确定BP网络输出层神经元的个数,根据类别的个数来确定输出层神经元的个数.实验数据分别属于10个类,因此网络输出层神经元个数为10。输入层神经元的个数为文档在进行特征提取之后向量的维数,实验中,经过降维以后的每篇文档特征向量的维数为30。所以将网络的输入层神经元的个数选取为30。

隐含层神经元个数的选取往往取决于经验或多次实验.实验中采用如下公式:

n1=n+m+a

这里m和n为输入层神经元和输出层神经元的个数,这里a=2,因此隐含层神经元的个数为8。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值