python word2vector 词 财务报告 指数_python - 如何在开发数据上测试word2vec? - 堆栈内存溢出...

本文探讨了如何在Python中实现word2vec算法,并针对财务报告的词汇进行训练。作者遇到了在测试数据上计算困惑度的问题,目前通过损失函数计算得到的是无穷大。文章中展示了训练过程中的损失变化,寻求关于正确计算困惑度的指导。
摘要由CSDN通过智能技术生成

在计算机任务中,要求实现word2vec算法,以使用神经网络为某些单词生成密集向量。 我实现了神经网络,并通过训练数据对其进行了训练。 首先,如何在测试数据上对其进行测试? 该问题要求绘制一个图表,显示训练期间(时期)训练和测试数据的困惑性。 我可以为此做些损失,就像这样:

EPOCH: 0 LOSS: 27030.09155006593

EPOCH: 0 P_LOSS: 24637.964948774144

EPOCH: 0 PP: inf

/usr/local/lib/python3.6/dist-packages/ipykernel_launcher.py:121: RuntimeWarning: overflow encountered in double_scalars

EPOCH: 1 LOSS: 25349.086587261085

EPOCH: 1 P_LOSS: 22956.95998596929

EPOCH: 1 PP: inf

EPOCH: 2 LOSS: 24245.455581381622

EPOCH: 2 P_LOSS: 21853.32898008983

EPOCH: 2 PP: inf

EPOCH: 3 LOSS: 23312.976009712416

EPOCH: 3 P_LOSS: 20920.849408420647

我是通过以下代码获得的:

# CYCLE THROUGH EACH EPOCH

for i in range(0, self.epochs):

self.loss = 0

self.loss_prob = 0

# CYCLE THROUGH EACH TRAINING SAMPLE

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值