文本特征处理

参考资料:

1.练习-word2vec

2.tensorflow实现中文词向量训练

文本特征处理

1.1理论

词向量-word2vec.(word2vec是一个工具,主要包含两个模型:跳字模型(skip-gram)和连续词袋模型(CBOW),)

自然语言是一套用来表达含义的复杂系统。在这套系统中,词是表义的基本单元。在机器学习中,如何使用向量表示词?

顾名思义,词向量是用来表示词的向量,通常也被认为是词的特征向量。近年来。词向量已逐渐成为自然语言处理的基础知识。

1.2程序

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值