- 博客(3)
- 收藏
- 关注
原创 [Tensorflow2]AI写唐诗
概述 “AI写唐诗”需要将众多首唐诗作为训练材料,并且要对数据进行一系列的预处理,使其符合模型的输入。这里的“写唐诗”,其实就是根据当前的语句预测下一个字的输出,再将预测的字添加到原来的语句中,以此作为模型的下一次输入,直到预测出结束标志。在预测的时候需要根据我们的要求来合理保存训练的模型。 数据处理 训练材料包含了4w+首诗词,长短不一,每首诗的格式为:标题+冒号+内容,如图所示: 去除冒号前的诗题,只取诗的内容部分: import tensorflow as tf import numpy as np
2020-08-31 13:51:45
892
原创 [TensorFlow2]使用LSTM对英文文本进行情感分类
待处理数据 数据其实也没啥好说的,就是由段落和表征这个段落情感的标志所构成的一个个对,用pandas读进来长这个样子: id sentiment review 5814_8 1 With all this stuff going down at the moment w… 381_9 1 “The Classic War of the Worlds” by Timothy Hin… 7759_3 0 The film starts with a manager (Nicholas B
2020-07-24 18:15:24
1046
3
原创 使用Scrapy进行网易新闻的简单爬取
爬虫小白的第一个实验。。。 网易新闻 网易新闻的主页长这个样子: 其中,看到导航栏中有首页、排行、图片、国内、国际等等栏目,点击一个栏目(国内),发现新闻被排版在这些个class="data_row news_photoview clearfix"的div中,展开一个div可以看到新闻的标题、标签、链接等信息: 而对于导航栏中的各个栏目,有一些栏目的网页结构是类似的,比如国内、国际、军事、航空等等,它们的新闻都被安排在上图所示的结构中,这样可以统一对这几个栏目进行爬取。 Selenium 关于sele
2020-07-24 17:55:15
1016
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人