- 博客(2)
- 收藏
- 关注
原创 在bert的基础模型上训练自己的数据(只是过程源码解析后面更新)
1.第一步从github上下载bert的源码链接,并且下载BERT模型链接2.第二步准备数据中文数据样式如图所示:(每一句话一行)3.第三步使用bert/create_pretraining_data.py来做数据的预处理主要是修改改文件的FLAGS.参数即可4.第四步运行bert/run_pretraining.py 同样只要修改FLAGS.参数 即可到这就可以了...
2020-06-19 15:32:24 4677 4
原创 模拟浏览器爬虫
模拟流浪器爬取近义词,并通过BeautifulSoup 和正则将近义词解析出来import urllib.parseimport urllib.requestfrom bs4 import BeautifulSoup as bsurl = 'http://jinyici.xpcha.com/'user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64...
2019-05-21 11:33:49 747
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人