
python
一路向北的人
这个作者很懒,什么都没留下…
展开
-
在bert的基础模型上训练自己的数据(只是过程源码解析后面更新)
1.第一步从github上下载bert的源码链接,并且下载BERT模型链接2.第二步准备数据中文数据样式如图所示:(每一句话一行)3.第三步使用bert/create_pretraining_data.py来做数据的预处理主要是修改改文件的FLAGS.参数即可4.第四步运行bert/run_pretraining.py 同样只要修改FLAGS.参数 即可到这就可以了...原创 2020-06-19 15:32:24 · 4752 阅读 · 4 评论 -
模拟浏览器爬虫
模拟流浪器爬取近义词,并通过BeautifulSoup 和正则将近义词解析出来import urllib.parseimport urllib.requestfrom bs4 import BeautifulSoup as bsurl = 'http://jinyici.xpcha.com/'user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64...原创 2019-05-21 11:33:49 · 762 阅读 · 0 评论