[原创][爬虫学习·二]爬取nndc上的核素数据

最新推荐文章于 2020-06-17 23:57:58 发布

魂灵序曲

最新推荐文章于 2020-06-17 23:57:58 发布

阅读量1.6k

点赞数 2

分类专栏：爬虫

本文链接：https://blog.csdn.net/u014645508/article/details/106117402

版权

本文介绍了如何爬取nndc官网上的核素数据，包括S(n)和S(p)。通过三个步骤，首先获取核素名称和质量数，然后去重，最后构造URL请求爬取详细数据并保存到CSV文件。

摘要由CSDN通过智能技术生成

[原创][爬虫学习·二]爬取nndc上的核素数据

本文爬取的目标：爬取nndc官网上核素的数据（S（n），S（p））。

步骤如下：1）首先爬取所有核素的名称和质量数，将内容写入nucleus.txt；

2）去除nucleus.txt中的重复行，得nucleus_new.txt；

3）逐行读取nucleus_new.txt中的核素信息并构造URL请求，爬取nndc官网上核素的S（n）和S（p）数据，将结果写入nucleusSnSp.csv文件。

步骤一

先来看一下nndc的搜索页面：

https://www.nndc.bnl.gov/nudat2/indx_sigma.jsp

得到上图所示页面，点击页面中的search按钮。得：

元素左上角为质量数，审查红圈内元素，发现爬取其信息是较为简单的。写出代码如下：

from selenium import webdriver
co = webdriver.ChromeOptions()
co.headless = False #是否有浏览界面
chrome_driver = r'D:\anaconda\Lib\site-packages\selenium\webdriver\chrome\chromedriver.exe'
browser = webdriver.Chrome(executable_path=chrome_driver, options=co)
url = 'https://www.nndc.bnl.gov/nudat2/indx_sigma.jsp'
browser.get(url)
form = browser.find_element_by_tag_name('form'

最低0.47元/天解锁文章

魂灵序曲

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
[原创][爬虫学习·二]爬取nndc上的核素数据

[原创][爬虫学习·二]爬取nndc上的核素数据本文爬取的目标：爬取nndc官网上核素的数据（S（n），S（p））。步骤如下：1）首先爬取所有核素的名称和质量数，将内容写入nucleus.txt；2）去除nucleus.txt中的重复行；3）逐行读取nucleu.txt并构造请求，爬取核素的S（n）和S（p）数据，写入nucleusSnSp.csv文件。步骤一先来看一下页面：https://www.nndc.bnl.gov/nudat2/indx_sigma.jsp...
复制链接

扫一扫