[原创][爬虫学习·二]爬取nndc上的核素数据

本文介绍了如何爬取nndc官网上的核素数据,包括S(n)和S(p)。通过三个步骤,首先获取核素名称和质量数,然后去重,最后构造URL请求爬取详细数据并保存到CSV文件。
摘要由CSDN通过智能技术生成

[原创][爬虫学习·二]爬取nndc上的核素数据

本文爬取的目标:爬取nndc官网上核素的数据(S(n),S(p))。

步骤如下:1)首先爬取所有核素的名称和质量数,将内容写入nucleus.txt;

2)去除nucleus.txt中的重复行,得nucleus_new.txt;

3)逐行读取nucleus_new.txt中的核素信息并构造URL请求,爬取nndc官网上核素的S(n)和S(p)数据,将结果写入nucleusSnSp.csv文件。

步骤一

先来看一下nndc的搜索页面:

https://www.nndc.bnl.gov/nudat2/indx_sigma.jsp

得到上图所示页面,点击页面中的search按钮。得:

元素左上角为质量数,审查红圈内元素,发现爬取其信息是较为简单的。写出代码如下:

from selenium import webdriver
co = webdriver.ChromeOptions()
co.headless = False #是否有浏览界面
chrome_driver = r'D:\anaconda\Lib\site-packages\selenium\webdriver\chrome\chromedriver.exe'
browser = webdriver.Chrome(executable_path=chrome_driver, options=co)
url = 'https://www.nndc.bnl.gov/nudat2/indx_sigma.jsp'
browser.get(url)
form = browser.find_element_by_tag_name('form'
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值