文章标题

几天上化学课有点无聊,背了会儿元素名称,忽然想练爬虫,就顺便把元素名称爬下来。这里写图片描述
`from bs4 import BeautifulSoup as bs
from urllib import request
import re
url = ‘https://www.proprofs.com/flashcards/story.php?title=0-most-common-chemical-elements
thehtml = request.urlopen(url)
html_data = thehtml.read().decode()
soup =bs(html_data,’html.parser’)
theinfo = soup.find(‘table’,class_ = ‘table flashCardsPreviewTable’)
thetarget = theinfo.find_all(‘div’,class_=’front_text card_text’)
theans= theinfo.find_all(‘div’,class_=’back_text card_text’)
thelist = []
file_1 = open(‘C:\Users\YES\Desktop\hh.txt’,’a’)
”’func = re.compile(r’\b\w{2}\b’)”’
for i in range(len(theans)):
thedict={}
thedict[‘name’] = thetarget[i].string
thedict[‘abre’] = theans[i].string
thelist.append(thedict)
”’for i in thelist:
string = str(i)
string1 = func.findall(string)
string1 = str(string1)
file_1.write(string1+’\n’)”’

for i in thelist:
file_1.write(str(i)+’\n’)
file_1.close()
`真的是初学,代码写得很烂 :(
不过还是感觉挺兴奋的,可以做些自己的东西。
把抓的东西写进了文本里,不过还有好多符号。
然后就用正则,但是…… 语法不行……
晚点复习下正则再来解决把。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值