最近无聊在写python爬虫,分享一个爬去nba今天信息的python脚本,可能没写的美观,有优化的请大神指点!


➜  /test sudo vim nba.py
#!/usr/bin/python
#-*- coding:utf-8 -*-
class url:
        def __init__(self,url):
                self.url = url
        def nba(self):
                import re
                import urllib2
                hearders = "User-Agent","Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.113 Safari/537.36"
                url = "%s" %(self.url)
                par = '2018-01-25.*htm\">(.*?)</a></li>'
                opener = urllib2.build_opener()
                opener.addheaders = [hearders]
                urllib2.install_opener(opener)
                html = urllib2.urlopen(url).read().decode("utf-8")
                data = re.findall(par,html)
                print type(data)
                for i in data:
                        print i
u = url('https://news.zhibo8.cc/nba/')
u.nba()


➜  /test sudo python nba.py
<type 'list'>
【翻译组】本赛季勇士的“死亡五小”为何统治力大减?
吉米-巴特勒晒与韦德合照:祝大哥生日快乐
‘坏篮框之树’!奥尼尔晒被自己扣碎过的篮框
杜兰特:火箭打的非常强硬 他们的变化不仅仅是CP3
安东尼27分 亚当斯21+10 雷霆大胜湖人迎3连胜
海沃德发推:很喜爱我们球队的斗志
莱昂纳德复出19+8约基奇23+9+7 马刺主场大胜掘金
铂金压哨劈扣为尼克斯续命 两队进入第二个加时
27分20板!字母哥爆发客场双杀奇才
宝刀未老!诺维茨基20分率队迎独行侠“首胜”
乔治缺阵 威少31+8+6甜瓜11+11 雷霆遭篮网逆转
库里当选全明星西部票王!将成为西部队长!
巴特勒赛后:我们需要变得谦逊 很高兴我们输球了
前瞻-开拓者vs步行者:两者相争,勇者胜
恩比德发推:美妙的一天!伟大的胜利+成为全明星
格里芬:利拉德值得入选全明星 而不是仅在讨论范围中
绝命中投!沃尔拿下赛季新高16助攻
前瞻-马刺VS步行者:五连客终遇银发魔鬼