NBA数据爬虫+比分预测

最新推荐文章于 2025-03-25 11:33:02 发布

'Humz

最新推荐文章于 2025-03-25 11:33:02 发布

阅读量1.1k

点赞数 1

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43025542/article/details/104615313

版权

python 专栏收录该内容

15 篇文章

订阅专栏

1、NBA数据爬虫

爬取的数据主要有，主队名称、客队名称、比赛日期、两队各节的分数。
数据主要从http://www.stat-nba.com获取。

def get_url_content(url):
    #获取比赛时间
    res = requests.get(url)
    res.encoding = 'utf-8'
    soup = BeautifulSoup(res.content, 'html.parser')
    div_time = soup.find_all('div', attrs={"style":"float: left;margin-top: 25px;margin-left: 10px;font-size: 16px;font-weight: bold;color: #009CFF"})
    date = re.findall(r"(\d{4}-\d{1,2}-\d{1,2})", str(div_time[0]))
    
    #获取主队客队
    div_title = soup.find_all('div', attrs={"class":"title"})
    season = div_title[0].string
    home_team, visit_team = div_title[1].find('a').string, div_title[2].find('a').string
    
    #获取每节比分
    div_table = soup.find_all('div', attrs={"class":"table"})
    home_score = div_table[0].find_all('td', class_='number')
    visit_score = div_table[1].find_all('td', class_='number')
    home_everystage_score = [home_score[i].string for i in range(0,4)]
    visit_everystage_score = [visit_score[i].string for i in range(0,4)]
    return season, date, home_team, visit_team, home_everystage_score, visit_everystage_score

遍历2019~2020赛季的每一场比赛，获取相应数据存入数据框中：

def run():
    basketball_frame = []
    for i, j in enumerate(range(43977,45362)):
        try:
            url = 'http://www.stat-nba.com/game/' + str(j) + '.html'
            print(url)
            basketball_frame.append(get_url_content(url))
        except:
            pass
    bf = pd.DataFrame(basketball_frame)
    return bf
    
bf = run()
bf.to_csv(r'存储路径')

博客等级

码龄7年

24
原创

56
点赞

246
收藏

30
粉丝

关注

私信

热门文章

分类专栏

python 15篇
机器学习 2篇
rnn 3篇
深度学习 10篇
NLP 3篇
知识图谱 1篇
数据库 1篇
基因 1篇
基金 1篇
竞赛 2篇
时间序列 1篇
大数据 3篇

最新评论

倍投能赚钱？用数据来说话！python来告诉你答案
qq_33701041: 其实是这样的，这个也不是啥秘密，自己也可以计算出来的。逻辑是这样的，你的筹码会出现很多次不输不赢的横向交易，账户发生大的变动的时候是这样的，当你连续输导致下次的筹码不断变大，然后就会出现赢一次的情况。但是也可能出现最后一次输，导致下一次筹码不够，从而使这个账户停止运行。比如说你有20个账户，每个账户500块。每次你就投1块，输了乘以3。运行结果大致是这样的，你的12个账户是亏损的，平均亏损300左右，少部分亏400+，少部分爆赚，爆赚的原因也是因为下次投注凑吗不够而停止，但是那个时候，爆赚的账户筹码已经足够大了，只是说乘以3后的筹码不够，从而导致剩下很多筹码。然后整个账户会是盈利的状态。然后如果是百分之50胜率的游戏，我都可以直接和你做，我直接宣布财富自由。网赌中往往是有水钱0.05个点，然后是比大小中又豹子，豹子通杀，导致赢的概率下降。
倍投能赚钱？用数据来说话！python来告诉你答案
'Humz: 说实话，肯定有逻辑错误，在不抽水的情况下这游戏的期望就是0，除非本金无限大，玩下去只可能输
LSTM时间序列预测结果呈现出一条直线的解决办法
Mickey 素素: 还是不行啊，用rf和svm都行，就是lstm不行，同样的测试集
LSTM时间序列预测结果呈现出一条直线的解决办法
qfssu: 可以考虑下降低学习率，降低学习率后预测正常了
倍投能赚钱？用数据来说话！python来告诉你答案
tccong_: 题外话：：：赚了不会收手跑路的，只会觉得，那我赚完等一天两天重新玩重新开始不就行了，还能继续赚，事实上是只要玩，等多久都是还在同一局的韭菜篮子里，挣得越多越想再来一次，白嫖成万的钱谁不爽

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

'Humz 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。