暴力拆解hupu球员信息

原创 2015年07月11日 00:44:06

之前写了一个拉取nba球员的脚本,是针对hupu网站上的数据进行拉取。由于水平一般,代码写的简单粗暴

hupu球队\球员信息的链接
可以看到球员球队信息。爬出所有球队的链接

teamList = []
response = urllib2.urlopen("http://g.hupu.com/nba/players/")
html = response.read()
def getTeams():
    Items = re.findall('<span class="team_name"><a href=".*?</a></span>',html,re.S)
    for item in Items:
        link = item.replace('<span class="team_name"><a href="','')
        team = re.findall('">.*?</a></span>',link,re.S)[0]
        link = 'http://g.hupu.com/'+link.replace(team,'')
        team = team.replace('">','').replace('</a></span>','')
        teamList.append(teamLink(team,link))

然后再爬出每个球员的详细页面

for team in teamList:
    getPlayers(team)

并且获得数据,存入数据库
这里写图片描述

github链接https://github.com/Leon1Sun/TestPython

相关文章推荐

NBA球员信息管理系统

  • 2013年11月04日 20:20
  • 30KB
  • 下载

西数、希捷、DIY移动硬盘详细拆解,暴力解析

★原厂移动硬盘拆解之西数篇      西数320GB原厂移动硬盘   首先登场的是西数320GB原厂移动硬盘,型号为WD3200ME,外观圆润小巧,便于携带。它使用ABS工程塑料外壳,外观圆...
  • aerchi
  • aerchi
  • 2012年07月16日 16:05
  • 30937

暴力拆解《Numerical Optimization》之信任域方法(下)——Dogleg(狗腿方法)

这一节,我们来介绍一下DogLeg方法。 还记得模型函数吗: 在Dogleg方法中,要求模型函数中的B必须是正定矩阵。至于为什么,先卖个关子,学完之后你自然就明白了。 ...

angular Js 添加查询球员信息

.btn{ width: 100px; height: 40px; background-color: #11c1f3; ...

如何下载NBA球员投篮信息

网站: http://stats.nba.com/ 记录了NBA的各种数据统计,有兴趣的可以自己研究下。找到“View Shotchart”专题内容打开 http://stats.nba.com/,在...

球员信息管理系统

  • 2012年06月24日 13:55
  • 3.96MB
  • 下载

angularJs球员信息表

table tr:nth-child(even){ background: lightgray; } table tr:nth-child(1)...

python爬取NBA球员信息写入MySQL

python爬取NBA球员信息学习了一段时间python,在此写一个简单的爬虫案例,爬取的球员信息使用HDFS存储并利用Hive进行简单的分析,作为Hive的练习数据。过程: - 登录百度百科NBA...

基于MYSQL的球员信息管理

MYSQL 球员信息管理

暴力拆解《Numerical Optimization》之信任域方法(下)——柯西点

虽然《Numerical Optimization》这本书的作者认为,信任域方法和线搜索方法的主要区别在于:线搜索方法是先确定方向,后计算步长;信任域方法是先计算步长,后确认方向。但是我并不这样认为。...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:暴力拆解hupu球员信息
举报原因:
原因补充:

(最多只允许输入30个字)