html table 只读,只读一些列时使用readHTMLTable从网站获取表格

问题是,我只是想在第一列(事件)和最后一列(奖章)被读取。 这是我的代码和结果:

temp_URL

tab

head(tab)

Event Athlete Country Result Medal

1 100m Men Tom Burke USA 12.0 GOLD

2 Fritz Hofmann DEU 12.2 est. SILVER

3 Francis Lane USA 12.6 BRONZE

4 Alajos Szokolyi HUN 12.6 est. BRONZE

5 400m Men Tom Burke USA 54.2 GOLD

6 Herbert Jamison USA n/a SILVER

正如你可以看到它返回表的所有列。我在R文档上看到,使用colClasses并指出Null值应该让R忽略该列,但它不适用于我。我知道,一旦你有R中这是很容易,只是创建具有所需列的新数据帧中的数据:

tab

head(tab)

tab.Event tab.Medal

1 100m Men GOLD

2 SILVER

3 BRONZE

4 BRONZE

5 400m Men GOLD

6 SILVER

我真的想避免这种额外的步骤,并在其中找到只有所需的方式数据进入R,原因是因为这个页面是需要读取数千页的代码的一部分,并且多次运行时额外的步骤可能是耗时的。

2016-07-22

Lee

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值