python爬虫——老生常谈的豆瓣top250

用到的库以及用法介绍:

1.requests   http://2.python-requests.org/zh_CN/latest/user/quickstart.html 以及 https://www.jianshu.com/p/ecb4d54ad8cf

2.beautifulsoup   https://www.cnblogs.com/hanmk/p/8724162.html

3.sys  https://www.cnblogs.com/Hybb/p/11518993.html  以及  https://www.jianshu.com/p/985980202ea7

sys模块提供对由解释器使用或维护的某些变量、与解释器交互的函数的访问接口。


遇到的新模块​​​​​及用法:

1.sys.stdout():类似print()

2.chr():进制转换的一个东西,chr(12288)是中文空格

3.pycharm注释和取消注释代码行,执行以下操作之一:

  • 在主菜单上,选择Code | Comment with Line Comment

  • 按Ctrl+/。

4.x.format()  https://blog.csdn.net/jpch89/article/details/84099277


目的是爬取豆瓣电影前250名的名称,导演,分数和简评。requests库用来解析地址,bs库用来提取地址中标签里的text,最后输出到Excel或TXT。新版本中可以抓取电影封面。

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值