用到的库以及用法介绍:
1.requests http://2.python-requests.org/zh_CN/latest/user/quickstart.html 以及 https://www.jianshu.com/p/ecb4d54ad8cf
2.beautifulsoup https://www.cnblogs.com/hanmk/p/8724162.html
3.sys https://www.cnblogs.com/Hybb/p/11518993.html 以及 https://www.jianshu.com/p/985980202ea7
sys模块提供对由解释器使用或维护的某些变量、与解释器交互的函数的访问接口。
遇到的新模块及用法:
1.sys.stdout():类似print()
2.chr():进制转换的一个东西,chr(12288)是中文空格
3.pycharm注释和取消注释代码行,执行以下操作之一:
-
在主菜单上,选择Code | Comment with Line Comment。
-
按Ctrl+/。
4.x.format() https://blog.csdn.net/jpch89/article/details/84099277
目的是爬取豆瓣电影前250名的名称,导演,分数和简评。requests库用来解析地址,bs库用来提取地址中标签里的text,最后输出到Excel或TXT。新版本中可以抓取电影封面。