十月中旬的小收获
前几天学了用python爬虫,感觉python跟之前学的C额C++比起来都更有意思些,不过现在还没想好之后是主要从事java还是python,毕竟对python了解甚少。
最近干的事:
- python爬虫
- 用C++和easyX做课设基本功能
- 用html和css实现课设扩展功能
- 继续做各种攻防实验,把病毒游戏pandemic2通关了
准备干的事:
- 学习用python处理图片,实现图片相似度识别
- 休息。。
python爬虫我是从某个网站上一个视频跟着学的,功能是从豆瓣上扒电影名称和评分,代码放上来,侵删
import requests
from pyquery import PyQuery as pq
for url in ["https://movie.douban.com/top250?start={}".format(page) for page in range(0, 225+25, 25)]:
html=requests.get(url).text
for item in pq(html)(".item").items():
num=item.find(".pic em").text()
title=item.find(".title").html()
img=item.find(".pic img").attr("src")
star=item.find(".rating_num").html()
print(num, title, img, star)
重点是去网站上看那个页面html代码里使用的各种id,class。
需要使用python的pyquery库,我下载spyder的时候默认是没有这个库的,可以从cmd输入pip list查看已经安装了哪些库,再用install xxx安装没有的库。
实现效果如下图:
继续学习之路!