这是一篇博客
镇楼图
hello wrold
啊第一次开通博客,也不知道写点什么
我是一枚软工大二的学生,因学习需要就开了个博客
目前在学php
和python
最近在跟创新实践做人工智能方面的东西
这个博客用来贴学习遇到的问题还有任务进度
有时候可以也会弄一些乱七八糟的东西
emm先贴一段代码试试看吧
python:
第一个爬虫,用来爬取豆瓣top250
第三方库:
request
BeautifulSoup
import requests
from bs4 import BeautifulSoup
def get_movies():
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.82 Safari/537.36',
'Host': 'movie.douban.com'
}
for i in range(0,10):
link = 'https://movie.douban.com/top250?start=' + str(i * 25)
r = requests.get(link, headers=headers, timeout= 10)
#print (str(i+1),"页响应状态码:", r.status_code)
soup = BeautifulSoup(r.text, "lxml")
div_list = soup.find_all('div', class_='hd')
for each in div_list:
print(each.a.span.text.strip())
return
get_movies()
运行结果:
肖申克的救赎
霸王别姬
这个杀手不太冷
阿甘正传
美丽人生
泰坦尼克号
千与千寻
辛德勒的名单
盗梦空间
机器人总动员
忠犬八公的故事
三傻大闹宝莱坞
…