豆瓣Top250电影爬虫
随着社会科技的发展,互联网已经成为一个庞大的信息载体,通过网络爬虫自动搜集网上的资源已经成为人们利用互联网的高效方法。网络爬虫不仅可以将其采集的资源提供给搜索引擎,解决搜索问题,也可以定向的信息采集,得到人们需要的信息资源,如在招聘网收集岗位信息,购物网收集商品信息等。本次通过python实现了一个在豆瓣网收集豆瓣Top250的信息,通过bs4对其进行解析,搭配正则表达式提取数据,并将信息存入数据库。之后使用Flask实现数据的可视化,通过网页、图表的形式展现出来。关键字:Python, Flask,H



