- 博客(6)
- 收藏
- 关注
![](https://csdnimg.cn/release/blogv2/dist/pc/img/listFixedTop.png)
原创 豆瓣电影top250信息爬取与数据分析
爬取豆瓣电影top250的电影信息网页链接:https://movie.douban.com/top250技术路线:requests - bs4 - re输出:保存为csv格式文件import reimport requestsfrom bs4 import BeautifulSoup def getHTMLText(url, code="utf-8"): ...
2019-06-24 13:19:51
10359
7
![](https://csdnimg.cn/release/blogv2/dist/pc/img/listFixedTop.png)
原创 AQI分析与预测
背景信息AQI(Air Quality Index),指空气质量指数,用来衡量空气清洁或污染的程度。值越小,表示空气质量越好。近年来,因为环境问题,空气质量也越来越受到人们的重视。任务说明我期望能够对全国城市空气质量进行研究与分析,希望能够解决如下疑问:哪些城市的空气质量较好/较差? 临海城市是否空气质量优于内陆城市? 空气质量主要受哪些因素影响? 全国城市的空气质量总体情况...
2019-06-19 17:11:17
2839
1
![](https://csdnimg.cn/release/blogv2/dist/pc/img/listFixedTop.png)
原创 足球运动员解析
背景信息当前,足球运动是最受欢迎的运动之一(也可以说没有之一)。在此万受瞩目的运动下,我打算针对足球运动员个人的信息,技能水平等各项指标进行相关的分析与统计。例如,我们可能会关注如下的内容:左撇子适合踢足球吗? 哪个的俱乐部 / 国家拥有综合能力更好的球员(top10)? 足球运动员的号码是否与位置相关? 足球运动员的身价与薪水,违约金是否相关? 哪些技能会对足球运动员的综合能力造...
2019-06-19 14:25:58
2376
原创 股票数据定向爬虫
功能描述:获取上交所和深交所所有股票名称和交易信息输出:保存到文本文件中技术路线:requests - bs4 - re数据网站的确定: 获取股票列表 - 东方财富网:http://quote.eastmoney.com/stock_list.html 获取个股信息 - 百度股票:https://gupiao.baidu.com/stock/ (例:http...
2019-06-21 01:39:05
5499
1
原创 新闻文本词云图
案例背景当前,很多网站提供新闻列表,可以令用户方便的查阅自己感兴趣的信息。然而,用户浏览新闻,也许仅仅只是随便看到一条。网站的资源非常丰富,可能收藏很多用户感兴趣的其他新闻,但是受限于用户对新闻了解的广泛度,很多新闻用户未能发现,网站也因此错误了很多吸引用户的机会。可以根据用户浏览过的新闻,创建词云图,查看用户浏览的关键信息,进而可以根据浏览的新闻,与网站现有的其他新闻进行匹配,自动推...
2019-06-20 14:36:15
969
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人