python爬虫
I_am_???
这个作者很懒,什么都没留下…
展开
-
python爬虫+mongodb+matlab彩票抓取
每一个穷人都有一个发财的梦想。于是彩票这个东西,诞生了。随之而来各种预测方式···千奇百怪十二生肖说,星座说,图象说,等等今天,我摸了摸干瘪的口袋,怀揣着一颗求富的心,试着抓取了2004年到2018年所有的七星彩数据。最后,用MATLAB最简单的BP神经网络(SGD),进行了预测。结果...原创 2018-10-13 14:58:21 · 1017 阅读 · 0 评论 -
python爬取歌词生成词云图
最近试着抓了一下网易歌曲的评论。因为听说python有个wordcloud的包很好用,然后就想用歌词的评论来形成一个词云,用来描述大家对这首歌曲的印象和感慨。每首歌都抓了前30页评论。 总共抓取了六首歌:陈奕迅《我们》五月天《拥抱》五月天《后来的我们》《光辉岁月》《你的名字:前前前世》《七月上》赵雷《成都》GALA《追梦赤子心》许嵩《千古》 爱丽丝镇楼。...原创 2018-10-13 15:19:12 · 2608 阅读 · 0 评论 -
猫眼电影爬虫(参考崔大的书写的)
import json #json会将字典类型转化为字符串类型,利于保存import requests #调用requests库发起get请求import socket #与urlerror类型有关的库,与url库有关,本例没有用到。from requests import RequestException #request异常的库import re #组合与搜索正则表达式的库...原创 2018-10-13 15:24:00 · 1479 阅读 · 0 评论 -
python爬虫爬取淘宝,罗兰电钢琴和雅马哈电钢琴(参考崔大)
淘宝网上有很多商品,这些商品的信息就是一个很不错的数据来源,于是我参考资料后依葫芦画瓢弄了一个爬虫程序来爬一爬梦寐以求的电钢琴。声明一下:电钢琴和电子琴是两种不同的琴,我在正则表达式里面设置了只要含有电子琴这个词语一律不抓取。同时淘宝商家的很多商品栏都是重复的,不加筛选前,我抓了1300个数据,其实只有40个左右不重复的数据。必须加名称不重复的筛选。最近学了selenium,这个Pytho...原创 2018-10-13 15:31:46 · 18812 阅读 · 2 评论