Python爬取蚂蜂窝教程

最新推荐文章于 2024-07-15 00:24:10 发布

正好儿

最新推荐文章于 2024-07-15 00:24:10 发布

阅读量1.3w

点赞数 5

分类专栏： Python 爬虫文章标签： python 爬虫经验 website

本文链接：https://blog.csdn.net/zhengy1995/article/details/52692969

版权

本文分享了使用Python进行爬虫学习的经验，重点介绍了如何爬取蚂蜂窝网站的数据。内容包括PythonIDE的选择与安装、正则表达式基础、所需库如re、urllib2、BeautifulSoup和json的使用。通过分析爬虫代码，展示了如何抓取特定页面，处理不同店铺信息的差异，并以JSON格式保存数据。

摘要由CSDN通过智能技术生成

　　最近因为项目需要，就去了解学习了Python爬虫的一些知识，并在此分享出学习过程中的难题和经验。
　　先看最终程序输出

　　{
 "website": "<a href="http://www.somboonseafood.com/" target="_blank" rel="nofollow">http://www.somboonseafood.com/</a>", 
 "comment": [
  "进去里面已经人满为患，服务生来往都是急匆匆的。我们前面还有一桌外国人在等位子。好在等待的时间不长，很快我们被带到了二楼。

菜单上有中英文的翻译。我们除了必点的咖喱蟹，还点了腰果鸡肉，酸辣鱿鱼，芒果糯米饭和冬阴功汤。建兴比较好的是菜品都有小份的，适合2人吃的。

这顿饭具体花了多少泰铢不记得了，反正折合人民币二百多吧。他家不能拉卡，只能付现金哦~", 
  "http://b3-q.mafengwo.net/s8/M00/4B/D5/wKgBpVXxM4aAdrXbACreEebl8Ug36.jpeg?imageMogr2%2Fthumbnail%2F%21200x150r%2Fgravity%2FCenter%2Fcrop%2F%21200x150%2Fquality%2F90", 
  "http://a1-q.mafengwo.net/s8/M00/4B/E8/wKgBpVXxM5GAD-uAAAuCjK25BIo42.jpeg?imageMogr2%2Fthumbnail%2F%21200x150r%2Fgravity%2FCenter%2Fcrop%2F%21200x150%2Fquality%2F90", 
  "http://n3-q.mafengwo.net/s8/M00/4B/EC/wKgBpVXxM5KAMPIxAAz_DjXUweA78.jpeg?imageMogr2%2Fthumbnail%2F%21200x150r%2Fgravity%2FCenter%2Fcrop%2F%21200x150%2Fquality%2F90", 
  "我们四个人点了红油咖喱蟹，粉丝闷虾，炒含羞草，还有芒果汁，柠檬汁。咖喱蟹很好吃，炒的很香很入味，如果将那红油用来拌饭，味道肯定很赞；粉丝闷虾也不错，四个人吃刚刚好；含羞草就有点老了，除此之外还有个酱油蒸石斑鱼，按斤卖的，一条快一千多了，不过肉质很劲道，吃多来还能塞牙缝呢，真的很新鲜", 
  "http://a1-q.mafengwo.net/s8/M00/FD/32/wKgBpVXsL3eAb2oLAAs12tssU2Y97.jpeg?imageMogr2%2Fthumbnail%2F%21200x150r%2Fgravity%2FCenter%2Fcrop%2F%21200x150%2Fquality%2F90", 
  "http://c3-q.mafengwo.net/s8/M00/FD/3C/wKgBpVXsL4OAOf0zAAjok0qVt-406.jpeg?imageMogr2%2Fthumbnail%2F%21200x150r%2Fgravity%2FCenter%2Fcrop%2F%21200x150%2Fquality%2F90", 
  "http://c1-q.mafengwo.net/s8/M00/FD/46/wKgBpVXsL5CAT3kGAAn4-5VHSAg78.jpeg?imageMogr2%2Fthumbnail%2F%21200x150r%2Fgravity%2FCenter%2Fcrop%2F%21200x150%2Fquality%2F90", 
  "咖喱螃蟹不错，就是螃蟹少了鸡蛋多了哈哈哈，感觉最好吃的是我们随便点的虾子，炸得超级脆然后上面裹的粉好好吃。三个菜加一瓶矿泉水1000多株，感觉有点小贵，因为感觉没有传说中的那么那么好吃哈哈哈", 
  "http://a2-q.mafengwo.net/s8/M00/78/4D/wKgBpVXYk4yAV9M9ABim-ixW7lg98.jpeg?imageMogr2%2Fthumbnail%2F%21200x150r%2Fgravity%2FCenter%2Fcrop%2F%21200x150%2Fquality%2F90", 
  "http://a2-q.mafengwo.net/s8/M00/78/52/wKgBpVXYk5CAbjcKABwM1hcyCZU62.jpeg?imageMogr2%2Fthumbnail%2F%21200x150r%2Fgravity%2FCenter%2Fcrop%2F%21200x150%2Fquality%2F90", 
  "http://b2-q.mafengwo.net/s8/M00/78/57/wKgBpVXYk5SAcFR0ABsEFh2YADQ90.jpeg?imageMogr2%2Fthumbnail%2F%21200x150r%2Fgravity%2FCenter%2Fcrop%2F%21200x150%2Fquality%2F90", 
  "他们这边的咖喱跟我们平时吃的不一样，偏甜一点！", 
  "这一顿才化了1000B多点，这里是不能刷卡的，所以记得带好现金再去！", 
  "http://b1-q.mafengwo.net/s8/M00/FE/BC/wKgBpVXdJmiAE16jAAW6XZkem8k36.jpeg?imageMogr2%2Fthumbnail%2F%21200x150r%2Fgravity%2FCenter%2Fcrop%2F%21200x150%2Fquality%2F90", 
  "http://n3-q.mafengwo.net/s8/M00/FE/97/wKgBpVXdJlWAVXipAAGLzCC7YP400.jpeg?imageMogr2%2Fthumbnail%2F%21200x150r%2Fgravity%2FCenter%2Fcrop%2F%21200x150%2Fquality%2F90", 
  "http://n1-q.mafengwo.net/s8/M00/FE/DD/wKgBpVXdJoCAaODiAAbf-o77ojA68.jpeg?imageMogr2%2Fthumbnail%2F%21200x150r%2Fgravity%2FCenter%2Fcrop%2F%21200x150%2Fquality%2F90", 
  "这顿饭是在曼谷吃的最贵的一餐，总共705铢。这家餐馆的味道也没有想象中多惊艳啦，发现其实泰国随便一家路边的拍档做的泰国菜味道都可以的。", 
  "http://n2-q.mafengwo.net/s8/M00/14/52/wKgBpVXVzzKAS4rrAA2AHp_Mk3w39.jpeg?imageMogr2%2Fthumbnail%2F%21200x150r%2Fgravity%2FCenter%2Fcrop%2F%21200x150%2Fquality%2F90", 
  "http://a2-q.mafengwo.net/s8/M00/14/55/wKgBpVXVzzaAUAa8AAr8LPWGCSA46.jpeg?imageMogr2%2Fthumbnail%2F%21200x150r%2Fgravity%2FCenter%2Fcrop%2F%21200x150%2Fquality%2F90", 
  "http://c3-q.mafengwo.net/s8/M00/14/5A/wKgBpVXVzzmAd_D9AAuDW5yUmOI43.jpeg?imageMogr2%2Fthumbnail%2F%21200x150r%2Fgravity%2FCenter%2Fcrop%2F%21200x150