Python
文章平均质量分 57
只要我足够菜,你们就骂不了我
这个作者很懒,什么都没留下…
展开
-
淘宝商品信息定向爬虫
只用来学习请勿无限制使用爬虫功能描述目标:获取淘宝搜索页面的信息媒体去其中的商品名称和价格程序的结构设计步骤1:提交商品搜索请求,循环获取页面步骤2:对每个页面,提取商品名称和价格信息步骤3:将信息输出到屏幕上修改headers的方法请看:https://blog.csdn.net/wyatt007/article/details/105433009import requestsimport redef getHTMLText(url): try: # 淘宝用了原创 2021-07-19 01:35:19 · 766 阅读 · 0 评论 -
全国理科大学排名定向爬虫实例
全国理科大学排名(拿来练手就好别贪玩哦)程序的结构设计步骤1:从网页上获取大学排名网页内容getHTMLText()步骤2:提取网页内容中信息到合适的数据结构fillUnivList()步骤3:利用数据结构展示并输出结果printUnivList()import requestsfrom bs4 import BeautifulSoupimport bs4def getHTMLText(url): try: r = requests.get(url, timeout原创 2021-07-17 02:24:44 · 107 阅读 · 0 评论 -
Python爬虫学习笔记
requests库Beautiful Soup库Tag标签,最基本的信息组织单元,分别用<>和</>标明开头和结尾Name标签的名字,< p >…< /p >的名字的p,格式:< tag >.nameAttributes标签的属性,字典形式组织,格式:< tag >.attrsNavigableString标签内非属性字符串,<>…</> 中字符串,格式< .原创 2021-07-16 19:35:59 · 122 阅读 · 0 评论