
Python
丈哥SEO
交流seo请私信
展开
-
python数据抓取BeautifulSoup使用介绍
1. Beautiful Soup 的简介简单来说,Beautiful Soup 是 python 的一个库,最主要的功能是从网页抓取数据。官方解释如下:Beautiful Soup 提供一些简单的、python 式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。 Beautiful Soup 自动将输入文档转换为 Unicode 编码,输出文档转换为 utf-8 编码。你不需要考虑编码方式原创 2020-11-18 01:49:45 · 692 阅读 · 0 评论 -
Python爬取新浪微博实操
第一步:选择从手机端爬取新浪微博手机端地址:https://m.weibo.cn/登录自己的微博账号。第二步:爬取刘亦菲的微博为例:2.1获取需要爬取微博的Request_URL,以及构造网络请求的User_Agent和Cookies:右键-检查,刷新网页,Network,size排序,其中Request_URL就是我们需要爬取微博的请求地址,如图:User_Agent和Cooki...原创 2019-12-01 22:20:01 · 2449 阅读 · 0 评论 -
如何将Python程序打包成window系统下可执行的exe?
第一步:需要使用一个第三方包pyinstaller安装这个包的命令是:pip install pyinstaller查看是否安装过这个包,使用pip list第二步:pyinstaller -F 路径+文件名输入:pyinstaller -F E:\test\test.py另外,如果是需要特定的logo的话,找.ico图执行pyinstaller -F -i E:\test\Tes...原创 2019-12-01 22:15:32 · 700 阅读 · 0 评论 -
关于SEO中的爬虫技术讲解
做SEO的,如果不了解爬虫技术,那可以说非常可惜的。根据使用场景,网络爬虫可分为 通用爬虫 和 聚焦爬虫 两种.通俗的讲,通用爬虫就是商业搜索引擎的爬虫。聚焦爬虫就是我们为了SEO开发的爬虫。一.通用爬虫通用网络爬虫 是 捜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部分。主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。通用搜索引擎(Search...原创 2019-06-28 10:21:31 · 3950 阅读 · 0 评论 -
图解Python的垃圾回收机制
Python的GC模块主要运用了“引用计数”(reference counting)来跟踪和回收垃圾。在引用计数的基础上,还可以通过“标记-清除”(mark and sweep)解决容器对象可能产生的循环引用的问题。通过“分代回收”(generation collection)以空间换取时间来进一步提高垃圾回收的效率。引用计数机制:python里每一个东西都是对象,它们的核心就是一个结构体:P...原创 2019-06-28 10:47:26 · 511 阅读 · 0 评论 -
Python 爬虫面试题,Python面试必看
先来一份完整的Python爬虫工程师关于Python面试的考点:搞定这套 Python 爬虫面试题,Python面试 so easy一、 Python 基本功1、简述Python 的特点和优点Python 是一门开源的解释性语言,相比 Java C++ 等语言,Python 具有动态特性,非常灵活。2、Python 有哪些数据类型?Python 有 6 种内置的数据类型,其中不可变数据...原创 2019-06-28 10:49:52 · 2157 阅读 · 0 评论