川川菜鸟
我是一位擅长数据科学、人工智能、网站搭建、网络爬虫和软件/接口测试的专家,同时也是畅销书《Python网络爬虫入门到实战》和《Python3编程从零基础到实战》 作者。
展开
-
全面PDF分析:创建PDF解析API,可商业用
PDF解析API接口制作原创 2024-01-03 10:19:17 · 1037 阅读 · 1 评论 -
《Python网络爬虫入门到实战》重版火热 & ChatAI站点福利升级!
《Python网络爬虫入门到实战》重版火热原创 2023-11-12 21:00:23 · 575 阅读 · 1 评论 -
爬虫项目(13):使用lxml抓取相亲信息
使用lxml抓取相亲信息原创 2023-11-12 20:57:59 · 1495 阅读 · 0 评论 -
爬虫项目(12):正则、多线程抓取腾讯动漫,Flask展示数据
正则抓取腾讯动漫,Flask展示数据原创 2023-11-12 20:44:50 · 1183 阅读 · 0 评论 -
爬虫项目(11):使用多线程对36手机高清壁纸批量抓取
使用多线程对36手机高清壁纸批量抓取原创 2023-11-12 19:43:11 · 1115 阅读 · 0 评论 -
QQ邮箱批量发送,实现用户迁移、广告宣传
QQ邮箱批量发送原创 2023-11-06 23:24:05 · 270 阅读 · 0 评论 -
爬虫项目(10):白嫖抓第三方网站接口,基于Flask搭建搭建一个AI内容识别平台
抓第三方网站接口,基于Flask搭建搭建一个AI内容识别平台原创 2023-11-03 19:58:01 · 3775 阅读 · 4 评论 -
爬虫项目(九):使用Selenium抓取CSDN热榜数据
抓取csdn热榜数据原创 2023-10-07 11:57:44 · 458 阅读 · 1 评论 -
爬虫项目(八):自动获取CSDN博客文章质量评分
自动获取CSDN博客文章质量评分原创 2023-10-02 15:04:50 · 1256 阅读 · 0 评论 -
爬虫项目(七):CSDN博客全部文章信息爬取
CSDN博客全部文章信息爬取原创 2023-10-02 15:01:36 · 1349 阅读 · 0 评论 -
爬虫项目(六):抓取熊猫办公全部摄影图
抓取熊猫办公全部摄影图原创 2023-10-02 14:56:51 · 1164 阅读 · 0 评论 -
爬虫项目(五):抓取网页所有图片
抓取网页所有图片原创 2023-09-19 23:34:45 · 2725 阅读 · 0 评论 -
爬虫项目(四):批量下载高清美女桌面壁纸
批量下载高清美女桌面壁纸原创 2023-09-06 17:09:24 · 1347 阅读 · 0 评论 -
终极策略:如何利用亮数据代理轻松、高效地突破亚马逊的反爬障碍
终极策略:如何利用亮数据代理轻松、高效地突破亚马逊的反爬障碍原创 2023-09-26 09:30:18 · 131566 阅读 · 11 评论 -
川川本人著作《Python网络爬虫入门到实战》
🔥 《Python网络爬虫入门到实战》 🔥 书籍介绍原创 2023-09-19 23:21:09 · 3303 阅读 · 22 评论 -
爬虫项目(三):cookies登录CSDN
cookies登录CSDN原创 2023-09-05 22:47:39 · 4720 阅读 · 0 评论 -
爬虫项目(二):中国大学排名
爬虫项目(二):中国大学排名原创 2023-09-05 02:08:07 · 4072 阅读 · 9 评论 -
爬虫项目(一):艺术二维码制作
爬虫项目(一):艺术二维码制作原创 2023-08-28 14:05:23 · 984 阅读 · 0 评论 -
星火认知大模型API接入Python教程,中文回答效果非常友好
星火认知大模型API接入Python教程,中文回答效果非常友好原创 2023-07-14 12:59:32 · 7856 阅读 · 42 评论 -
GPT4.0写爬虫,连bug都没有
GPT4.0写爬虫,连bug都没有原创 2023-05-15 18:59:44 · 2324 阅读 · 0 评论 -
Jupyter Notebook打开后无法运行代码
Jupyter Notebook打开后无法运行代码原创 2023-03-30 01:27:52 · 1604 阅读 · 0 评论 -
爬虫学习(16):selenium自动化测试:人为模拟滑块移动
模拟滑块移动。原创 2022-11-16 12:58:41 · 1815 阅读 · 1 评论 -
requests爬虫实战:某基金信息爬取
requests爬虫实战练习原创 2022-05-31 21:35:11 · 14749 阅读 · 1 评论 -
爬虫必备技能:使用动态ip
爬虫必备技能:使用动态代理ip原创 2021-12-22 14:10:49 · 7597 阅读 · 4 评论 -
爬虫学习(15):selenium自动化测试(四):截屏、弹出框和下拉框
selenium自动化测试(四):截屏、弹出框和下拉框原创 2022-10-19 16:55:17 · 1025 阅读 · 0 评论 -
爬虫学习(14):selenium自动化测试(三):鼠标和键盘操作
selenium鼠标和键盘自动化原创 2022-10-19 15:49:00 · 616 阅读 · 0 评论 -
爬虫学习(13):selenium自动化测试(二):等待页面加载完成
selenium自动化测试(二):等待页面加载完成原创 2022-10-19 12:40:53 · 1448 阅读 · 1 评论 -
爬虫学习(12):selenium自动化测试(一):初学+单个元素定位
selenium元素定位原创 2021-12-19 01:22:40 · 10548 阅读 · 14 评论 -
爬虫学习(11):python验证码识别
爬虫验证码识别原创 2021-11-16 18:22:11 · 1636 阅读 · 3 评论 -
爬虫学习(10):python正则表达式大全
文章目录前言正则表达式模块Python中的正则表达式正则表达式函数findall() 函数search() 函数split() 函数sub() 函数元字符列表符号转义符任意符号开始符结束符星号符加号符集合符号或符特殊序列指定字符指定开头结尾匹配中间字符匹配数字匹配非数字空格匹配匹配非空格匹配任意数字和字母匹配任意非数字和字母匹配结尾集合套装指定符范围匹配匹配任意范围内小写字母匹配对象span函数string函数group函数前言本篇内容,我是在基础专栏讲过的,为什么在这个专栏拿出来?说明我们爬虫要用到正原创 2021-10-26 20:00:44 · 10121 阅读 · 9 评论 -
爬虫学习(9):python 自动发送QQ邮箱
文章目录一、授权码获取二、发送文本和附件三、猜想四、声明一、授权码获取开启它:发送短信:发送后点击我已发送:把这个授权码复制下来保存起来,下次还可以用。二、发送文本和附件你只需要修改邮箱,授权码,当然如果你想发送附件也把附件路径加上即可。python代码:# coding=gbk"""作者:川川@时间 : 2021/11/10 10:50群:970353786"""import smtplibfrom email.mime.text import MIMEText原创 2021-11-10 11:01:13 · 7540 阅读 · 43 评论 -
爬虫学习(8):xpath helper使用教程
懒人爬虫xpath helper工具。原创 2021-11-05 01:27:28 · 12372 阅读 · 0 评论 -
爬虫学习(7):通宵两万字xpath教程+实战练习
文章目录一、必看内容!!!1)简短介绍2)必备知识3)为什么我要写这篇文章?4)强烈推荐教程专栏二、开始使用xpath2.1 常见的 HTML 操作2.2 常见XML操作2.2.1 选择一个元素2.2.2 选择文字2.3 浏览器使用xpath调试2.3.1演示案例一三、检查节点是否存在3.1 案例一3.2 案例二四、检查节点的文本是否为空4.1 案例一4.2 案例二五、通过属性查询5.1 查找具有特定属性的节点5.2 通过属性值的子串匹配来查找节点5.3 通过属性值的子字符串匹配查找节点(不区分大小写)5.原创 2021-10-11 15:48:33 · 3762 阅读 · 79 评论 -
爬虫学习(6):通宵两万字xpath教程,学不会找我
文章目录一、必看内容!!!1)简短介绍2)必备知识3)为什么我要写这篇文章?4)推荐专栏二、开始手撕xpath2.1)常见的 HTML 操作一、必看内容!!!1)简短介绍XPath 是一种用于寻址 XML 文档部分的语言。它在 XSLT 中使用并且是 XQuery 的子集。这个库也可用于大多数其他编程语言。2)必备知识了解基本的html语法和格式没有了,如果你不会html,超过2000收藏,我出一篇html详细教程,至于怎么达到2000赞,看各位粉丝了。3)为什么我要写这篇文章?在我前面原创 2021-10-13 21:40:53 · 12737 阅读 · 100 评论 -
爬虫学习(5):手把手教你爬虫requests实战演练
一、前言前面两篇文章我已经把requests基础与高阶篇都做了详细讲解,也有不少了例子。那么本篇在基于前两篇文章之上,专门做一篇实战篇。环境:jupyter如果你不会使用jupyter请看我这一篇文章:jupyter安装教程与使用教程二、实战1)获取百度网页并打印#-*- coding: utf-8 -*import requestsurl = 'http://www.baidu.com'r = requests.get(url)r.encoding = r.apparent_en原创 2021-10-24 01:18:30 · 7118 阅读 · 66 评论 -
爬虫学习(4):requests高阶篇详细教程
文章目录一、前言二、SSL验证三、代理设置四、超时设置五、身份认证1)基本身份认证2)摘要式身份认证六、总结一、前言本篇文高阶篇,上一篇为基础篇,希望你一定要学完基础再来看高阶篇内容,由于字数限制,下一篇我讲requests的多个实战。二、SSL验证我们已12306网站为例子进行讲解。首先我们请求一下12306:import requestsresponse = requests.get('https://www.12306.cn/index/')print(response.status原创 2021-10-21 07:15:00 · 7810 阅读 · 49 评论 -
爬虫学习(3):两万字零基础爬虫requests初阶教程,手把手教你爬数据
文章目录一、环境与工具二、学爬虫必备知识三、requests体验四、get 请求3.1 基础讲解一3.3 基础讲解二3.2 基础讲解三3.4 获取cookie3.5 获取请求头3.6 添加请求头3.5 知乎爬取+反扒技术3.6 抓取二进制数据3.6.1 示例一3.6.2 示例二3.7 美女私房照爬取( 准备发车)四、 POST 请求4.1 数据表单提交4.2 添加请求头4.3 提交json4.4 普通文件上传五、总结一、环境与工具环境:jupyter如果你没有安装该工具和不会使用,请看这一篇文章:py原创 2021-10-13 21:17:31 · 33167 阅读 · 175 评论 -
亲测jupyter打不开浏览器
问题描述有粉丝给我说他们的jupyter不能自动打开浏览器,jupyter notebook输入回车后,不能跳转,把输出的链接复制粘贴到浏览器后,写的代码页不能运行。问题解决我帮他们调了很久后才发现,不是软件什么的问题,而是他们的用户名为中文的问题。只要把用户名改为英文即可:注销原来的账户,登录自动生成的新的账户。具体如何操作?1.管理员运行cmd输入如下命令:jupyter notebook --generate-config2-注销现有账户3-注销后选择新账户登录重新打开jupyt原创 2021-10-12 22:58:39 · 2645 阅读 · 1 评论 -
jupyter设置默认打开文件夹
文章目录cmd输入如下命令回车:jupyter notebook --generate-config然后:打开生成的文件路径进去后:编辑这个py搜索:notebook_dir定位去掉# ,引号后改为你要打开的文件路径(路径改为你自己的)ctrl+s保存。右键-属性:删掉这部分"%USERPROFILE%/"再打开就:完成!...原创 2021-10-13 15:04:23 · 2115 阅读 · 2 评论 -
爬虫学习(2): urllib教程与实践
文章目录一、前言框架二、网址请求2.1 打开网址一、前言框架我们来学一下爬虫之祖urlib,不管你什么模块都是起源于该模块。urlib库有几个模块,依次如下:request :用于请求网址的模块error:异常处理模块parse:用于修改拼接等的模块robotparser:用来判断哪些网站可以爬,哪些网站不可以爬二、网址请求2.1 打开网址以请求我自己的博客为例子,我博客链接为:https://blog.csdn.net/weixin_46211269?spm=1000.2115.原创 2021-11-22 20:54:05 · 12040 阅读 · 10 评论