自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 使用python采集bilibili直播弹幕

库创建CSV文件并定义字段名称,将收集到的直播弹幕数据存储在CSV文件中。从Bilibili直播间中收集直播弹幕数据,并将其保存到CSV文件中。:从请求返回的 JSON 数据中提取所需字段,如昵称、时间和弹幕内容。头部信息,模拟浏览器请求,以避免被服务器屏蔽或误认为是机器人请求。库向Bilibili直播间发送HTTP请求,获取直播弹幕数据。:将提取的数据以字典形式存储,并分别获取昵称、时间和弹幕内容。函数实现暂停,控制请求的频率,避免触发防抓取机制。循环遍历多个页面,获取每个页面的直播弹幕数据。

2024-04-25 23:15:38 478

原创 使用python批量采集国家法律法规数据库——科学学习使用!遵守法律!绿色合规!

【代码】使用python批量采集国家法律法规数据库——科学学习使用!遵守法律!绿色合规!

2024-04-23 23:50:30 474

原创 08.使用python采集前程无忧招聘网站50页数据

【代码】08.使用python采集前程无忧招聘网站50页数据。

2024-04-18 23:29:33 459

原创 使用python采集前程无忧招聘网站数据

【代码】使用python采集前程无忧招聘网站数据。

2024-04-17 23:44:13 316

原创 使用python采集VIP会电商平台商品数据②单页数据采集

数据包地址:https://mapi.vip.com/vips-mobile/rest/shopping/pc/product/module/list/v2。productIds::120个商品ID->找的商品的ID。标头:查看请求的网址/请求的标头/请求方法。载荷:查询参数/请求参数。一页的数据放在三个链接;响应:服务器返回的数据。预览:查看响应得数据。

2024-04-17 00:22:04 1061

原创 使用python采集VIP会电商平台商品数据①

数据包地址:https://mapi.vip.com/vips-mobile/rest/shopping/pc/product/module/list/v2。获取想的json数据->数据是由{}/[]包裹起来的。productIds::120个商品ID->找的商品的ID。获取响应二进制数据 ->图片/视频/音频/特定格式。标头:查看请求的网址/请求的标头/请求方法。# 获取服务器返回的响应数据。载荷:查询参数/请求参数。一页的数据放在三个链接;响应:服务器返回的数据。预览:查看响应得数据。

2024-04-16 23:42:08 317 1

原创 使用python实现小说搜索书名作者名选择下载封装

函数包括发送请求函数 `GetResponse(url)`、获取小说章节内容函数 `GetContent(link)`、保存小说内容函数 `Save(name, title, content)`、获取小说信息函数 `GetInfo(NovelID)` 和搜索小说函数 `Search(key)`。- 使用 `if __name__ == '__main__':` 部分可以使代码在被直接运行时执行一些特定的操作,如接收用户输入、调用函数等。- 解析数据:使用 `parsel` 模块对获取的数据进行解析。

2024-04-15 22:51:27 538 1

原创 使用python实现小说下载脚本

【代码】使用python实现小说下载脚本。

2024-04-14 21:53:02 569 1

原创 使用python编写网页自动答题-仿真考试

通过以上自动化答题实践,可以更高效地完成大量选择题,节省时间和精力。但在使用自动化脚本时,应遵守网站规定,保持诚信,不得用于违规行为。希望这篇博文对您有所帮助,祝您学习顺利!

2024-04-13 17:12:30 691

原创 使用Python实现自动化网页答题功能-模拟考试篇

自动化脚本的应用可以提高工作效率,但应注意合法合规的使用方式,遵守网站规定和个人职业道德。希望以上内容能够对您有所帮助,欢迎您继续关注更多自动化应用的相关内容。

2024-04-12 23:05:55 689

原创 使用python进行网站答题操作

save()

2024-04-11 23:30:23 845 1

原创 解析数独游戏图片并给出答案

这篇笔记概括了如何使用Python处理数独游戏图片、识别数字并解析数独游戏,最终给出数独游戏的解答。

2024-04-10 00:00:21 172 1

原创 Python 图像隐写术:将数据隐藏在图片中

将图像像素值变为偶数值,即最低有效位为0。: 返回固定长度的二进制字符串,替代内置函数bin()。: 将字符串数据编码到图片中。: 将二进制字符串转换为 UTF-8 字符串。: 解码隐藏在图片中的数据。

2024-04-09 23:43:23 581

原创 python与MySQL数据库链接实现交易日判断

库连接到 MySQL 数据库,并执行了一个简单的查询语句来判断指定日期(2024-04-08)是否是交易日。你需要替换示例中的连接信息(host、user、password、database)以及查询的日期信息和表结构信息,确保与你的数据库相匹配。在 MySQL 中维护一张日历表可以帮助你进行日期相关的查询,比如判断某一天是否是交易日或者是周末等。要在 Python 中连接 MySQL 数据库实现交易日判断的功能,你可以使用 Python 的 MySQL 连接库,比如。字段来表示是否是交易日和是否是周末。

2024-04-08 22:40:57 171

原创 python图片转pdf,pdf转图片jpg

要将多个 JPG 图像文件转换为一个 PDF 文件,可以使用 Python 中的第三方库reportlab和Pillow来实现。在上面的代码中,函数接受一个包含图像文件路径的列表和要输出的 PDF 文件名称pdf_output。函数会打开每个图像文件,将其绘制到 PDF 文件中,并最终保存为一个 PDF 文件。使用这段代码,可以将多个 JPG 图像文件合并成一个 PDF 文件。请确保安装了reportlab和Pillow。

2024-04-08 21:49:23 649

原创 利用python 实现自动发送邮件

通过本教程,你学会了如何利用Python的smtplib库实现自动发送邮件的功能,并扩展为群发邮件的应用。希望这个教程能帮助你提升工作效率,欢迎尝试并分享给更多人。邮件发送成功至:[email protected]。邮件发送成功至:[email protected]。邮件发送成功至:[email protected]

2024-04-07 21:11:38 299 1

原创 python练习题(python基础练习)带知识点答案

这是一道编程题,要求实现一个文字猜词游戏。玩家需要选择单词分类和难度级别,然后根据提示猜测单词。游戏过程中,玩家有三次生命机会,每猜错一次生命值减一。如果玩家在生命值耗尽前猜对了整个单词,则获胜,否则失败。最终根据游戏表现给出得分。要求:1. 实现一个文字猜词游戏,包括单词分类、难度选择、猜词逻辑、生命值等功能。2. 程序运行时,提示玩家选择单词分类和难度级别。3. 玩家每轮需要输入猜测的字母或整个单词。4. 玩家猜对单词或生命值耗尽时游戏结束,显示游戏结果和得分。

2024-04-07 21:00:11 602 2

原创 SQL语句中 DDL 、DML 、DQL 、DCL学习、看板

DDL(Data Definition Language) 语句:数据定义语言,主要是进行定义/改变表的结构,数据类型,表之间的连接操作.常用的语句关键字有CREATE,DROP,ALTER等.CREATE TABLE 表名(列名1 数据类型,列名2 数据类型,列名3 数据类型,...​ALTER TABLE 表名;eg:ALTER TABLE 表名 ADD 列名 数据类型;(添加一个列)ALTER TABLE 表名 CHANGE 列名 新列名 新数据类型;(修改列名)

2024-04-02 12:22:19 533 1

原创 对于SQL优化方向和架构优化方向,可以采取以下策略

可以使用一些专门的索引优化工具,如pt-index-usage、pt-index-usage、pt-duplicate-key-checker等,来帮助评估索引的使用情况和优化建议。通过以上方法和示例的应用,您可以优化查询语句的结构,简化查询逻辑并提高执行效率,从而提升数据库查询性能。通过查看执行计划,可以了解数据库是如何执行查询的,分析索引使用情况和执行步骤,找出潜在的性能问题。根据实际的查询需求和性能表现,适时调整索引,删除不必要的索引或创建新的索引以优化查询性能。

2024-04-01 14:15:43 746

原创 hadoop 常见操作命令-操作手册

案例 把Hadoop系统中/bai_01/01.txt 02.txt 下载到Linux系统中/bai/内。#案例 从Linux系统将/bai/1.txt 2.txt上传到Hadoop/bai_1/目录下。#案例 将/bai/下的01.txt文件 移动到/bai_01/下重命名02.txt。#src代表的是本地目录 所谓的本地指的是客户端所在的机器。#追加的用途:把本地的小文件上传中合并成为大文件 解决小文件场景的。#将/bai/01.txt 复制到/bai_01/#案例 把1.txt文件副本数修改为2。

2024-03-31 22:18:45 954 1

原创 Apache Hive SQL-入门快速上手-学习清单

分桶表也是一种优化表,可以减少join查询时笛卡尔积的数量、提高抽样查询的效率。分桶表的字段必须是表中已有的字段;分桶表需要使用间接的方式才能把数据加载进入:insert+select在join的时候,针对join的字段进行分桶,可以提高join的效率 减少笛卡尔积数量。

2024-03-30 12:34:37 850

原创 Shell 编程入门指南:从基础到进阶,轻松掌握 Shell 脚本编程技巧--附有测试题目

set nu 显示行号生成随机数RANDOM文件 shell脚本文件第一行特殊格式字符串:建议使用双引号整数型:计算时需要使用"$((运算式))"或"$[运算式]"变量名=变量值 使用 readonly 命令可以将变量定义为只读变量,只读变量的值不能被改变。使用 unset 命令可以删除变量。可以使用env命令查看所有的系统环境变量自定义环境变量 双引号的优点:1) 双引号里可以有变量2) 双引号里可以出现转义字符 格式:${#变量名}格式:${变量名:起始下标值:截取字符串数量}格式:`expr ind

2024-03-29 14:30:03 1068 1

原创 Linux_系统_大数据中基础常用指令--速查表

top命令可以动态查看进程,top命令常用参数如下: -d 表示刷新的时间间隔,单位为s -p 表示查看指定PID的进程 -u 表示查看指定用户的进程 -n 表示top刷新指定次数后退出。cat a.txt | grep -f b.txt 从文件中读取关键词进行搜索 输出 a.txt 文件中含有从 b.txt 文件中读取出的关键词的内容行。ps aux --sort -rss #查看进程使用情况,并按照内存的使用降序排列。ps aux --sort rss #查看进程使用情况,并按照内存的使用升序排列。

2024-03-29 13:39:48 1317 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除