- 博客(344)
- 资源 (2)
- 收藏
- 关注
原创 2024 python 求职 常见面试题(北京 爬虫/后端)
python 优缺点开源,可移植,支持面向过程和面向对象,可扩展性,可嵌入性,库多慢 用c重写重要部分,GILpython程序运行过程pyCodeObject 内存 到 pyc 硬盘持久化存储 pyc有long 存的是写入时间pyc 中 存的是 import导入的可重用的模块分号在python中的应用可写可不写,一行定义多个值时使用python中的变量利用del删除对应的内存空间的数值变量会改变内存空间,常量不会断言断言可以在条件不满足程序运行的情况下直接返回错误,而不必等待
2021-11-15 19:16:11
7413
原创 推特(X)平台推文自动保存(支持保存所有推文相关数据到服务器)
本文介绍了一个Twitter数据采集系统,包含服务端Python脚本和浏览器用户脚本两部分。服务端基于FastAPI框架,提供REST接口接收Twitter数据,支持三种数据来源(用户推文、首页推荐、关注时间线),并按类型和时间戳存储为JSON文件。浏览器脚本通过Tampermonkey实现,可拦截Twitter网页请求,将数据发送到配置的服务端地址,并提供可视化Toast通知。系统具有配置管理功能,允许用户自定义服务端URL,采用CORS跨域支持,实现了Twitter数据的实时采集与存储。
2025-12-26 22:49:23
432
4
原创 392. 判断子序列
摘要: 该问题要求判断字符串 s 是否为字符串 t 的子序列。子序列的定义是通过删除 t 中的某些字符(不改变剩余字符顺序)得到 s。解法使用双指针法:初始化指针 i 和 j 分别遍历 s 和 t,当字符匹配时移动 i,否则仅移动 j。若最终 i 遍历完 s,则返回 True,否则返回 False。时间复杂度为 O(n),适用于常规场景。对于海量 s 查询(如10亿次),可预处理 t 的字符位置信息以优化查询效率。
2025-12-24 13:45:19
209
1
原创 121. 买卖股票的最佳时机
摘要:本文讨论了一个股票买卖问题,要求在给定股价数组中找到最大利润。通过比较直接使用min()/max()函数和条件语句的两种实现方式,发现前者运行时间更长(296ms vs 200ms)。分析表明,虽然两者时间复杂度相同(O(n)),但内置函数调用可能带来额外开销。最优解法是维护最小买入价和最大利润,在一次遍历中完成计算,确保线性时间复杂度。提示部分给出了问题的约束条件和示例说明。
2025-12-23 16:31:50
391
2
原创 dy直播间评论保存插件
摘要 本文介绍了一个实时采集抖音直播间用户评论的系统,由油猴脚本和FastAPI服务端组成。脚本端通过CSS选择器精准定位DOM元素,提取用户名和评论内容,并进行数据清洗和去重处理。服务端采用FastAPI框架,提供跨域接口接收JSON格式的弹幕数据,并打印输出。系统实现了: 基于class选择器的精准DOM定位 30秒缓存去重机制 数据清洗(去除冒号等) 批量发送处理 跨域通信支持 该系统可稳定采集抖音直播间的实时弹幕,适合用于直播数据分析等场景。
2025-12-20 21:52:46
222
2
原创 图片坐标查看器
摘要 该代码实现了一个支持超大图像查看的Python GUI应用,具有以下核心功能: 视口渲染技术:采用延迟加载和局部渲染策略,解除Pillow库的像素限制(Image.MAX_IMAGE_PIXELS = None),支持处理任意尺寸的大图。 交互功能: 鼠标拖拽平移图像 滚轮缩放(兼容Linux和Windows系统) 实时坐标显示,可精确获取鼠标位置对应的原图坐标 界面设计: 左侧控制面板包含文件打开按钮、图像信息显示和坐标卡片 右侧为黑色背景的画布区域 采用customtkinter实现暗色主题界面
2025-12-19 00:43:54
142
1
原创 119. 杨辉三角 II
本文介绍了如何生成杨辉三角的指定行。题目要求给定非负索引rowIndex,返回杨辉三角的第rowIndex行。杨辉三角的特点是每个数等于其左上方和右上方数之和。作者提供了Python解决方案,通过递归生成完整的杨辉三角后返回指定行。虽然该方法可行,但空间复杂度较高。文章最后提到可以通过优化将空间复杂度降至O(rowIndex),但未给出具体实现。示例显示该方法在测试中获得了较好的性能表现。
2025-12-18 19:23:43
119
原创 118. 杨辉三角
本文介绍了一种生成杨辉三角前n行的递归解法。杨辉三角的特点是每个数等于其左上方和右上方数之和。算法采用递归方式:当numRows为1或2时直接返回基础解;否则递归生成前n-1行,再基于最后一行计算新行(相邻元素相加),并在首尾补1。该方法简洁高效,已实现双百性能(100%执行用时和内存击败率)。示例显示输入5时输出正确的5行杨辉三角。该解法适用于1到30行的生成需求。
2025-12-18 19:01:47
183
原创 实习面试题-大厂算法真题面试题
摘要 题目要求判断能否通过最多一次交换操作,使得长度为n的排列中存在一个长度为k的连续子段构成排列(包含1到k的每个数)。算法思路是使用滑动窗口检查每个长度为k的子段,统计其中大于k的元素数量。若某个窗口的大于k元素不超过1个,则可以通过交换满足条件。时间复杂度为O(n),适用于大规模数据。示例显示当输入本身已满足条件时输出"YES 0",否则当无法通过一次交换满足时输出"NO"。
2025-12-18 18:24:44
70
原创 实习面试题-BI 商业智能面试题
BI(商业智能)是通过技术和方法将企业原始数据转化为有价值的商业洞察,其核心价值在于提升决策质量、发现商业机会和提高运营效率。BI系统包含数据源层、数据仓库层、数据分析层和数据展示层四个关键部分,通过ETL流程、OLAP分析和可视化呈现实现数据价值。与数据分析相比,BI更侧重数据的标准化展示和监控,而数据分析则专注于深度探索和洞察。随着技术发展,BI已从传统报表系统演进为融合大数据、云计算和AI的智能分析平台,成为企业数据驱动决策的核心竞争力。
2025-12-18 18:24:06
35
原创 实习面试题-Rust 面试题
Rust是一种系统编程语言,在保证高性能的同时通过编译器确保内存安全。其核心特点包括所有权系统、零成本抽象和无垃圾回收机制,与C/C++相比具有更高的安全性。Rust变量默认不可变,需显式使用mut关键字实现可变性,这有助于提升代码安全性和并发能力。对于字符串处理,String是可变的堆分配类型,拥有所有权;&str是字符串切片,作为不可变引用更高效。在函数参数选择上,优先使用&str以提高灵活性。Rust的这些设计使其特别适合需要高性能和高可靠性的应用场景。
2025-12-17 21:19:24
93
原创 CSDN 自动评论文章插件
本文介绍了一款基于油猴脚本开发的CSDN自动AI评论助手。该工具通过接口发送数据(需登录),并接入本地大模型自动分析页面内容生成回复。文章提供了脚本地址及使用方法链接,展示了该工具的气泡提示界面效果图。该助手可实现智能评论功能,提升用户在CSDN平台的互动体验。
2025-12-17 21:09:58
299
2
原创 小红书 文章采集器
本文介绍了一款用于采集小红书全量数据的油猴脚本工具。该工具只需提供文章URL,即可自动采集页面中的图片、视频和文字内容,并以JSON格式返回结果。用户需先安装油猴插件,脚本会在浏览器打开页面时自动采集数据并发送到服务器存储。文中提供了详细的插件安装及使用教程链接,并展示了多张操作界面截图,帮助用户了解数据采集过程。该工具简化了数据采集流程,适合需要批量获取小红书内容的用户使用。
2025-12-17 14:50:34
211
原创 实习面试题-Spark SQL 面试题
Spark SQL 是 Apache Spark 用于处理结构化数据的模块,提供 DataFrame API 和 SQL 查询功能,支持多种数据源集成和性能优化。创建 DataFrame 可通过 RDD 转换、文件加载或数据库读取,与 RDD 相比具有结构化数据、查询优化等优势。Spark SQL 可与 Hive 集成,通过配置 hive-site.xml 并启用 Hive 支持后即可查询 Hive 表。
2025-12-15 23:23:39
118
4
原创 实习面试题-SpringCloud 面试题
分布式事务中的防悬挂机制防止在没有Try操作时执行Confirm/Cancel,而空回滚则处理未执行Try时的Cancel操作。配置中心如Nacos实现集中化配置管理,支持动态更新。服务注册发现解决分布式系统中服务动态管理问题。链路追踪在微服务中用于可视化请求调用链,便于问题排查。Spring Cloud集成丰富微服务组件但学习曲线陡峭,基于Spring Boot构建。微服务架构将应用拆分为单一职责服务,与单体应用和SOA相比更具灵活性和可维护性。Spring Cloud Config提供分布式配置管理功能
2025-12-15 23:23:07
481
1
原创 实习面试题-Linux 系统面试题
Linux硬链接与软链接区别:硬链接指向文件inode,删除源文件仍可访问;软链接是独立文件,删除源文件链接失效。 网络攻击类型:CC攻击通过并发请求耗尽服务器资源;DDOS攻击利用多台设备发起流量攻击;数据库注入通过恶意SQL语句入侵网站数据库。 Linux资源监控:常用命令包括top查看实时进程资源、free显示内存使用、netstat检查网络端口等。 进程与线程区别:进程独立运行,线程共享进程资源;进程切换开销大,适合隔离任务;线程适合并发处理,如多线程下载。 crontab定时任务:配置"
2025-12-15 23:22:36
146
原创 实习面试题-JavaScript 面试题
JavaScript数据类型分为原始类型(Undefined、Null、Boolean、Number、String、Symbol、BigInt)和引用类型(Object)。主要区别在于:原始类型存储在栈中,直接保存值本身;引用类型存储在堆中,变量保存的是对象引用。赋值时,原始类型复制值本身,引用类型复制指针。 判断数组的常用方法有:Array.isArray()、instanceof Array、Object.prototype.toString.call()等。 0.1+0.2≠0.3是由于二进制浮点数精
2025-12-15 23:22:05
66
原创 实习面试题-Vue3 面试题
Vue 3中可通过defineAsyncComponent实现异步组件加载,主要方式包括:基本ES模块动态导入、全局/局部注册组件,以及配置加载/错误状态处理。它支持延迟显示、超时设置等高级选项,并能与Suspense组件结合使用。异步组件采用懒加载机制,仅在需要时加载,优化应用性能。Vue 3.5+还新增了惰性激活功能,特别适用于SSR场景。这些特性共同实现了代码分割和按需加载,显著提升大型应用的加载速度。
2025-12-15 23:21:28
85
原创 实习面试题-Nginx 面试题
Nginx 是一个高性能的开源 Web 服务器和反向代理服务器,采用事件驱动架构处理高并发请求。它支持反向代理、负载均衡、动态缓存等功能,广泛应用于Web服务、API网关、CDN等场景。与Apache相比,Nginx更适合处理静态内容和高并发,而Apache更擅长动态内容处理。配置反向代理时,只需在Nginx配置文件中设置proxy_pass指令并添加必要的头信息。Nginx还提供漏桶和令牌桶两种限流算法,可通过配置限制请求速率或连接数来实现流量控制。
2025-12-15 23:20:56
262
原创 实习面试题-Nginx 配置面试题
Nginx连接数存在上限,主要受操作系统文件描述符限制和Nginx自身配置影响。要修改上限需要:1)调整系统文件描述符限制,修改limits.conf和PAM配置文件;2)修改Nginx配置,设置worker_rlimit_nofile和worker_connections参数。此外还需考虑硬件资源、Worker进程优化、操作系统内核参数调优等因素。 配置Nginx静态资源访问的步骤:1)安装Nginx;2)编辑配置文件,在server块中添加location指定资源路径;3)重新加载配置。还可通过添加缓存
2025-12-15 23:20:17
104
原创 实习面试题-Nginx 应用面试题
Nginx配置摘要 静态资源访问配置:通过修改Nginx配置文件,在server块中添加location指令指定静态资源路径,设置root目录和try_files指令。建议添加缓存控制(expires)、启用Gzip压缩(gzip on)并配置安全限制(deny hidden files)。 非默认端口配置:修改nginx.conf中的server块,将listen指令改为所需端口号(如8080)。配置完成后需检查端口可用性,更新防火墙规则,并通过nginx -t测试配置,最后reload服务生效。 注意:
2025-12-15 23:19:44
50
原创 实习面试题-Nginx 原理面试题
Nginx核心技术解析 Nginx通过事件驱动的异步非阻塞架构解决C10K问题,采用Master-Worker模型和高效I/O多路复用机制实现超高并发处理。其负载均衡功能基于反向代理机制,支持轮询、权重轮询、最少连接、IP哈希等多种算法,并可与健康检查、动态负载均衡等高级特性配合使用。Nginx的惊群问题通过互斥锁、accept_mutex机制和CPU亲和性绑定解决。相比传统多线程/进程模型,Nginx凭借事件循环、连接池等技术显著降低资源消耗,成为高并发场景下的首选解决方案。
2025-12-15 23:19:13
58
原创 实习面试题-PostgreSQL 数据库面试题
PostgreSQL表管理摘要:创建表使用CREATE TABLE语句,定义字段类型和约束;修改表结构用ALTER TABLE添加/修改列;删除表用DROP TABLE。重要扩展包括:选择合适的数据类型(INTEGER,VARCHAR等);使用主键和索引优化查询;通过约束(NOT NULL,CHECK等)保证数据完整性;大数据量表可采用分区策略;推荐使用迁移工具(Liquibase)管理结构变更。 PostgreSQL索引管理摘要:创建索引使用CREATE INDEX语句加速查询,删除索引用DROP IND
2025-12-15 23:18:41
278
原创 实习面试题-Kotlin 面试题
Kotlin是一种现代编程语言,相比Java更加简洁安全。它具有空安全、协程等特性,代码量比Java减少40%以上,已成为Android开发首选语言。Kotlin中val用于声明不可变变量,var用于可变变量,推荐优先使用val以确保线程安全和代码可维护性。基本数据类型方面,Kotlin统一使用对象类型(如Int、Boolean),没有Java的基本类型和包装类型之分,且类型名称首字母大写。这些特性使Kotlin成为更高效的开发工具。
2025-12-14 16:46:29
126
原创 实习面试题-Spark SQL 面试题
Spark SQL是Apache Spark中处理结构化数据的模块,支持SQL查询和DataFrame API。主要功能包括:查询分析(ANSI SQL兼容)、多数据源集成(Hive、JSON等)、性能优化(Catalyst优化器)、多语言支持和统一数据访问。创建DataFrame的方法包括从RDD转换、本地文件加载和数据库读取。与RDD相比,DataFrame具有Schema信息、查询优化和高级API等优势。Spark SQL可与Hive集成,通过配置hive-site.xml并使用SparkSessio
2025-12-14 16:45:56
122
原创 实习面试题-ZooKeeper 原理面试题
ZooKeeper采用推送模式通知客户端,通过Watcher机制实现服务器主动推送变更。其主从同步基于Leader-Follower模型和Zab协议,确保数据一致性。ZooKeeper的数据模型采用层次化的Znode结构,支持持久和临时节点。常见的分布式一致性协议还包括Paxos、Raft、2PC和3PC等。ZooKeeper广泛应用于配置管理、命名服务和分布式锁等场景。
2025-12-14 16:45:26
78
原创 实习面试题-Zookeeper 面试题
ZooKeeper是一种分布式协调服务,主要用于管理大型分布式系统中的配置、同步和命名等信息。其核心功能包括集中配置管理、命名服务、集群管理、分布式锁和领导选举。ZooKeeper通过ZNode数据节点存储信息,支持持久节点和临时节点,并提供Watcher机制实现状态监控。它有三种部署模式:单机、伪集群和集群模式,其中集群模式采用奇数节点保证高可用性。ZooKeeper节点分为Leader、Follower、Observer等工作状态,通过选举机制确保服务一致性,广泛应用于Hadoop、Kafka等大数据框
2025-12-14 16:44:55
115
原创 实习面试题-MapReduce 面试题
MapReduce通过OutputFormat控制输出数据的格式和存储方式。主要方法是在作业配置中设置OutputFormat类,常见格式包括: TextOutputFormat - 默认文本格式,每行存储一个键值对 SequenceFileOutputFormat - 二进制格式,支持压缩 DBOutputFormat - 数据库输出格式 MultipleOutputs - 支持多路径输出 这些格式决定了Reduce阶段结果的存储结构和位置,用户可根据需求选择或自定义输出格式。输出格式的设置直接影响结果的
2025-12-14 16:44:25
173
原创 实习面试题-Shell 面试题
本文介绍了Shell脚本中字符串操作和文件处理的常用方法。字符串操作部分详细讲解了截取(${var:offset:length})、拼接(直接变量连接)、获取长度(${#var})等基本操作,并提供了从特定位置开始截取、负数偏移量等进阶用法。文件处理部分重点介绍了使用for循环遍历文件列表的基本方法,展示了如何批量处理多个文件。这些技巧是Shell脚本编程的基础,可用于文本处理、文件操作等常见任务。
2025-12-14 16:43:52
30
原创 实习面试题-PHP 面试题
PHP实现数据库批量操作主要有三种方式:1)批量插入使用多值插入SQL语句;2)批量更新使用CASE WHEN THEN语句;3)通过事务处理保证操作的原子性。使用final关键字的类不能被继承,final方法不能被重写,适用于需要保护类结构或方法实现的场景。
2025-12-14 16:43:20
64
原创 实习面试题-聚合搜索项目面试题
这篇文章摘要总结了多个技术问题的解答,涵盖了后端开发、前端开发和系统架构的关键知识点。主要内容包括: 技术栈介绍:Spring Boot和Elastic Stack在项目中的应用 设计模式应用:详细解释了适配器模式、门面模式和注册器模式的概念与实现 Elasticsearch特性:分析其灵活的查询能力和动静分离存储策略 前端技术:Vue 3新特性、响应式变量和动态路由实现 开发工具:Kibana调试方法和Swagger+Knife4j生成接口文档 系统架构:MySQL与Elasticsearch数据同步解决
2025-12-14 16:42:46
51
原创 实习面试题-游戏服务端开发面试题
游戏服务端是支撑在线游戏运行的核心后台系统,负责处理游戏逻辑、管理玩家数据、维护游戏状态和同步玩家互动。它采用客户端-服务器模型,通过负载均衡和分布式架构确保稳定性。关键技术难点包括实时性保障、数据一致性处理和扩展性设计,常用技术栈包括C++/Java、TCP/UDP协议和云服务部署。 在游戏网络通信中,心跳机制是关键设计,通过定期发送小数据包检测连接状态。应用层心跳包需合理设置频率和超时机制,结合自动重连功能确保网络稳定性。同时要考虑网络延迟、服务器负载和安全性问题。 KCP协议是基于UDP的可靠传输方案
2025-12-14 16:42:12
52
原创 记录一次伟大的实践--上亿数据快速模糊匹配方案
摘要 面对1.2亿条URL和1.1亿关键词的匹配需求,初始方案采用内存Map存储导致性能低下(预计36小时)。改进方案将数据导入MySQL并建立全文索引,查询改用MATCH...AGAINST语法替代低效的LIKE查询。优化后处理时间从天级别降至分钟级别,内存占用显著降低,且从多线程OOM变为单线程高效运行。方案转变凸显了数据库索引在大数据量场景下的优势,同时展示了Gemini工具在SQL优化中的实用价值。
2025-12-14 00:00:25
350
原创 实习面试题-Redis 面试题
Redis主从复制实现原理分为三个阶段:1)全量同步阶段,从节点首次连接主节点时,主节点生成RDB快照并发送给从节点,同时将期间新写入命令暂存到replication buffer;2)命令传播阶段,主节点异步发送写命令给从节点;3)增量同步阶段,通过repl_backlog_buffer环形缓冲区实现断线后的部分数据同步。主从架构实现了读写分离和数据备份。 Redis集群采用哈希槽分片(16384个槽)、Gossip协议和去中心化设计。数据根据CRC16(key)%16384分配到不同节点,客户端通过MO
2025-12-13 11:21:53
986
原创 实习面试题-网络安全面试题
VPN,全称是 Virtual Private Network(虚拟专用网络),是一种创建私人、加密网络连接的方法,即使是在不安全的网络上,如公用 Wi-Fi。其核心目的是在公共网络上为用户提供一个安全的隧道,以保护隐私和数据安全。VPN 的工作原理是通过在用户计算机和 VPN 服务器之间建立一条加密隧道,这样所有通过这条隧道传输的数据都是加密的,几乎无法被拦截或解码。应用场景包括:1)远程工作者通过 VPN 访问公司内部网络,保证数据安全。2)保护个人隐私,隐藏用户的真实 IP 地址。
2025-12-13 11:21:18
103
原创 实习面试题-应用服务器面试题
Apache与Nginx是两种主流的Web服务器软件,主要区别在于架构和适用场景。Apache采用模块化、基于进程的架构,适合处理复杂请求和动态内容;Nginx采用事件驱动架构,擅长处理高并发和静态内容。Apache支持动态模块加载,配置灵活;Nginx配置简洁,性能更优。通常Apache用于动态内容处理,Nginx用于反向代理和静态资源服务。 Tomcat是Java Servlet容器,核心组件包括Catalina(Servlet容器)、Coyote(HTTP连接器)和Jasper(JSP引擎)。它通过生
2025-12-13 11:20:48
56
原创 实习面试题-Docker 面试题
Docker是一个开源的应用容器化平台,通过操作系统级虚拟化实现软件的自动化部署,确保应用在不同环境中的一致性运行。其核心组件包括镜像(只读模板)、容器(运行实例)、Docker引擎(运行时管理工具)和Docker Hub(镜像仓库)。Docker镜像通过Dockerfile构建,该文件定义了构建步骤并保证环境一致性,常用指令包括FROM、RUN、COPY等。容器日志可通过docker logs命令查看,支持实时监控(-f)和查看尾部日志(--tail)等功能。Docker还提供Compose(多容器管理)
2025-12-13 11:20:12
188
原创 实习面试题-网络故障排查面试题
网络故障排查常用ping和traceroute命令。ping用于检测网络连通性,发送ICMP请求测试目标主机是否在线;traceroute追踪数据包路径,显示各跳节点信息。ping常用参数包括-c指定次数、-i间隔时间;traceroute常用-n不解析域名、-m最大跳数。Windows和Linux命令略有差异,Windows用tracert替代traceroute。网络测试还可结合nslookup检查DNS、netstat查看连接状态、telnet测试端口连通性。当网站无法访问时,应逐步检查网络连接、网址
2025-12-13 11:19:41
67
原创 实习面试题-JMeter 面试题
摘要:JMeter 测试接口常见问题解决方案:1) 文件上传接口测试通过 HTTP Request 采样器配置 multipart/form-data 实现;2) POST 请求传递 JSON 数据需配置请求头和消息体,并通过 HTTP Header 管理器设置 Content-Type;3) 加密参数处理可使用 JSR223 PreProcessor 编写 Groovy 脚本实现多种加密算法。测试时可结合断言、参数化、监听器等组件增强测试效果,并考虑性能优化和复用性问题。
2025-12-13 11:19:07
79
原创 实习面试题-Kafka 面试题
Kafka是一种分布式流处理平台,具有高吞吐量、低延迟和可扩展性。其核心架构包括Producer、Consumer、Broker和Zookeeper组件。Topic作为消息分类单位,通过分区实现并行处理,副本机制确保高可用性。Producer负责消息生产并支持多种分区策略,Consumer通过消费组实现负载均衡。Kafka广泛应用于消息队列、日志收集、流计算等场景,其高效I/O模型和零拷贝技术保障了高性能表现。系统通过分区、副本和Zookeeper协调实现可靠的消息传递和处理。
2025-12-13 11:18:36
77
Django面试题库.md.pdf【Django开发】基于MVT架构的Web框架核心技术与高并发优化:面试高频考点与实战应用解析
2025-12-18
wav音频活体检测(检测人声音出现消失的每段时间)
2024-12-05
文本转语音工具,支持多种音色模型
2024-07-07
Pyhton wav音频 音频前后静音片段切除批处理脚本
2024-06-22
Python 打包 exe 小工具
2024-05-28
Python 打包 exe 小工
2024-05-28
Python 打包exe小工具
2024-05-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅