![](https://img-blog.csdnimg.cn/3702dae3b5f84def8052be13ed2ab960.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
python旧文
文章平均质量分 87
一些之前写的,但已经过时的博客
微小冷
这个作者很懒,什么都没留下…
展开
-
CSDN热榜分析4:生成词云图
我们至少要输出三种词云,首先是总榜的词云,然后是领域热榜的词云,最后还要把所有词云的单词作为一个整榜输出。原创 2023-10-30 08:30:00 · 348 阅读 · 0 评论 -
如何用Python统计CSDN质量分
这个评分标准毕竟不是一早就有的,所以早些年间写的博客不可能完全符合现在的CSDN的要求,为了找到需要改进质量的博客,可以通过爬虫的方式,逐一对博客质量进行检测。原创 2023-07-28 21:08:42 · 705 阅读 · 0 评论 -
CSDN热榜分析3:实现领域热榜的爬取
实现各领域热榜的爬取原创 2023-09-24 09:00:00 · 429 阅读 · 0 评论 -
CSDN热榜分析:来看看热榜都在写什么
通过selenium爬取CSDN热榜,然后用jieba分词,最后用wordcloud制作词云图。原创 2023-08-14 10:23:42 · 549 阅读 · 0 评论 -
CSDN热榜分析6:将实时爬取的热榜数据导入sqlite
所以一个正常的工作逻辑是,一打开热榜分析系统,也就同步打开数据库,然后随用随查,而打开数据库之后需要检查是否已经建立了热榜表格,如果没建立那么就建立一下。原创 2023-11-02 09:00:00 · 384 阅读 · 0 评论 -
CSDN热榜分析5:导入数据库
其实一天的热榜根本说明不了任何问题,而若每天都爬取一遍热榜,那么如何存储爬取到的数据,就成了一个问题。python标准库中提供了轻量的文件型数据库sqlite3,就是为了这个问题而生的。因为热榜一共也就1000来篇博客,每天查一遍,10年也才不到4M条数据,sqlite3完全没问题。原创 2023-10-31 09:00:00 · 595 阅读 · 0 评论 -
用tkinter+selenium分析CSDN热榜
用tkinter+selenium做一个CSDN热榜爬虫工具。原创 2023-09-21 09:45:00 · 396 阅读 · 0 评论 -
scipy稀疏数组csr_array
csr,即Compressed Sparse Row,是压缩稀疏行数组,就是将稀疏矩阵按行分割,并对这些列进行存储。在稀疏矩阵中,有三个关键的编码数据,分别是`data, indices`和`indptr`。其中`data`为数据,`indices`为序号索引,二者是一一对应的。而`intptr`则对数据进行分割,表明其属于哪一列。原创 2023-02-06 05:45:00 · 1236 阅读 · 0 评论 -
scipy稀疏数组dok_array
`dok`数组就是通过键值对存储的数组,其中`key`就是矩阵中的坐标元组,`value`就是对应坐标中的值,是最容易理解的稀疏矩阵存储方案。原创 2023-02-09 08:00:00 · 820 阅读 · 0 评论 -
scipy压缩稀疏列数组csc_array
csc,即Compressed Sparse Column,是压缩稀疏列数组,就是将稀疏矩阵按列分割,并对这些列进行存储。原创 2023-02-07 07:45:00 · 907 阅读 · 0 评论 -
scipy稀疏数组coo_array
`coo`也被称为`ijv`,是一种三元组格式,对于矩阵中第$i$行第$j$列的值$v$,将其存储为$(i,j,v)$这样的三元组,即为`coo_array`的原理。原创 2023-02-13 08:15:00 · 905 阅读 · 0 评论 -
Scipy稀疏矩阵bsr_array
bsr,即Block Sparse Row,`bsr_array`即块稀疏行矩阵,顾名思义就是将稀疏矩阵分割成一个个非0的子块,然后对这些子块进行存储。通过输入维度,可以创建一个空的`bsr`数组,但`bsr`格式并不可见,需要通过`toarray`转为数组,才能一窥全貌。原创 2023-02-12 07:15:00 · 1001 阅读 · 0 评论 -
scipy稀疏矩阵lil_array
`lil`,即Row-based LIst of Lists sparse array, 按行存储的稀疏矩阵。在`lil`中,有两组关键数据,分别按行存储稀疏矩阵的值和列号。原创 2023-02-08 07:00:00 · 976 阅读 · 0 评论 -
从Python新手到高手的68行代码
文章目录基础入门菜鸟提升基础晋级高手之路内置包库奇技淫巧基础入门1 python即在命令行输入python,进入Python的开发环境。2 x = 1+2*3-4/5+6**2加减乘除四则混合运算,可以当作计算器用了,其中**表示乘方。3 print(x)即输出x的值,如果感觉麻烦,可以直接输入x,然后回车,也能看到x的值。4 if x>5 : print(x)简单的判断,如果x>5,则打印x。5 for i in range(10): print(i)简单的循环,其中ra原创 2021-10-18 21:09:21 · 7514 阅读 · 10 评论 -
2023年Python学习清单
不知不觉已经在CSDN写了三百多篇博客,这些博客中,Python相关的内容占了绝大多数,而这些与Python有关的内容中,绝大多数又都是我个人学习的总结,本文希望把我的Python学习过程做一个总结,也希望能够帮助不同阶段的Pythoner。原创 2023-01-09 09:18:56 · 1130 阅读 · 1 评论 -
刷完这50个标准库模块:没人比我更懂Python了
python强大,主要是因为包多,且不说第三方包,单是标准库就让人望而生畏了。在整理标准库的过程中,查阅了大量资料,以及官方文档,发现很多中文资料都有一个共同的特点——机翻风格严重。对于一些不常用,但有助于理解python运行机制的包,不仅中文资料乏善可陈,连英文资料都很稀缺,所以又不得不翻阅源码这个工作还是十分耗时的。原创 2022-10-24 07:27:04 · 6092 阅读 · 1 评论 -
Python标准库32个模块的整理
python强大,主要是因为包多,且不说第三方包,单是标准库就让人望而生畏了。在整理标准库的过程中,查阅了大量资料,以及官方文档,发现很多中文资料都有一个共同的特点——机翻风格严重。对于一些不常用,但有助于理解python运行机制的包,不仅中文资料乏善可陈,连英文资料都很稀缺,所以又不得不翻阅源码,加之时间有限,所以只总结了三十来个。原创 2022-04-13 16:50:36 · 3325 阅读 · 0 评论 -
python标准库复数运算包cmath
cmath即基础的复数运算包,和math有很多同名函数,但math中的函数没法进行复数计算。在python中,创建复数的方法是x = 1+1j常见函数三角和反三角cos, sin, tan, acos, asin, atan双曲和反双曲cosh, sinh, tanh, acosh, asinh, atanh幂函数exp, sqrt对数函数log10, log(z)=lnz\ln zlnz, log(x,y)=logyx\log_yxlogyx原创 2021-10-20 21:19:52 · 2213 阅读 · 0 评论 -
Python多线程之Thread类
文章目录简单的案例damon用法简单的案例为了对多线程有一个直观的了解,现举一个简单的案例>>> def printN(n,name=None):... for i in range(n):... print(f"{name}:{i}")...>>> th1 = Thread(target=printN,args=[3,'th1'])>>> th2 = Thread(target=printN,args=[3,'th2'])原创 2021-11-07 22:18:04 · 1332 阅读 · 1 评论 -
【python多线程】2:Barrier类
如果对Thread不太熟悉的朋友,可先行翻阅这个:Python多线程之Thread类尽管Thread之间实现了多线程操作,但每个Thread.start()的调用仍然有先后顺序。>>> def printN(n,name=None):... for i in range(n): print(f"{name}:{i}")>>> def test():... th1 = Thread(target=printN, args=[3,'th1'])...原创 2021-11-08 09:56:13 · 1730 阅读 · 0 评论 -
python内置数学模块math
python内置数学模块math提供了一些基础的计算功能,下列表达式默认from math import *,默认输入输出均为一个数字。大部分函数都很直观,望文生义即可。常见函数三角和反三角cos, sin, tan, acos, asin, atanatan2(x,y)=arctanyx\arctan\frac{y}{x}arctanxy双曲和反双曲cosh, sinh, tanh, acosh, asinh, atanh幂函数exp, sqrt, e原创 2021-10-19 14:02:16 · 3685 阅读 · 0 评论 -
【Python多线程】4:Condition类
Condition类前情提要:Thread类初步多个线程一起执行把多个大象装进多个冰箱顾名思义,Condition通过某些条件实现对线程的调度。其调用过程用到notify()和acquire()这两组函数。前者表示通知各个有acquire的线程,你们开始执行吧;后者则表示取得某个执行权(即取到锁的钥匙)。继续考虑大象和冰箱的关系,如果现在有一家饭店专门做大象肉,所以当所有冰箱都装满大象的时候,饭店会一次性把大象取走。那么现在假设有2个大冰箱,每个冰箱能装好多个大象,饭店则每次取走5个。f原创 2022-04-12 11:37:25 · 1271 阅读 · 1 评论 -
python+selenium统计CSDN博客(上):统计阅读量
这个功能是比较容易实现的,按理说一个人的所有文章都在博客主页,每篇文章的标题大致如下<div data-v-6fe2b6a7="" class="blog-list-box-top"> <h4 data-v-6fe2b6a7=""> 耗时一个月对Python标准库20多个模块的整理 </h4></div>文章标题为耗时一个月对Python标准库20多个模块的整理,其class为blog-list-box-top。接下来原创 2021-11-29 14:05:16 · 1478 阅读 · 0 评论 -
Python绘制箕舌线
过原点的动直线交定圆x2+y2−ay=0,a>0x^2+y^2-ay=0, a>0x2+y2−ay=0,a>0于P点,交直线y=ay=ay=a于Q点,过P和Q分别作X轴和Y轴的平行线交于M点,则M点的轨迹叫做箕舌线 。设a=2a=2a=2,则圆的参数方程为x=cosθ,y=sinθ+1x=\cos\theta,y=\sin\theta+1x=cosθ,y=sinθ+1设动直线的方程为y=kxy=kxy=kx,则随着kkk的变化,可以得到一条箕舌线import numpy原创 2022-04-18 10:57:32 · 2084 阅读 · 0 评论 -
用python鉴别图像类型
imghdr是python标准库中非常短小的一个模块,只有一个功能,就是识别图像的类型,而通过查看imghdr中的成员,则可看出这个包所能鉴别的图像类型。>>> dir(imghdr)[#内置参数就省略不写了。。。'test', 'test_bmp', 'test_exr', 'test_gif', 'test_jpeg', 'test_pbm', 'test_pgm', 'test_png', 'test_ppm', 'test_rast', 'test_rgb', 'test_t原创 2021-12-07 17:46:00 · 3109 阅读 · 0 评论 -
python+selenium统计CSDN博客(下):统计收藏量
前文提要:通过python+selenium统计CSDN博客(上):统计阅读量由于个人主页的摘要信息中,并没有提供收藏数,为了获取收藏数,就得逐一点相应的页面,所以要获取标题对应的链接。首先还是进入博客主页from selenium import webdriverurl = 'https://blog.csdn.net/m0_37816922?type=blog'driver = webdriver.Edge()driver.get(url)然后发现链接被存放在一个a标签中<a d原创 2021-12-20 13:48:05 · 962 阅读 · 0 评论 -
【python多线程】3:RLock
大家都知道,要把大象装冰箱,总共分三步:把冰箱门打开、把大象装进去、把冰箱门关上,尤其当我们想把多个大象装进多个冰箱的时候,更要注意这一点。原创 2021-11-08 12:37:00 · 1064 阅读 · 2 评论 -
python精确计算包decimal,告别截断误差
文章目录Decimal对象常量和成员变量上下文对象报错与警告(signal)在python中比较常见的问题是>>> 0.333333333333333333333*31.0>>> 0.9999999999999999999999991.0如果这可以算作程序的“自作聪明”的话,那么下面这个就是完全没有必要的误差了。>>> 0.1*3-0.35.551115123125783e-17decimal就为了解决这个问题,下面的代码默认fro原创 2021-10-25 18:14:44 · 3394 阅读 · 0 评论 -
python绘制各种摆线(包括心形线星形线等,超炫酷)
旋轮线文章目录旋轮线摆线外摆线和心脏线内摆线与星形线摆线最简单的旋轮线就是摆线,指圆在直线上滚动时,圆周上某定点的轨迹。设圆的半径为rrr,在x轴上滚动xxx距离则意味着旋转了xr\frac{x}{r}rx弧度,则其滚动所产生的摆线如下r = 1theta = np.arange(0,6.4,0.1)xCircle0 = np.cos(theta)yCircle0 = 1+np.sin(theta)fig = plt.figure(figsize=(15,4))ax = fig.a原创 2021-10-10 11:07:17 · 10276 阅读 · 1 评论 -
python的6个数学模块
文章目录math模块复数运算模块cmath精确计算模块decimal伪随机数模块random简单的统计模块statistics分数模块fractionsmath模块提供了一些基础的计算功能,除了常用的数学函数如三角函数、幂函数等,还包括各种取整函数:math模块详解复数运算模块cmath即基础的复数运算包,和math有很多同名函数,但math中的函数没法进行复数计算。在python中,创建复数的方法是x = 1+1j详情可见:复数运算模块cmath精确计算模块decimal在python中原创 2021-10-25 22:51:42 · 3251 阅读 · 0 评论 -
python通过文件头识别音频格式
本模块将弃用,官方推荐filetype原创 2021-12-10 09:18:47 · 3750 阅读 · 0 评论 -
python伪随机数模块random详解
文章目录基本原理整数和字节分布函数用于序列的随机函数基本原理用于生成伪随机数,之所以有个伪字,是因为计算机没法生成真正的随机数。所谓伪随机数,无非是把一个初始值变得面目全非,从而很像随机数。而这个初始值,便是通过seed实现的,如果不设置,则默认为当前的系统时间。在ramdom中,使用最多的应该就是random.random()了,其功能为返回一个[0,1)[0,1)[0,1)区间的实数。接下来可以通过random.random()来验证以下random.seed()的功能。>>>原创 2021-10-25 22:45:17 · 2857 阅读 · 0 评论