python
Takoony
天下大事,必作于细,天下难事,必作于易
展开
-
python虚拟环境激活的本质
python原创 2023-02-14 17:36:09 · 382 阅读 · 0 评论 -
for/esle的用途
for else原创 2023-02-03 11:56:21 · 218 阅读 · 0 评论 -
两个字典合并的原理-{**dict1, **dict2}
python原创 2023-01-09 20:48:15 · 402 阅读 · 0 评论 -
为什么我用.isalpha()检查全是中文的字符串,结果是true
isalpha原创 2022-12-30 11:04:28 · 557 阅读 · 0 评论 -
numba加速实验
性能原创 2022-11-26 23:00:30 · 309 阅读 · 0 评论 -
局部变量比全局变量速度可提升15%-30%
性能原创 2022-11-26 22:27:30 · 638 阅读 · 0 评论 -
perfplot妙用
perfplot原创 2022-11-13 23:03:46 · 229 阅读 · 0 评论 -
re.findall返回结果与(){}的关系
findall原创 2022-10-28 12:35:15 · 200 阅读 · 0 评论 -
set、dict、dict.keys、list性能大PK
性能原创 2022-10-22 10:26:47 · 184 阅读 · 0 评论 -
python获取本机IP的方法
获取本机IP原创 2022-10-20 09:34:50 · 1374 阅读 · 0 评论 -
可哈希与不可哈希的区别
可哈希与不可哈希的区别原创 2022-10-11 16:02:06 · 983 阅读 · 0 评论 -
list、tuple、set哪个查找速度最快呢
可迭代类型查找速度比拼原创 2022-08-31 09:33:37 · 482 阅读 · 0 评论 -
python可迭代类型遍历过程中数据改变会报错吗
python原创 2022-08-29 14:17:18 · 281 阅读 · 0 评论 -
遍历set、tuple、list哪个速度最快呢?
效率大比拼原创 2022-08-25 21:32:58 · 1135 阅读 · 0 评论 -
datetime计算秒数差需要注意的问题
python原创 2022-08-14 14:25:09 · 393 阅读 · 0 评论 -
literal_eval不能执行函数及其本质
python eval原创 2022-07-27 09:42:03 · 300 阅读 · 0 评论 -
huggingface中的encode_plus返回的attention_mask的理解
attention_mask原创 2022-07-17 23:30:04 · 866 阅读 · 1 评论 -
dataframe双层索引的设置方法
dataframe 双层索引原创 2022-07-02 09:23:12 · 2937 阅读 · 1 评论 -
从字典类型类型中一次性取多个key的value
字典中一次性取多个值列表一次性取多个索引原创 2022-06-30 20:30:23 · 2614 阅读 · 0 评论 -
删除变量为什么需要del加gc.collect
python原创 2022-06-26 22:53:01 · 1248 阅读 · 0 评论 -
集合运算符的注意事项,比如b |= c与 b = b | c的区别
集合运算符原创 2022-06-24 18:35:38 · 165 阅读 · 0 评论 -
Python list去重且保持原顺序不变的方法(sorted or sort)
去重后还是原 list 顺序原创 2022-05-09 22:04:31 · 2490 阅读 · 0 评论 -
linux命令行中同时执行多个python脚本的四种方法
1、命令行执行:python test1.py & python test2.py & python test3.py2、python 脚本import os os.system("python ./test1.py")os.system("python ./test2.py")os.system("python ./test3.py")3、shell脚本#!/bin/shpython test1.py >/dev/null 2>&1python原创 2022-04-27 14:37:17 · 11499 阅读 · 2 评论 -
拼接后一次写入与不拼接多次写入的性能对比分析
一、实验代码:def write_test_every(num=100): fw = open(os.path.join(data_dir, 'test.txt'), 'w+') for i in range(num): fw.write( 'aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaabbbbbbbbbbbbbbbbbbbbbbbccccccccccccccc' + '\n')def write_test_once_byadd(num=10原创 2022-04-24 19:30:41 · 317 阅读 · 0 评论 -
Python多线程——队列(Queue)
一、 Queue作用:主要就是为多线程生产值、消费者之间线程通信提供服务,具有先进先出的数据结构。1、首先我们组要明白为什么要使用队列,队列的性质, 多线程并发编程的重点,是线程之间共享数据的访问问题和线程之间的通信问题,为了解决线程之间数据共享问题, PYTHON 提供了一个数据类型【队列】可以用于在多线程并发模式下,安全的访问数据而不会造成数据共享冲突。 正常请求的多线程,如果是消费之和生产者,通过列表实现,多线程会对列表中的数据取值,会出现同时访问列表数据 的情况,这时候就需要对线程原创 2022-04-21 21:29:03 · 17891 阅读 · 2 评论 -
dataframe遍历效率对比
python原创 2022-04-13 21:06:45 · 2623 阅读 · 1 评论 -
ThreadPoolExecutor线程池的理解与应用
线程池与进程池原创 2022-04-07 20:02:22 · 498 阅读 · 0 评论 -
list乘法复制带来的坑
列表数据类型慎用乘法进行复制原创 2022-03-15 14:23:12 · 122 阅读 · 0 评论 -
集合添加数据类型出现:unhashable type: ‘list‘
unhashable type: 'list'原创 2022-03-08 19:57:10 · 2330 阅读 · 0 评论 -
pip国内镜像源速度几十倍于官方及如何设置
速度大比拼:国内镜像源VS官方镜像源;及pip配置文件如何设置原创 2022-02-12 16:51:17 · 1155 阅读 · 0 评论 -
pandas中一列拆分成两列
import pandas as pddf = pd.DataFrame([['a1','a2', 'a3_a4'], ['b4', 'b5', 'b6_b7']],columns=['A','B','C'])xx = df[['A', 'B']]print(xx)xx["C"], xx["D"] =df['C'].str.split('_', expand=True).values.Tprint(xx)原创 2021-12-28 09:31:35 · 2871 阅读 · 0 评论 -
Ran out of input
python原创 2021-12-06 16:52:32 · 264 阅读 · 0 评论 -
dict()与{},list()与[]性能对比
结论显而易见!!!原创 2021-11-02 09:38:54 · 134 阅读 · 0 评论 -
python3中的dict循环性能对比
情况一、遍历keyimport timeitDATA_SIZE = 10**6testDict = dict()for i in range(DICT_SIZE): testDict[i] = i # 构建大小为100W的字典 def test1(): for _ in testDict.keys(): passdef test2(): for _ in testDict: passdef test3(): f原创 2021-11-01 20:50:38 · 688 阅读 · 0 评论 -
logging通过配置文件设置同时输出到终端与文件
原创 2021-10-29 09:23:59 · 369 阅读 · 0 评论 -
pip升级之后出现:/usr/bin/pip: No such file or directory
这是因为缓存的问题造成的,解决方案:1.which pip/usr/local/bin/pip2.pip-bash: /usr/bin/pip: No such file or directory3.type pippip is hashed (/usr/bin/pip)So pip is definintely in /usr/local/bin/pip but it is been cached as in /usr/bin/pip, thanks to the Stackoverflow转载 2021-10-14 15:03:19 · 878 阅读 · 0 评论 -
How to solve C library not available dtaidistance
1、export CFLAGS=’-std=c99’2、pip install -vvv --upgrade --no-cache-dir --force-reinstall dtaidistance来源:https://github.com/wannesm/dtaidistance/issues/20原创 2021-10-14 14:42:04 · 516 阅读 · 2 评论 -
Python中 pyx、pyd与so的关系
一、问题描述:在windows系统中pip install dtaidistance,可以直接正常使用;而在linux上用同样的命令安装,却无法运行,原因是无法加载dtw_cc模块。而dtw_cc都是pyx与pyd格式?二、问题研究:1、pyx.pyx 文件是由 Cython 编程语言 “编写” 而成的 Python 扩展模块源代码文件;类似于 C 语言的 .c 源代码文件,.pyx 文件中有 Cython 模块的源代码2、pyd与so不像 Python 语言可直接解释使用的 .py 文件,.py原创 2021-10-14 14:24:07 · 1843 阅读 · 0 评论 -
pandas保存新增sheet表,且不overwrite原有内容
一、需求描述: 读取一个excel表格文件,然后根据某项数据类别新增几个sheet;;我选用了pd.to_excel实现此需求,但会overwriting,即原有的内容不复存在。二、实现方案:根据pandas版本选择最优方案1、pands >= 0.242、pandas < 0.24注意:这两个圈圈里面文件名可以不一样,load文件与write文件分开。...原创 2021-09-30 09:47:18 · 1257 阅读 · 0 评论 -
json文件中的双引号隐藏
一、问题起源:因为看到某个文件的字符串没有双引号也可以加载,就以为json.load加载json中的字符串内容是不需要加双引号的,于是就出现了如下问题:全选时出没有出现:加载也报错二、问题解决:给所有关键字都加上了双引号,如图所示:未选时:选择时:成功加载:三、结论json文件中双引号会自动隐藏...原创 2021-09-22 17:38:38 · 538 阅读 · 0 评论