Python
拾一滴清水
编你所思,程你所想。
展开
-
【概率统计】如何通俗易懂的理解P值
P值是一种衡量数据在原假设成立情况下有多罕见的指标。P值越小,数据在原假设成立的情况下就越罕见,怀疑原假设的理由就越充分。然而,P值只是统计推断中的一个工具,不能绝对地告诉原假设是对还是错,只能提供一种证据来帮助做出判断。原创 2024-07-10 22:52:08 · 1104 阅读 · 1 评论 -
【概率统计】从统计角度理解AUC:一步步揭开神秘面纱
AUC作为分类模型性能的评价指标,其统计意义在于衡量一个随机选择的正样本的预测概率大于一个随机选择的负样本的预测概率的概率。原创 2024-07-10 22:28:14 · 1057 阅读 · 0 评论 -
【Python】pandas melt实现数据的列转行
使用panda中的melt函数实现数据的列转行原创 2024-03-26 11:46:03 · 236 阅读 · 0 评论 -
【Python】python包相对导入问题及解决方案
python包相对导入问题及解决方案原创 2023-11-27 15:58:08 · 1438 阅读 · 1 评论 -
【Python】使用pyhive提取数据时同时显示日志
使用pyhive提取数据时同时显示日志原创 2023-03-28 11:43:33 · 235 阅读 · 0 评论 -
【Python】win10上用psutil统计应用CPU占用情况
对于多进程应用,调用p.cpu_percent()函数会出现值大于100的情况,给人一种不太准确的感觉。为解决该问题,以统计谷歌浏览器CPU占用情况为例,实现相关统计逻辑。原创 2023-03-22 21:19:19 · 1201 阅读 · 0 评论 -
【Python】使用字典模拟switch/case语句
背景众所周知,Python中没有switch/case语句,而工作中经常会有不同的逻辑需要处理,比较常见的方式是使用if语句实现多种逻辑处理,但随着逻辑的增多,多个elif会让代码看起来很不友好。比较trick的方法,是使用dict实现多种逻辑处理来模拟switch/case语句。使用if实现def dispatch_if(operator, x, y): if operator == 'add': return x + y elif operator == 'su原创 2021-03-01 14:32:24 · 727 阅读 · 0 评论 -
【Numpy】np.tile举例理解
np.tile()仔细观察数据前后的shape,便可知晓该函数的用法。在原始数据shape基础上,对应轴扩展几倍。例如,原始数据x的shape是(2, 3),np.tail(x, [1,2])表示扩展后的数据shape为(2x1, 3x2),即行数不变,列数扩展为之前的两倍,因此shape为(2, 6)。类似地,tf.tile()也是对tensor做同样的扩展操作。# shape为(2, 3)x = np.array([[1, 2, 3], [4, 5, 6]]) # =原创 2021-02-02 14:27:13 · 810 阅读 · 2 评论 -
【tensorflow2】embedding层索引出错问题
出错信息tensorflow.python.framework.errors_impl.InvalidArgumentError: indices[4,0] = 5 is not in [0, 5)indices[4,0] = 5 is not in [0, 5)说明embedding的最大索引值为4,这里是5,所以出错了。查看构建Embedding层的代码发现input_dim为4,改为5后即可。# 出错的代码embedding = Embedding(input_dim=4, out原创 2021-01-26 16:28:00 · 2707 阅读 · 0 评论 -
python中修改已定义好的nametuple属性值
定义用户nametuple定义一个具有名称、性别和年龄属性的namedtuple类型用户from collections import namedtupleUser = namedtuple('User', ['name', 'sex', 'age'])user = User(name='jessica', sex='female', age=21)修改年龄属性# 这样修改会报错user.age = 32# 正确的修改方式user = user._replace(age=32)原创 2021-01-22 10:49:00 · 2918 阅读 · 0 评论 -
Python异步【Hello World】
异步样例异步打印不同的"Hello World"import randomimport asyncioasync def print_async(message): # Randomizing the delay to prove it's actually # async. To always run your code as fast as # possible, sleep for 0 seconds. await asyncio.sleep(rando原创 2021-01-08 14:17:40 · 986 阅读 · 2 评论 -
pandas系列之apply小记
pandas系列之applyapply函数用于series和dataframe的写法不尽相同,注意区分;此处的action表示一个用户历史点击数据的dataframe;其中,sid_list = actions[‘sid’].unique().tolist()1.1 基础写法def func(x): x = np.random.choice(sid_list) return x # 以下三种apply方式等价actions['sid'] = actions原创 2020-09-12 22:29:06 · 3227 阅读 · 1 评论 -
导出ipython中的历史输入代码和输出结果
说明利用hist命令将ipython当前session中的历史Python代码导出;利用logstart命令结合相关参数自定义导出路径。1.利用hist保存当前session历史记录到文件# 在ipython中输入以下命令,保存的python代码不包含输出%hist -f 历史记录/history.py2.利用logstart保存当前session历史记录到文件# 在ipython中输入以下命令,保存的python代码包含输出# -o: 保存输出# -r: 保存原始输入# -t原创 2020-09-12 22:10:14 · 5175 阅读 · 0 评论 -
pandas系列之index小记
pandas系列之index1.1 重置索引常见索引drop用法import pandas as pd# 数据准备df = pd.DataFrame(np.arange(20).reshape(5, 4), index=[1, 3, 6, 9, 10])# 重置索引且保留原始索引df.reset_index()# 重置索引且不保留原始索引df.reset_index(drop=True)1.2 索引显示concat两个dataframe所涉及的索引情况# 按照列连接原创 2020-09-05 20:47:31 · 4298 阅读 · 0 评论 -
Python中利用random和np.random生成随机数的简单说明
生成随机数利用python自带的random和numpy中的random生成随机数时,略微有点差异,用以下几个简单示例简要说明。1. randomimport random# 随机返回[0, 1)区间的一个实数 => 0.5742038482435357random.random()# 左闭右闭,随机返回[1, 10]区间的一个整数 => 10random.randint(1, 10)# 左闭右开,随机返回[1, 10)区间的一个整数 => 9random.ran原创 2020-09-04 23:15:17 · 4996 阅读 · 0 评论