python
K:v
数据分析/机器学习/自然语言处理。
展开
-
embedding中的normalize_embeddings参数
在句子嵌入的背景下,将它们归一化可以在使用余弦相似度作为衡量句子或文档相似性的度量时特别有用。余弦相似度可解释性: 当嵌入进行归一化时,两个向量之间的余弦相似度等同于它们的点积。这使得余弦相似度更具解释性,因为它的取值范围从-1(完全不相似)到1(完全相似)。提高训练稳定性: 归一化嵌入可以提高训练的稳定性,特别是在模型对输入特征的尺度敏感的情况下。它可以防止模型过于敏感于大幅度的值。正则化效果: 归一化充当正则化的一种形式,通过约束嵌入的幅度可以帮助防止过拟合,特别是在训练数据有限的情况下。原创 2023-12-20 17:45:29 · 579 阅读 · 0 评论 -
tsne+seaborn 绘制语义空间分布
【代码】tsne+seaborn 绘制语义空间分布。原创 2023-03-02 12:44:09 · 106 阅读 · 0 评论 -
用python安装opencv-python提示报:ModuleNotFoundError: No module named ‘skbuild’
用python安装opencv-python提示报:ModuleNotFoundError: No module named ‘skbuild’原创 2023-01-21 12:32:04 · 1221 阅读 · 0 评论 -
依据标签数量进行分布展示
import seaborn as snsimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei']plt.rcParams['font.serif'] = ['SimHei']fig, ax = plt.subplots()fig.set_size_inches(20, 8)sns.set_style("darkgrid", {"font.sans-serif": ['simhei', 'Aria原创 2022-02-22 16:46:02 · 595 阅读 · 0 评论 -
关于for-loop效率,python3.8 是python3.6的多少倍?
python3.8 进行for循环---每行1~2秒开始计算第1行... 共67371行2021-03-05 14:49:39开始计算第101行... 共67371行2021-03-05 14:49:43开始计算第201行... 共67371行2021-03-05 14:49:45开始计算第301行... 共67371行2021-03-05 14:49:46开始计算第401行... 共67371行2021-03-05 14:49:47开始计算第501行... 共67371行2021原创 2021-03-05 15:06:15 · 153 阅读 · 0 评论 -
Neo4j问题及解决
报错1:The client is unauthorized due to authentication failure.报错2:WARN Failed authentication attempt for 'neo4j' from 127.0.0.1进入neo4j安装目录, 并进入bin目录; 运行./cypher-shell命令, 输入用户名,密码(初始默认用户名和密码为neo4j)3.停止neo4j服务,并且删除data/dbms/auth4.修改D:\neo4j-commu.原创 2020-10-12 10:48:41 · 8315 阅读 · 5 评论 -
windows10 定时任务 启动python脚本
先把程序测试通,然后设置定时!原创 2020-09-17 14:53:18 · 228 阅读 · 0 评论 -
docker&dockerfile&容器实用操作,帮你填坑
步骤一:启动、进入容器docker run -i -t python_requirements:201 /bin/bash#容器内Python包的位置,查看Python包ls /usr/local/lib/python3.6/dist-packages/步骤二:查询容器IDdocker ps -adocker inspect -f '{{.ID}}' [容器NAMES]得...原创 2020-04-28 15:48:57 · 268 阅读 · 0 评论 -
多特征聚类,依据坐标显示
from conf.config import *mysql = MYSQLmysql.open()def read_data_mysql(table_name,n,label,num_features): select_sql = "SELECT * FROM %s " % table_name # select_sql = "SELECT * FROM %s " %...原创 2020-05-06 11:29:58 · 922 阅读 · 0 评论 -
for 循环, 多进程并行加速
########## for 循环并行,单一参数 #############import timeimport multiprocessingdef do(i): print(i) time.sleep(2)if __name__ == '__main__': param = [] #假设有100次循环 for i in range(0,...原创 2019-11-05 11:39:38 · 4088 阅读 · 0 评论