小何才露尖尖角-CSDN博客

原创置顶写作工具

Markdown 特殊符号及数学公式整理

2024-02-20 21:21:29 234 1

原创 Thera图像超分辨率模型使用

Thera：可能是目前最好的图像超分辨率技术介绍

2025-03-26 18:57:53 345

原创广播机制(Broadcasting)

NumPy 默认是元素与元素的操作所以当我们使用常规的运算符，如 +、-、*、/。默认是元素与元素相操作。

2025-03-13 21:52:38 328

原创 Jupyter Lab打印日志

有时候在 jupyter 中执行运行时间较长的程序，且需要一直信息，但是程序执行到某些时候就不再打印了。可以开启日志控制台，将日志信息记录在控制台中。

2024-12-04 18:43:45 954

原创 pyflink datastream数据流ds经过一系列转换后转为table,t_env.from_data_stream(ds)

ds = ds.map(lambda x: update_tel(x), output_type=Types.TUPLE([Types.INT(), Types.STRING()]))。每一个算子之后需要指定输出的数据类型output_type

2024-11-14 10:54:15 531

进入 MoneyPrinterTurbo 目录，复制 config.example.toml 并重命名为 config.toml，随后打开 config.toml。pexels_api_keys 和 moonshot_api_key 需要到对应官网申请。完成后打开 docker 客户端，点击8501:8501 即可跳转到webui页面。在 docker 安装目录执行以下命令显示隐藏文件夹。给出一段视频文案即可开始生成视频。执行命令打包，可能需要较长时间。试用前需要开启 VPN。

2024-09-17 11:07:57 2151

原创 Mac快捷键

【代码】Mac快捷键。

2024-09-16 00:27:24 179

原创 ast.literal_eval 将字符串 ‘[NaN,NaN,0.0]‘ 转为列表时报错：ValueError: malformed node or string on line 1: ＜ast.N

kimi prompt: ast.literal_eval 将字符串 ‘[NaN,NaN,0.0]’ 转为列表时报错：ValueError: malformed node or string on line 1: <ast.Name object at 0x0000029929149B50>使用 json.loads() 替代，因为 JSON 支持 NaN 值的序列化和反序列化。

2024-07-19 17:28:24 493

原创 spark.createDataFrame(pandas_df)遇错 AttributeError: ‘DataFrame‘ object has no attribute ‘iteritems‘.

解决方案安装2.0以下版本的 pandas

2024-06-23 23:11:58 536

原创 Python字典对象是可变对象

在Python中，字典是可变对象，它们的值可以是任何类型，包括另一个字典或者列表等可变对象。当你在字典中将一个字典赋值给一个键时，你实际上是将这个字典对象的引用赋给了这个键，而不是创建了该字典的一个副本

2024-06-07 10:21:01 306

原创 python 注册环境变量

【代码】python 注册环境变量。

2024-04-11 17:53:56 234 1

原创保存带 numpy.ndarray 的 dataframe

使用 pickle，import picklesave_path = "./result/tmp/text_embedding_df.pkl"with open(save_path, 'wb') as f: pickle.dump(df, f)

2024-03-14 11:21:25 320

原创 pandas: groupby() 分组求向量平均值

data.groupby('Pclass')['Fare'].mean()data.groupby('Pclass').mean()['Fare']对向量求均值，向量类型需为 numpy.ndarray，不能为list会报错

2024-03-12 12:00:03 856

原创 python使用 concurrent.futures 启动并行任务

以相同的方式工作，它使用多进程而不是多线程作为工作池。顾名思义，创建一个可以提交作业的线程池。

2024-02-28 11:17:50 543

原创 No module named ‘transformers.models.auto.tokenization_auto‘

重启kernel

2024-02-26 18:31:25 474

原创超平面介绍

(1) 超平面是指n维线性空间中维度为n-1的子空间。它可以把线性空间分割成不相交的两部分。比如二维空间中，一条直线是一维的，它把平面分成了两部分；三维空间中，一个平面是二维的，它把空间分成了两部分。(2) 法向量是指垂直于超平面的向量。为 N 维向量，b为标量，表示超平面于原点之间的距离。（垂直于超平面），已知超平面中的一点。，需要求它到超平面之间的距离。，对于超平面中的任意一点。

2024-02-20 20:58:52 1743

原创 BPE原理及代码简单演示

BPE(Byte pair encoding)是对字节编码，BPE 算法是在 UTF-8 编码的字符串上运行的，所以它是“字节级”的。理论上任何 UTF-8 编码的字符串都可以统一使用 BPE

2024-02-19 18:26:32 925

原创 tqdm和zip一起用进度条不显示的解决方法

for a,b in tqdm(zip(x, y), total=len(x)): # 添加一个参数 total 即可

2024-01-31 10:12:17 584

原创 sklearn 计算 tfidf 得到每个词分数

sklearn 计算 tfidf 得到每个词分数

2024-01-30 16:51:06 639 1

原创 GPT-SoVITS 测试

AutoDL地址：https://www.codewithgpu.com/i/RVC-Boss/GPT-SoVITS/GPT-SoVITS-Official。Blili 地址：https://www.bilibili.com/video/BV12g4y1m7Uw。GitHub地址：https://github.com/RVC-Boss/GPT-SoVITS。step2 创建好实例之后，进入命令行，输入命令。step4 完成之后，点击 tab 栏，随后选择公网地址打开，进入Web页面。step1 打开地址。

2024-01-27 20:34:37 3826

原创拷贝 hugging face 仓库到 colab

【代码】拷贝 hugging face 仓库到 colab。

2024-01-16 11:24:54 1072

原创 df 计算同一列时间差（差分pandas.diff()）

【代码】df 计算同一列时间差（差分pandas.diff()）

2024-01-15 10:14:20 851

原创 Amphion tts(Text to Speech) 语音合成

强烈推荐使用带 GPU 的 Ubuntu 或 Centos 系统运行，可以租一个比较便宜的机器实例运行

2023-12-29 16:55:00 1015

原创 fill-in-the-middle(FIM) 实现与简单应用

传统训练的 GPT 模型只能根据前文内容预测后文内容，但有些应用比如代码生成器，需要我们给出上文和下文，使模型可以预测中间的内容，传统训练的 GPT 就不能完成这类任务。FIM 是一种新的训练技巧，使得 GPT 类模型能够根据上下问填充中间部分。调换 suffix 与 middle 位置，此为 PSM 模式。通过添加特殊 token, 使得训练数据包含上下文内容。传统训练的 GPT 只能根据上文预测下文。使用 FIM 训练的能够正确填充中间部分。另外还有 SPM 模型。

2023-12-20 21:11:30 5369

原创本地运行大语言模型并可视化(Ollama+big-AGI方案)

其中 Ollama 目前只支持 Mac，LM Studio目前支持 Mac 和 Windows。该服务启动在 3000 端口：http://localhost:3000/ ，直接在浏览器中打开，界面窗口中 vendor 记得选择 ollama。命令行终端运行命令 ollama run llama2，该命令会下载 llama2 模型，随后运行这个模型，现在我们就可以在终端对话了。执行 npm install 可能报错： zsh: command not found: npm。查看是否安装成功：npm -v。

2023-12-16 18:20:55 3540

No module named ‘transformers.models.auto.tokenization-auto‘

https://github.com/PlayVoice/so-vits-svc 预训练文件

公开 wav 格式音频，针对音乐信息提取

空空如也