水...琥珀-CSDN博客

原创【日常技能】excel 换行符替换的3个方法完美解决

来将换行符（CHAR(10)代表换行符）替换为一个空格或你想要的其他字符。如果是csv转excel的文件，以上方法不行的话，可以用公示替换。ctrl+h 替换的快捷键、ctrl+ f 寻找快捷键。假设你的数据在A列，你可以在B列使用公式。ctr+j 出现一个小点, 这个是换行符。先ctrl+h 进入替换的界面。office ，同理。

2024-07-18 10:16:52 5888

原创使用wave库获取wav音频文件时长

【代码】使用wave库获取wav音频文件时长。

2024-06-18 14:15:43 158

原创 [python日常]获取指定文件夹下，指定后缀的文件

为后缀的文件名，并将它们存储在一个列表中。# 打印所有.mp3文件名。要读取指定路径下所有以。

2024-06-18 11:40:27 1734

这段代码首先加载音频文件，然后分离左右声道。接着，根据指定的分贝数增加每个声道的音量，最后将增强后的声道合并并导出到新的音频文件中。请根据你的具体需求调整。库调整每个声道的音量。要使用Python增强音频文件中左右声道的声音，可以利用。）应根据实际情况修改，并确保文件路径和文件名正确无误。如果没有安装，可以通过pip安装。首先，请确保你已经安装了。库，并且系统中已配置好。参数来控制增强的程度。在处理音频时需要依赖。

2024-06-18 09:48:47 318

原创处理音频文件，报错wave error format 7

audio_data,: 这是一个数组（通常是NumPy数组），包含了音频文件中的原始样本值。简单来说，audio_data, 存储了音频波形的所有数据点，这些点连在一起就形成了我们听到的声音的形状。而对于立体声（左右两个通道）音频，它通常是二维的，每个维度对应一个通道的样本值。（采样率）: 采样率是指每秒钟采集声音样本的数量，单位是赫兹（Hz）。常见的采样率有44100 Hz（CD质量）、48000 Hz（专业音频）和16000 Hz等。较高的采样率能够捕捉到更多的声音细节，但同时也会增加文件的大小。

2024-06-17 10:29:42 181

原创 python将音频文件从8kHz采样率转换为16kHz采样率，并保持双声道，立体声

但请注意，使用`pydub`之前需要确保你的系统中已安装`ffmpeg`，因为`pydub`依赖于`ffmpeg`进行音频文件的转换。此外，如果你的音频文件不是MP3格式，需要将`format`参数相应地改为你的文件格式（如`.wav`、`.aac`等）。- 如果在使用过程中遇到权限问题或找不到`ffmpeg`的错误，可能需要在代码中显式指定`ffmpeg`的路径，或者将`ffmpeg`添加到系统环境变量中。- 在使用`pydub`之前，确保已经安装了此库以及正确配置了`ffmpeg`。

2024-06-17 09:50:14 536

原创 docker run 两个挂载路径怎么设置

命令时，如果需要挂载多个宿主机目录到容器中，您只需为每个挂载路径添加一个。记得根据实际情况调整镜像名称、标签以及容器启动命令。镜像启动了一个交互式的 Bash Shell。docker run 两个挂载路径怎么设置。替换为您实际要挂载的路径。在这个例子中，我们挂载了宿主机的。

2024-06-04 19:30:26 460

原创 docker 启动

这是你指定的镜像名及标签，用于基于这个镜像创建容器。: 这是容器启动后执行的命令，默认进入 Bash Shell。这意味着你会直接进入容器的 Bash 环境，可以开始执行各种命令。综上所述，这个命令会创建并启动一个带有交互式 Bash Shell 的 Docker 容器，该容器基于。这样，宿主机和容器之间可以共享这个目录下的文件，对于开发和数据持久化很有帮助。你的命令行指令是用于启动一个Docker容器的示例，该容器基于名为。: 这是一个卷挂载选项，它将宿主机上的一个目录（你需要替换。

2024-06-04 19:29:37 358

原创删除docker 镜像和容器

①查询容器 docker ps -a 查看相关容器（运行中和停止的）②停止容器 docker stop 容器id。删除docker镜像，需要先删除容器；删除docker容器，需要先停止容器；docker rm 容器id。”删除镜像，可以只取“

2024-06-04 14:32:58 201

原创 docker镜像转移,mac Linux

起因是镜像在互联网，而公司内网没有网络，需要跨平台转移，且系统不一样，一个Arm,一个linux。正常进行后，报错系统编译问题，特将处理过程总结一下。

2024-06-04 14:20:26 1102 1

原创如何计算文件的SHA256校验码检查文件的完整性

用户在下载完模型后请检查每个文件的完整性，给予用户模型文件的sha256校验码。

2024-05-17 16:20:40 1130

原创查看所有Python虚拟环境的方法

查看所有Python虚拟环境的方法

2024-05-15 16:30:37 5650

原创 python与anaconda 的对应关系

示例如下，绿色框，有的在包的列表中搜python就可以找到。不能下载好anaconda 后才能知道python吧。python11 2023年7月。

2024-05-15 14:17:45 161

原创 python 虚拟环境-最简单的教程

命令中我制定了环境名称是env_name，指定了Python版本是3.10，执行命令后，Conda会自动下载最新版的Python3.10。(1)执行命令：conda create --name env_name python=3.10，从语法来看，不能快速指定python版本，改的话需要改其配置文件，可参考。指定版本命令 pip install requests==2.18.4。升级：pip install --upgrade requests。（建议是python是什么版本就venv什么版本）

2024-05-14 17:25:01 458 1

原创苹果Mac用户下载VS Code（Universal、Intel Chip、Apple Silicon）哪个版本？

苹果macOS用户既可以下载通用版（Universal），软件将自动检测用户的处理器并进行适配。下载到的ZIP格式压缩包解压出来，拖动到Applications(应用程序)即可完成安装。使用苹果自研M系列CPU的Mac电脑下载Apple Silicon版本。使用Intel CPU的Mac电脑可下载Intel Chip版本；

2024-05-08 14:46:57 1156

原创 [MAC] mac电脑更新 git的安装homebrew

2、试了网上好几种方法，以下方法完胜。国内镜像进行下载的,且一步到位。1、官方网站需要翻墙，不能下载。

2024-04-14 23:09:53 535

原创 windows 安装pytorch 权限问题

环境说明：windows10 python3.6 anaconda31.按照进入pytorch官网https://pytorch.org/选择正确的命令它会自动为你选择一些配置，复制命令我选择的是：conda install pytorch torchvision cudatoolkit=10.1 -c pytorch2.安装出现报错：ERROR conda.core....

2019-11-12 08:27:48 1389 1

原创逻辑回归算法梳理

【任务2 - 逻辑回归算法梳理】时长：2天1、逻辑回归与线性回归的联系与区别2、逻辑回归的原理3、逻辑回归损失函数推导及优化4、正则化与模型评估指标5、逻辑回归的优缺点6、样本不均衡问题解决办法7. sklearn参数参加了Datawhale的活动，虽然在机器学习有一定的实践和经验积累，不过总是有自己的漏洞，所以参加基础的机器学习任务。博客尽力的水到渠成，不过很多内容来自之前自...

2019-04-01 21:29:29 905

原创线性回归知识总览

博文内容为机器学习的一些概念有监督、无监督、泛化能力、过拟合欠拟合(方差和偏差以及各自解决办法)、交叉验证线性回归的原理线性回归损失函数、代价函数、目标函数优化方法(梯度下降法、牛顿法、拟牛顿法等)线性回归的评估指标sklearn参数详解机器学习的一些概念有监督、无监督统计学习包括监督学习、非监督学习、半监督学习及强化学习。监督学习（superv...

2019-03-29 18:13:35 857

原创 CSDN Markdown编辑下插入公式

使用$将公式左右包括起来，键入的式子将以公式格式显示$公式$ 句中插入，这是一个演示y^\hat{y}y^$换行居中插入换行居中插入换行居中插入$这是一个演示y^\hat{y}y^原始语法如下：$公式$ 句中插入，这是一个演示$\hat{y}$ $$换行居中插入$$ 这是一个演示$$\hat{y}$$ ...

2019-03-28 18:14:30 539

原创 Python小点dian儿：读取一个目录下目录和文件

目录代码一：输出文件目录相关内容代码二：输出一个目录下所有文件名字（第一层）代码三：返回当前路径下所有层的文件路径列表代码四：依次从内层到外层获取当前路径下文件（改造自代码三），也可直接代码一获取代码五：获取当前路径下一层指定后缀文件列表（多层可改造代码三）代码一：输出文件目录相关内容os.walk(file_dir)从外到内获取多层# -*- cod...

2019-01-10 21:10:27 1132

原创小点dian儿：pandas混淆矩阵

import pandas as pd pd.crosstab(y_Test,prediction, rownames=["lable"],colnames=["predict"])y_Test,真实值prediction,预测值rownames=["lable"],行名colnames=["predict"]，列名

2018-12-28 10:13:01 1598

原创小点dian儿：Python大文件读取、文件拆分，读取部分数据

目录pandas参数说明文件部分读取参数文件成块读取参数成块读入，并写入其他文件。官方文档pandas参数说明pandas在read_csv或 read_table有几个个参数文件部分读取参数nrows : int, default NoneNumber of rows of file to read. Useful for reading pieces ...

2018-12-27 15:34:38 6525

转载 python 删除文件首行或指定行（修改文件）

网上的大多数答案也是，读入，写入的过程，总结如下python修改文件(fileinput) 链接 https://blog.csdn.net/u013398398/article/details/53583596上网查了好多方法都是将文件一行一行都进来，然后新开一个文件指针，将文件再一行行写进新文件里。感觉不是太好，看到这个fileinput的库，发现大同小异，不过有一点就是可以在原...

2018-12-26 15:33:20 43614 10

原创 python训练work2vec词向量实例（python gensim）

前期工作可参阅：1.python work2vec词向量训练可参考 https://blog.csdn.net/shuihupo/article/details/85156544词向量训练2.word2vec词向量中文语料处理(python gensim word2vec总结）可参考 https://mp.csdn.net/postedit/85162237汇总数种语料加载方式。之前的...

2018-12-23 21:03:12 9595 13

原创 python work2vec词向量应用方法汇总

目录前期工作可参阅：work2vec词向量应用汇总（词语相似度、集合相似度、词向量计算等）1.获取每个词的词向量2支持词语的加减运算。（实际中可能只有少数例子比较符合）3计算两个词之间的余弦距离4计算余弦距离最接近“word”的10个词，或topn个词5计算两个集合之间的余弦似度6.选出集合中不同类的词语看了很多资源，总感觉work2vec词向量应用总结得不全面...

2018-12-23 20:44:27 3140

原创 python 第三方包的安装位置

键盘 win +R调出 cmd在cmd中输入一个已经安装过的包的命令，它就会显示安装的位置。比如 pip install pandas 它就显示你的安装包目录了。手动安装第三方详见教程python 安装.whl、egg、zip、tar.gz安装包...

2018-12-21 20:58:20 10539

原创 python训练work2vec词向量（python gensim）

目录看了很多文章，对与word2vec语料的处理没有那么清晰，现在写下自己处理流程，方便入手的小伙伴，望大家使用的过程中，少走弯路。训练语料格式模型训练1.安装gensim2.模型训练3.模型保存3.1模型训练保存与加载1（模型可继续训练）3.1.1模型继续训练3.2模型训练保存与加载2（模型不可继续训练）模型使用汇总（词语相似度、集合相似度、词向量计算等）...

2018-12-21 17:59:10 22319 9

原创 word2vec词向量中文语料处理(python gensim word2vec总结）

目录中文语料处理法一：语料处理为列表法二：语料是文件（处理为迭代器）对一个目录下的所有文件生效（法1）对一个目录下的所有文件生效（法2）class : gensim.models.word2vec.PathLineSentences对于单个文件语料，使用LineSentence语料库获取语料word2vec中文语料处理及模型训练实践python gensi...

2018-12-21 15:41:45 35482 17

原创 python小点dian儿：去除txt/json重复行

目录去除重复行（法一：利用内置set）去除重复行（法二：建造list或set检查是否已存在）按行写入json/txt文件查看文件行数长度factfile_path 为json文件casefile_path 为txt文件去除重复行（法一：利用内置set）先了解Python splitlines()用法str.splitlines([keepends])按照行...

2018-12-20 22:12:52 1766

原创 python json

json.load(filename)json.loadds(string)

2018-12-20 17:22:05 245

原创 python读取文件 \ufeff 问题

df_ID= pd.read_csv(IDfile_path,encoding= 'utf-8',sep = ',',header=None) ID_list= list(df_ID.ix[:,0]) print(ID_list)我的原始输出：['\ufeffee170175-35de-43b8-ad92-a70600b6da3a', '266d79c7-4ca9...

2018-12-16 19:51:44 3670

原创 Python小点dian儿：sort疑问大全

遇到了就刨根问题，补补python基础吧。数据会清理，特征会派生，模型会跑，参数能调，但始终还是有漏洞，或者术语不可名状。python 去重，并保持列表原来顺序list_a = ['cc', 'bbb', 'dda','bbbb', 'cc', 'sss', 'fase']list_new = list(set(list_a))list_new.sort(key = list_a.i...

2018-12-04 17:55:14 263

原创解决xgboost异常AttributeError: 'DMatrix' object has no attribute 'handle'

xgboost异常AttributeError: 'DMatrix' object has no attribute 'handle' sys:1: DtypeWarning: Columns (65) have mixed types. Specify dtype option on import or set low_memory=False.....xgboost异常Attribu...

2018-10-21 10:41:56 5133

原创 python小点dian儿：使用merge还是join

合并（)：要注意使用merge还是join#merge是因为两个合并的对象，有相同的列，merge以这些相同的列为索引进行合并，默认内连接（'inner'join）,可通过参数how来设置左连接，右连接，全连接其他链接方式。下面的栗子按照索引合并，就会出现两个sorce,不可以join#join实现按索引合并，而不管他们有么有相同的列，默认链接键上的左连接，同样可以通过参数how更改.同时可...

2018-10-20 16:42:17 2747 4

原创日常操作测试（杂）

import pandas as pddf = pd.DataFrame({"key":['green','red', 'blue'], "data1":['a','b','c'],"sorce": [33,61,99],"sorce1": [33,61,99],"sorce2": [33,61,99]})data1 = pd.concat([df,df],ignor...

2018-10-17 17:28:47 186

原创小点dian儿：pandas数据存入文件，行索引处理

小点dian儿：存入数据的时候，我们希望对数据在系统的行名保存或者不保存参数：index=None：（类似，header=False不保存列名）在我们不进行如上的设计的时候，系统或分配默认的行index:0,1,2..在我们将运行结果存入文件，如果不加以设置，将会把这一index列，存入数据文件。（我们已经做好如上涉及，我们希望user_id,和结果同时被记录，则不需要如下index是否...

2018-10-10 22:26:08 752

原创 python小点dian儿：DataFrame 取一列，类型是series 还是 DataFrame？

发现一个小点dian儿一个 DataFrame 取一列，不同的表示方法，名字是不是列表，会影响得到的结果的类型series 或者 DataFrame. python果真是好入手，不好学精呀，之前一直知道取一列后类型会改变问serious,每次都要小心的进行处理，现在发现了这个奥妙，Python也真是强。print("------df---------")print(df)prin...

2018-10-09 22:30:54 12395 3

原创 Python 打印显示设置

设置显示最大行pd.set_option('display.max_rows', None) # 设置显示最大行设置显示最大列pd.set_option('display.width', 200)

2018-10-05 22:31:56 1586

翻译 python小点dian儿读取特殊存储数据

def read_data(path): y = [] row = [] col = [] values = [] r = 0 # 首行第一列为y,其他为x for d in open(path): d = d.strip().split() # 以空格分开 y.append(int(d[0])...

2018-10-05 22:16:45 282

msra(NER)命名实体识别语料

采用如下标注方法： nr人名 ns 地名 nt 机构团体 “团”的声母为t，名词代码n和t并在一起。 nz 其他专名 eg:红军/nt 将领/o 孙毅/nr 将军/o 为/o 我们/o 收藏/o 的/o 二十余册/o （/o １９３７年/o —/o １９４５年/o ）/o 晋察冀抗日根据地/ns 出版物/o

2018-11-26

中文命名实体识别语料

BIO标注集，即B-PER、I-PER代表人名首字、人名非首字，B-LOC、I-LOC代表地名首字、地名非首字，B-ORG、I-ORG代表组织机构名首字、组织机构名非首字，O代表该字不属于命名实体的一部分。

2018-11-26

XGBoost模型原理及其在各大竞赛中的优异表现

XGBoost模型原理及其在各大竞赛中的优异表现，csdn的视频。

2018-08-11

pyltp-0.2.1-cp35-cp35m-win_amd64.whl pyltp-0.2.1-cp36-cp36m-win_amd64.wh

来源：http://mlln.cn/2018/01/31/pyltp在windows下的编译安装/ 包含：pyltp-0.2.1-cp35-cp35m-win_amd64.whl pyltp-0.2.1-cp36-cp36m-win_amd64.whl

2018-08-10

jpype1for python3.5

JPype1_py3-0.5.5.2-cp35-none-win_amd64.whl (md5)。使用pip install wheel 安装wheel成功后，再次安装该文件 pip install ****.whl 即可。主要用于手动安装python3.5对应的jpype1。网上很多地址是LFD提供的代码包链接，但是发现18.3月我下载的一天链接不能下载了。本人搜索能力不行，没有直接找官网一直在博客里搜索浪费半天时间，现把找到的也亲测有效的公布在这里，也可以自行在官网下载。

2018-03-27

python 数据挖掘概念、方法与实践代码

《python 数据挖掘概念、方法与实践》和开源代码，包含各个章节的代码。

2018-03-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人