自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (1)
  • 收藏
  • 关注

原创 Conda命令整理-自用版

conda 命令自用整理

2023-08-25 17:00:38 570

原创 LangChain与大模型的持续学习ing

LLM和LangChain的学习

2023-08-07 17:30:47 1754

原创 数据库的学习笔记(二)

关系型数据库

2022-12-10 22:45:42 507 1

原创 python学习日记-基础知识(1)

python基础学习笔记

2022-08-20 17:00:55 531

原创 数据库的学习笔记(一)

数据库的基础学习

2022-01-15 23:09:34 647

原创 Excel将某列文本内容符合要求的转移到另一列中

excel中函数的使用,IF,ISERROR,FIND三个函数的组合使用

2021-12-16 20:42:53 4183

原创 计量语言学软件Altmann-Fitter阿尔特曼拟合器的使用简介(更新中)

计量语言学软件Altmann-Fitter阿尔特曼拟合器的使用简介:Altmann-Fitter是一款用于对频次分布进行单变量离散概率分布拟合的软件,在所有的实证研究领域都能使用。它内置了超过200种概率分布及其相关属性的信息,这是目前所能找到的最大的分布集之一。该软件拟合操作的自动化程度很高,用户基本上无须设定初始值或其他参数。其拟合优度的标准是基于卡方检验。拟合过程是以迭代的方式进行的,程序会不断提高拟合优度,直至找不到更好的拟合结果为止。

2021-07-23 09:59:51 2242 13

原创 python 关于文件和文件夹的操作(持续学习更新汇总中)

python 关于文件和文件夹的操作1、关于文件的常用操作1.1文件的打开与关闭1.2 文件的读写1.2.1 读文件1.2.2 写文件1.3 文件编码的查看与更改1.4 遍历文件2、关于文件夹的常用操作2.1 遍历文件夹,获得其文件2.2 创建文件夹 os.makedirs()参考文章这里,将python 对于文件和文件夹的我常用的操作进行一次汇总,以方便日后自己和大家的使用。代码实例部分改编自网络,除引用处声明外,将在文末集中感谢。1、关于文件的常用操作1.1文件的打开与关闭f=open(InP

2021-05-22 23:33:28 721

原创 matplotlib.pyplot python绘图用法(学习中)

matplotlib.pyplot1、pyplot 是什么?2、实例展示总是一次次的用到的时候再在网上现搜,所以打算这次整理一下,方便自己和有需要的人的使用。1、pyplot 是什么?是通过命令在python中进行绘图和数据展示的一个函数。比如,我们现在有很多点,可以通过plt进行展示这些点的分布。#导入库import numpy as npimport matplotlib.pyplot as plt#生成数据集:可以用来分类任务,可以用来回归任务,可以用来聚类任务,用于流形学习的,用于

2021-05-14 14:34:15 673

原创 算法和算子(待补充)

算法和算子算法和算子算法算子算法和算子算法和算子的关系:算法(algorithm)是为了达到某个目标,实施的一系列指令的过程,而指令包含算子(operator)和操作数(operand)。算子:operator, 简单说来就是进行某种“操作“,动作。与之对应的,就是被操作的对象,称之为操作数,operand作者:知乎用户链接:https://www.zhihu.com/question/273906526/answer/373969269来源:知乎著作权归作者所有。商业转载请联系作者获得授

2021-04-30 10:55:43 3182

原创 关于Zipf定律的理解和python实现

关于Zipf定律的理解和python实现Zipf定律含义二级目录三级目录Zipf定律含义二级目录三级目录

2021-03-31 16:51:19 4180 6

原创 Python NLTK的学习(二) 获得文本语料和词汇资源

(二)获得文本语料和词汇资源2 获取文本语料库2.1 NLTK自带语料库2.1.1古腾堡计划电子书2.1.2 网络和聊天文本2.1.3 布朗语料库这部分 主要是解决以下的问题的:如何获取想要的语料那些代码适合获取语料怎么更好的编写获取语料的代码2 获取文本语料库2.1 NLTK自带语料库2.1.1古腾堡计划电子书NLTK自身在下载的适合也可以选择下载其带的古腾堡计划的电子书作为文本语料库,我们也可以从其网站上【http://www.gutenberg.org/】有选择的浏览。from

2021-03-18 20:38:44 712

原创 python 格式化打印print常见用法(更新中)

python 格式化打印print常见用法1.一般打印1.1打印到控制台1.2 打印到文件2.格式化打印2.1 % 方法2.1.1 格式化常用符号2.1.2 格式化操作符辅助命令2.2 .format()方法参考文章最近一段时间,经常在用到print格式化或模式化输出的时候,不是弄混了用法,就是忘记了一些格式。现在,将常用的例子和符号给自己做一次总结。以便下一次忘了时候方便查找。1.一般打印也就是我们最简单的打印,不需要格式化的用法。1.1打印到控制台我们最最经常的用法就是将程序的结果在控制台上显

2021-03-14 17:36:47 4487 2

原创 用于文本去重(相似度计算)的Simhash算法学习及python实现(持续学习中)

Simhash算法学习及python实现1. Simhash算法是什么?2.Simhash算法思想3.Simhash算法流程3.1 分词3.2 hash3.3 加权3.4 合并3.5降维4. SimHash签名距离计算4.1 什么是海明距离呢?4.2 大规模数据下的海明距离计算参考文章来源于众多文章的学习,将在文章末尾,集中附录出所有学习的文章1. Simhash算法是什么?一段文字所包含的信息,就是它的信息熵。如果对这段信息进行无损压缩编码,理论上编码后的最短长度就是它的信息熵大小。如果仅仅是用来

2021-03-05 12:13:40 11407 17

原创 安装mxnet失败的第31天!!!

深度学习框架mxnet的安装:放在前面,我终于成功了C:\ProgramData\Anaconda3>python.exe -c "import mxnet as mx; print(mx.nd.zeros((1,2), ctx=mx.gpu()) + 1)"[[1. 1.]]<NDArray 1x2 @gpu(0)>根据各方提示,我先是去NVIDIA的控制面板查看自己需要安装的CUDA 的版本,显示我可以安的是cuda10.2,去官网,失败了N天以后,学会了百度下有没有好

2021-01-30 15:30:24 3497 6

原创 pip升级失败或pip安装各种包失败时的操作

pip升级失败时的操作python -m pip install --user --upgrade pip一般就可以解决

2021-01-30 12:53:14 242

原创 二分法找错误简直是个玄学!!!

二分法:二分法的时候难买出现各种各样的小bug,小到找了好几遍都找不到错在哪里?那么哪里是需要我们警惕的呢?1、不再单独使用字母 l ,相信我,在有的时候,我们菜鸟是发现不了 l 和 1 的区别的时候(在这里显示的却很清楚)l1那上面的如果没有颜色的差别,不知道大家,反正我是分不清的。。2、我们看下面的一段代码,是力扣上面的一道题,可能大佬一看就知道哪里错了,但是我是搞了半天没发现我哪里有问题,去看大家的题解才发现,我错哪里了,问题是啥呢?大家先看看class Solution:

2021-01-27 20:42:56 526 1

原创 think python2第八章习题8-4解析

think python2第八章习题8-4:习题8-4下面这些函数,都是 用于 检查一个字符串是否包含一些小写字母的,但是其中至少有一些是错误的函数。 检查每个函数,描述这个函数实际上做了什么(假设形参是字符串)。def any_lowercase1(s): for c in s: if c.islower(): #如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False

2021-01-09 11:08:52 721 4

原创 SyntaxError: (unicode error) ‘unicodeescape‘ codec can‘t decode bytes in position 467-468: malformed

项目场景:正常写文件路径,执行时报错:SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 467-468: malformed \N character escape提示:这里简述项目相关背景:问题描述:那这里都可能是什么问题呢?1、文件路径使用的是 \ 隔开。最好用 / 或者路径前加 r" D:。。/。。"2、这样操作还是错,比如:'''下载weibo.x

2020-12-08 20:48:26 545

原创 命令行等快捷小技巧!!!(持续更新)

命令行小操作:1.快速获取某一文件夹下文件的名称DIR *.* /B >LIST.TXT

2020-12-04 14:46:48 183

原创 SyntaxError: invalid syntax都可能是是什么错!!!(持续更新)

SyntaxError: invalid syntax这个报错经常遇见,但是总感觉自己的代码没有问题,根据报错提示的行也找不到错误,这些情况以及解决方法都有哪些呢?1)丢符号类:忘记在 if , elif , else , for , while , class ,def 声明末尾添加 冒号( : )代码中的 ( )没有成对出现,比如: for line in f: line = line.strip() …… if len(words)>1

2020-11-28 16:43:22 52613 2

原创 停用词表的使用

停用词表的使用:问题描述:停用词表的使用,不能死板的从网上查找模板,一定要根据自己的需要去修改,不然会影响使用效果停用词典的使用需要读取进入文件,使其从文件变成一个个的词,比如下面:s=open("data/Chinese_stop.txt",encoding='utf-8',errors="ignore")chinese_stop={}for word in s: word =word.strip() chinese_stop[word]=1 s.close

2020-11-08 10:39:41 3435 2

原创 Python NLTK的学习(一)

学习目标:搞定nltk学习内容:第一章1.1-1.5学习时间:1.2020/10/16学习产出:>>> from nltk.book import **** Introductory Examples for the NLTK Book ***Loading text1, ..., text9 and sent1, ..., sent9Type the name of the text or sentence to view it.Type: 'text

2020-10-16 23:10:02 1620

原创 python正则表达式学习及其运用实例(陆续更新)

什么是正则表达式以及我遇见的一些例子总结什么是正则表达式提示:以下是本篇文章正文内容,下面案例可供参考我遇见的一些例子慢慢遇见,慢慢添加~a{2,3}a? 0/1a+ >0a* >1. 任意一个字符\d 所有数字\D 所有非数字\s\S[abc][^abc]\d+\.\d+\[[^\[]+\]Ret=re.match("(\d+)([+-])(\d+)",T)#数字 + - 数字 \d+ 0-9任意数字一次或任意次 ..

2020-10-16 15:35:51 438

原创 起飞的 python!!!

python 小白之路# 学习目标:搞定python

2020-10-11 20:52:15 332

Altmann-Fitter-v3.1.0-Setup.zip

Altmann-Fitter是一款用于对频次分布进行单变量离散概率分布拟合的软件,在所有的实证研究领域都能使用。它内置了超过200种概率分布及其相关属性的信息,这是目前所能找到的最大的分布集之一。该软件拟合操作的自动化程度很高,用户基本上无须设定初始值或其他参数。其拟合优度的标准是基于卡方检验。拟合过程是以迭代的方式进行的,程序会不断提高拟合优度,直至找不到更好的拟合结果为止。该软件为收费软件,其最新版本为3.1.0版。试用版除了不能导出数据之外,其他的功能与收费版都是一样的。 因此,软件的试用版就已经可以用于实际研究了。

2021-07-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除