自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 pandas分组聚合

首先,仅仅分组(groupby)不能产生dataframe对象,产生的是中间结果,在聚合之后,才产生dataframe对象。groupby的参数会成为索引,原来的列聚合后依旧保存。内置的聚合函数:sum(), mean(), max(), min(), count(), size(), describe()自定义聚合函数:df.groupby().agg(自定义函数),可以在外边定义好,也可以直接写个lambda。他们的参数是分组后索引对应的每列都会做为输入。上边两条应用的是单个函数,可以多个函数.

2020-12-01 16:38:58 361

原创 vscode相关配置

首先要先安装python插件。只需配置一个settings.json文件即可,如下图:或者不用手动配置,点击左下角,可以选择运行环境。

2020-11-04 08:44:43 173

原创 python global用法

在函数内部用global声明一个外部的变量,就可以在函数内使用这个变量;如果在外部将变量声明为global,函数内部还是不能用的。参考:https://blog.csdn.net/weixin_40894921/article/details/88528159

2020-10-26 15:52:56 205

原创 NLP中的words

简单记录一下对于words表示的几种模型,以后有更深、详细的理解再补充。1.词袋模型(BOW)2.朴素贝叶斯(Naive Bayes)也是将句子出现的条件概率处理为词袋模型。3.N-gram考虑words与words之间的顺序,认为一个words出现的概率与前N个words有关。可以看到前三种方法都是基于统计、频率的。4.word2vec...

2020-10-07 18:41:29 167

原创 各种编码方式的记录

1.Ascii编码共有128个,由一个字节存储,0-31前32种状态分配给了一些特殊用途,比如终端设备、打印机等等,32-127分配了键盘上可见的字符。后来计算机传到了其它一些国家,其它国家不仅使用英文,又增加了一些字符,128-255的称为扩展字符集。2.gbk编码计算机传到中国,为了编码汉字,提出用两个字节来表示一个字符。3.Unicode编码很多国家都有自己编码方式,国际组织进行了统一,提出了Unicode,可以包含所有字符。4.utf-8 utf-16...

2020-09-20 09:52:00 304

原创 PEP8编码规范

1.引入时,先引标准库(argparse),然后是第三方库(torch),然后是本地自定义的一些。三类之间以一行隔开。2.命名,类名首字母大写,函数名基本都小写以下划线分隔。3.空格的使用,缩进一般都是空格,然后逗号后的空格要注意加上、运算符左右、关键字后边比如if等等。4.类中两个函数之间一行空格,顶级函数与类之间两行空格,函数内部两个逻辑单元一行空格。...

2020-09-01 12:16:29 168

原创 记录一些python的内置函数用法

1.zip()将可迭代对象做为参数,可以2个可以多个,将对应位置的元素打包成一个个元组,返回一个可迭代对象。参数长度可以不同,会以最短为基准进行截断;然后返回的可迭代对象只能迭代一次,之后就成空了,**这是一个需要注意的点**。...

2020-08-28 11:45:14 87

原创 git基本使用

1.概述git一般与github配合使用,来保持本地与远程库的同步。多人合作的话,首先从master上fork来自己的分支,在自己分支上进行开发、push(此时主分支看不到自己分支的变化),开发完成,再向主分支发出pull request,等待merge。2.git clone将远程库下载到本地: git clone 地址这样再修改就会有版本记录,直接下载不行。3.保持同步1.将要提交文件添加进来 git add 文件名(添加指定的文件,要在文件的目录之下) git add .(将

2020-08-27 12:45:09 93

原创 conda pip更新包的命令

1.condaconda update name2.pippip install --upgrade name

2020-08-25 20:06:21 1395

原创 pandas处理数据操作总结

对pandas封装的函数很不熟悉,在这里记录一下。1.groupby()基本格式:DataFrame[‘数据处理序列’].groupby(键值).操作()。它的返回类型是一个dataframe,它的索引就是groupby的键值。如果没有后面的操作返回的就是一个<pandas.core.groupby.groupby.SeriesGroupBy object at 0x000000EA33F9B438>或者<pandas.core.groupby.groupby.DataFrameGr

2020-07-26 22:24:52 604

原创 毕设笔记---word格式、技巧篇

1.参考文献格式然后选择“定义新的多级列表”这样回车就可以自动生成序号了,且文献换行也会对齐。然后在文章引用出可以使用 “插入”——>“交叉引用”里可以选择文献,自动在光标处生成所选文献序号。2.公式对齐利用插入1x2的表格来完成,先用一个公式做出模板后边都可以直接复制使用。要注意的是段落的行距不能设置为固定值。...

2020-05-18 17:43:26 170

原创 论文分类

国内期刊大约12000余本,核心期刊分为三大类。第一类:中国科学引文数据库(CSCD),分为核心库和扩展库,期刊来源大概1100多种。第二类:文社会科学引文索引(CSSCI即南大核心),大概500多种学术期刊。第三类:文核心期刊(北大中文)。国家级期刊与省级期刊并无明文规定。国际上,SCI:理工科科学引文索引,SSCI:社会科学引文索引,AHCI:艺术人文引文索引。到了我国,SSCI变成...

2019-11-03 16:26:27 212

原创 git命令(win)

$ mkdir learngit:在当前目录下创建一个文件夹$ cd learngit:然后进入这个文件夹中$ git init:将这个文件夹变成git可以管理的仓库$ pwd:显示当前所在的目录然后将你写的文件放在git仓库文件夹下,使用$ git add readme.txt就将文件加入stage(暂存区)中,然后$ git commit -m “wrote a readme file...

2019-11-03 16:11:36 82

原创 Numpy中的基本概念及操作

每个数组都有一个shape和dtype,shape表示维度的大小(data.shape),dtype表示数组的数据类型(data.dtype)。创建数组的一些函数,np.arrange():python range函数的数组版;np.zeros(),np.ones():创建全0、全1的数组, 括号内为维度np.array(),将列表、元组或其他序列对象转化为ndarray。数组中数据类型的...

2019-11-03 16:11:13 229

转载 jupyter中添加conda环境

安装完Anaconda利用conda创建了虚拟环境,但是启动jupyter notebook之后却找不到虚拟环境。实际上是由于在虚拟环境下缺少kernel.json文件,解决方法如下:首先安装ipykernel:conda install ipykernel在虚拟环境下创建kernel文件:conda install -n 环境名称 ipykernel激活conda环境: source a...

2019-10-16 15:13:58 337

原创 cnn

前溃神经网络,采用反向传播算法优化网络结构。一般情况下,CNN的结构形式是:输入层–> Conv层 --> Pooling层 --> (重复Conv、Pooling层) … --> FC(Full-connected)层 --> 输出结果。通常输入层大小一般为2的整数倍,如32,64,96,224,384等。通常卷积层使用较小的filter,如33,最大也就55。P...

2019-04-01 21:46:01 133

转载 c++的输入方式

https://blog.csdn.net/livecoldsun/article/details/25489429对以上博客的精华总结:输入原理简述:程序的输入都建有一个缓冲区,即输入缓冲区。每次输入过程是这样的,当一次键盘输入结束时会将输入的数据存入输入缓冲区,而cin函数直接从输入缓冲区中取数据。正因为cin函数是直接从缓冲区取数据的,所以有时候当缓冲区中有残留数据时,cin函数会直接...

2019-04-01 12:12:35 167

转载 c++引用mark

https://www.cnblogs.com/duwenxing/p/7421100.html

2019-03-31 20:08:52 509

原创 mark linux

记录一下今天学到的命令anaconda:conda list:查询该环境下已安装的包conda env list: 查看自己以建立的环境source activate name: 进入name环境中source deactivate: 从当前环境中退出conda install ***: 安装包ctrl+d: 退出python环境...

2019-03-28 23:33:31 121

原创 蓝桥杯 历届试题 地宫取宝

第一次见到记忆化dfs,感觉有点像动态规划的思想,已经计算过的不再重复计算参考:http://www.mamicode.com/info-detail-535827.html问题描述  X 国王有一个地宫宝库。是 n x m 个格子的矩阵。每个格子放一件宝贝。每个宝贝贴着价值标签。地宫的入口在左上角,出口在右下角。小明被带到地宫的入口,国王要求他只能向右或向下行走。走过某个格子时,如果...

2019-03-17 11:30:44 334

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除