- 博客(20)
- 收藏
- 关注
原创 pandas分组聚合
首先,仅仅分组(groupby)不能产生dataframe对象,产生的是中间结果,在聚合之后,才产生dataframe对象。groupby的参数会成为索引,原来的列聚合后依旧保存。内置的聚合函数:sum(), mean(), max(), min(), count(), size(), describe()自定义聚合函数:df.groupby().agg(自定义函数),可以在外边定义好,也可以直接写个lambda。他们的参数是分组后索引对应的每列都会做为输入。上边两条应用的是单个函数,可以多个函数.
2020-12-01 16:38:58 388
原创 vscode相关配置
首先要先安装python插件。只需配置一个settings.json文件即可,如下图:或者不用手动配置,点击左下角,可以选择运行环境。
2020-11-04 08:44:43 183
原创 python global用法
在函数内部用global声明一个外部的变量,就可以在函数内使用这个变量;如果在外部将变量声明为global,函数内部还是不能用的。参考:https://blog.csdn.net/weixin_40894921/article/details/88528159
2020-10-26 15:52:56 224
原创 NLP中的words
简单记录一下对于words表示的几种模型,以后有更深、详细的理解再补充。1.词袋模型(BOW)2.朴素贝叶斯(Naive Bayes)也是将句子出现的条件概率处理为词袋模型。3.N-gram考虑words与words之间的顺序,认为一个words出现的概率与前N个words有关。可以看到前三种方法都是基于统计、频率的。4.word2vec...
2020-10-07 18:41:29 175
原创 各种编码方式的记录
1.Ascii编码共有128个,由一个字节存储,0-31前32种状态分配给了一些特殊用途,比如终端设备、打印机等等,32-127分配了键盘上可见的字符。后来计算机传到了其它一些国家,其它国家不仅使用英文,又增加了一些字符,128-255的称为扩展字符集。2.gbk编码计算机传到中国,为了编码汉字,提出用两个字节来表示一个字符。3.Unicode编码很多国家都有自己编码方式,国际组织进行了统一,提出了Unicode,可以包含所有字符。4.utf-8 utf-16...
2020-09-20 09:52:00 324
原创 PEP8编码规范
1.引入时,先引标准库(argparse),然后是第三方库(torch),然后是本地自定义的一些。三类之间以一行隔开。2.命名,类名首字母大写,函数名基本都小写以下划线分隔。3.空格的使用,缩进一般都是空格,然后逗号后的空格要注意加上、运算符左右、关键字后边比如if等等。4.类中两个函数之间一行空格,顶级函数与类之间两行空格,函数内部两个逻辑单元一行空格。...
2020-09-01 12:16:29 179
原创 记录一些python的内置函数用法
1.zip()将可迭代对象做为参数,可以2个可以多个,将对应位置的元素打包成一个个元组,返回一个可迭代对象。参数长度可以不同,会以最短为基准进行截断;然后返回的可迭代对象只能迭代一次,之后就成空了,**这是一个需要注意的点**。...
2020-08-28 11:45:14 93
原创 git基本使用
1.概述git一般与github配合使用,来保持本地与远程库的同步。多人合作的话,首先从master上fork来自己的分支,在自己分支上进行开发、push(此时主分支看不到自己分支的变化),开发完成,再向主分支发出pull request,等待merge。2.git clone将远程库下载到本地: git clone 地址这样再修改就会有版本记录,直接下载不行。3.保持同步1.将要提交文件添加进来 git add 文件名(添加指定的文件,要在文件的目录之下) git add .(将
2020-08-27 12:45:09 102
原创 pandas处理数据操作总结
对pandas封装的函数很不熟悉,在这里记录一下。1.groupby()基本格式:DataFrame[‘数据处理序列’].groupby(键值).操作()。它的返回类型是一个dataframe,它的索引就是groupby的键值。如果没有后面的操作返回的就是一个<pandas.core.groupby.groupby.SeriesGroupBy object at 0x000000EA33F9B438>或者<pandas.core.groupby.groupby.DataFrameGr
2020-07-26 22:24:52 624
原创 毕设笔记---word格式、技巧篇
1.参考文献格式然后选择“定义新的多级列表”这样回车就可以自动生成序号了,且文献换行也会对齐。然后在文章引用出可以使用 “插入”——>“交叉引用”里可以选择文献,自动在光标处生成所选文献序号。2.公式对齐利用插入1x2的表格来完成,先用一个公式做出模板后边都可以直接复制使用。要注意的是段落的行距不能设置为固定值。...
2020-05-18 17:43:26 185
原创 论文分类
国内期刊大约12000余本,核心期刊分为三大类。第一类:中国科学引文数据库(CSCD),分为核心库和扩展库,期刊来源大概1100多种。第二类:文社会科学引文索引(CSSCI即南大核心),大概500多种学术期刊。第三类:文核心期刊(北大中文)。国家级期刊与省级期刊并无明文规定。国际上,SCI:理工科科学引文索引,SSCI:社会科学引文索引,AHCI:艺术人文引文索引。到了我国,SSCI变成...
2019-11-03 16:26:27 226
原创 git命令(win)
$ mkdir learngit:在当前目录下创建一个文件夹$ cd learngit:然后进入这个文件夹中$ git init:将这个文件夹变成git可以管理的仓库$ pwd:显示当前所在的目录然后将你写的文件放在git仓库文件夹下,使用$ git add readme.txt就将文件加入stage(暂存区)中,然后$ git commit -m “wrote a readme file...
2019-11-03 16:11:36 97
原创 Numpy中的基本概念及操作
每个数组都有一个shape和dtype,shape表示维度的大小(data.shape),dtype表示数组的数据类型(data.dtype)。创建数组的一些函数,np.arrange():python range函数的数组版;np.zeros(),np.ones():创建全0、全1的数组, 括号内为维度np.array(),将列表、元组或其他序列对象转化为ndarray。数组中数据类型的...
2019-11-03 16:11:13 241
转载 jupyter中添加conda环境
安装完Anaconda利用conda创建了虚拟环境,但是启动jupyter notebook之后却找不到虚拟环境。实际上是由于在虚拟环境下缺少kernel.json文件,解决方法如下:首先安装ipykernel:conda install ipykernel在虚拟环境下创建kernel文件:conda install -n 环境名称 ipykernel激活conda环境: source a...
2019-10-16 15:13:58 354
原创 cnn
前溃神经网络,采用反向传播算法优化网络结构。一般情况下,CNN的结构形式是:输入层–> Conv层 --> Pooling层 --> (重复Conv、Pooling层) … --> FC(Full-connected)层 --> 输出结果。通常输入层大小一般为2的整数倍,如32,64,96,224,384等。通常卷积层使用较小的filter,如33,最大也就55。P...
2019-04-01 21:46:01 138
转载 c++的输入方式
https://blog.csdn.net/livecoldsun/article/details/25489429对以上博客的精华总结:输入原理简述:程序的输入都建有一个缓冲区,即输入缓冲区。每次输入过程是这样的,当一次键盘输入结束时会将输入的数据存入输入缓冲区,而cin函数直接从输入缓冲区中取数据。正因为cin函数是直接从缓冲区取数据的,所以有时候当缓冲区中有残留数据时,cin函数会直接...
2019-04-01 12:12:35 177
原创 mark linux
记录一下今天学到的命令anaconda:conda list:查询该环境下已安装的包conda env list: 查看自己以建立的环境source activate name: 进入name环境中source deactivate: 从当前环境中退出conda install ***: 安装包ctrl+d: 退出python环境...
2019-03-28 23:33:31 128
原创 蓝桥杯 历届试题 地宫取宝
第一次见到记忆化dfs,感觉有点像动态规划的思想,已经计算过的不再重复计算参考:http://www.mamicode.com/info-detail-535827.html问题描述 X 国王有一个地宫宝库。是 n x m 个格子的矩阵。每个格子放一件宝贝。每个宝贝贴着价值标签。地宫的入口在左上角,出口在右下角。小明被带到地宫的入口,国王要求他只能向右或向下行走。走过某个格子时,如果...
2019-03-17 11:30:44 345
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人