![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
笔记
EmithFla
湖大研究生在读
展开
-
关于神经网络一些容易被忽略的问题
一些关于神经网络的学习心得、笔记原创 2022-06-02 11:07:44 · 251 阅读 · 0 评论 -
不同类型变量的数据预处理
所有变量可以分为两种:一、类型变量。例如:天气情况可以从1-4中取值,可以用1表示晴天,2表示多云,3表示雨天,4可以表示雪天,诸如此类,我们统称为类型变量,这里需要注意一点是,这些数字大小并没有实际的意义,如4比1大,但不代表雪天就会比晴天更好。二、数值变量。例如:分数,温度等,这些可以从一个数值区间中连续取值的变量我梦统称为数值变量。通过以上我们发现,不同类型变量的数值含义也不同,因此,在进行研究前我们需要对其进行预处理。数据预处理:类型变量→独热编码(one-hot)将类型变量原创 2022-03-24 13:59:02 · 1134 阅读 · 0 评论 -
基于PDF的词云图
最近在疯狂找研究方向相关的paper,不想花太多时间去看但又想知道这篇文章paper主要内容是什么,用到了哪些关键的方法,对我是否有帮助,于是想到了词云。“词云”就是对文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使用户只要一眼扫过文本就可以领略文本的主旨。网上搜了一下,很少有基于PDF生成词云的代码,于是参考了一些博客,自己动手实现基于PDF的词云图,顺带网站爬虫生成词云图,源代码如下(如果对你有用记得一键三连 ):import r原创 2021-11-12 15:49:34 · 1829 阅读 · 0 评论 -
怎样更加简洁的解决小明种苹果(续)(ccf201909-2)
这道题需要我们解决三个小问题:1、输出全部操作结束后,所有苹果树上苹果剩余的个数;2、发生苹果掉落的苹果个数;3、相邻三颗苹果树发生苹果掉落情况的组数最有意思的是第3个小问,按照我的理解,这些苹果树是一列的,只需要把每颗苹果树是否掉落苹果的状态存入列表中,再统计出列表中连续出现三个1的次数即可。但题目中的这N颗苹果树排成了一个圆,这里的相邻,需要考虑列表的头和尾。总结一下大家的做法,大致有三种:①当超过三棵树时通过对列表索引求余解决②再一个是把列表的前两个元素添加到列表的末尾解决③最后原创 2021-04-04 12:58:17 · 359 阅读 · 1 评论 -
Pandas数据处理(一)
Pandas 是非常著名的开源数据处理库,我们可以通过它完成对数据集进行快速读取、转换、过滤、分析等一系列操作。除此之外,Pandas 拥有强大的缺失数据处理与数据透视功能,可谓是数据预处理中的必备利器。特有的数据结构是 Pandas 的优势和核心。我们可以将任意格式的数据转换为 Pandas 的数据类型,并使用 Pandas 提供的一系列方法进行转换、操作,最终得到我们期望的结果。数据读取df = pd.read_csv("文件名.csv")dfPandas 提供了 head() 和 ta.原创 2020-09-07 12:50:42 · 1350 阅读 · 0 评论 -
解决apt下载超时问题
解决apt下载超时问题方法一:直接在命令行后加 -i http://pypi.douban.com/simple/这里列出了多种镜像源以供选择:(1)阿里云 http://mirrors.aliyun.com/pypi/simple/(2)豆瓣http://pypi.douban.com/simple/(3)清华大学 https://pypi.tuna.tsinghua.edu.cn/...原创 2020-03-06 14:34:08 · 2787 阅读 · 0 评论