cyllalala123-CSDN博客

原创新手也能做的数据建模：基于国产工业软件DTEmpower的三次产业分析

DTEmpower萌新入门案例教学

2024-12-23 15:20:52 543

原创数据结构与算法-图的一些定义和术语

本文为根据b站小甲鱼数据结构与算法的笔记，仅供笔记和加强记忆使用。我知道先讲图可能有点跳跃，但这个主要是笔者的复习需要先用到图而不是树，所以先讲图了（由于图的很多东西要用图片表示，所以截图会有点多）。图在线性表中，每个元素之间只有一个直接前驱和一个直接后继，在树形结构中，数据元素之间是层次关系，并且每一层上的数据元素可能和下一层多个元素相关，但只能和上一层中一个元素相关。但这都是只限于一对一，一对多的简单模型，更为复杂的情况，我们就必须要了解图了。图的定义图（Graph）是由顶点的有穷非空集合和

2022-03-30 15:44:58 222

原创数据结构与算法-队列

本文为根据b站小甲鱼数据结构与算法视频做所笔记，供加强记忆和复习使用。队列：队列（queue是只允许在一端进行插入操作，而在另一端进行删除操作的线性表）与栈相反，队列是一种先进先出的线性表，与栈相同的是，队列也是一种重要的线性结构，实现一个队列同样需要顺序表或者链表作为基础。队列的应用：输入缓冲区接受键盘的输入就是按队列的形式输入和输出的。队列的链式存储结构：队列既可以用链表实现，也可以用顺序表实现，但栈一般用顺序表而队列常用链表，简称为链队列。代码：typedef struct QNod

2022-03-28 16:34:48 831

原创数据结构与算法-栈和队列（2）栈的链式存储结构和逆波兰计算器例题

（本文为根据b站小甲鱼的数据结构与算法视频所做笔记，供加强记忆和复习使用。）栈的链式存储结构简称栈链，栈因为只是栈顶来做插入和删除操作，所以较好的方法就是将栈顶放在单链表的头部，栈顶指针和单链表的头指针合体。结构代码：typedef struct StackNode{ ElemType data; struct StackNode *next;} StackNode, *LinkStackPtr;typedef struct LinkStack{ LinkStackPtr top;

2022-03-28 14:22:58 1242

原创数据结构与算法-栈和队列（1）栈的顺序存储结构

（本文是根据b站小甲鱼的数据结构与算法视频所写的笔记，供复习和加强记忆使用）栈栈是一种重要的线性结构，可以说，栈是线性表的一种具体表现形式，这是一种后进先出的数据结构，其应用也很广泛，例如我们的浏览器每一次后退都是回到最近的一次浏览网页。官方定义栈是一个后进先出的线性表，它要求只在表尾进行删除和插入操作。（感觉小甲鱼定义差不多捏。）注释：表尾称为栈的栈顶，相应的表头称为栈底。栈的插入操作（Push）,叫做进栈，也成为压栈，入栈。栈的删除操作（Pop），叫做出栈，也称弹栈。栈的顺序存储结构

2022-03-27 17:50:36 956

原创数据结构与算法（3）——静态链表

（本文是根据b站小甲鱼的数据结构与算法视频所作笔记，供复习和加强记忆使用）静态链表用数组描述的链表叫做静态链表，这种描述方法叫做游标实现法静态链表存储结构：#define MAXSIZE 1000typedef struct{ ElemType data; //数据 int cur; //游标（Cursor）} Component，StaticLinkList[MAXSIZE];这里会发现游标的数字很奇怪，这是因为在静态链表里，数组下标为0的地方是不存储数据的，而最后一个，也就是M

2022-03-25 17:48:38 1669

原创数据结构与算法（2）——链式线性表

线性表的链式存储结构顺序存储结构在插入和删除时需要移动大量元素耗费时间，这是由于相邻元素存储位置具有邻居关系，内存中位置是紧挨着的，中间没有空隙就无法快速插入和删除。链式存储结构定义：用一组任意的存储单元存储线性表的数据元素，这组存储单元可以存在内存中未被占用的任意位置。相比于顺序存储结构链式存储结构中除了要存储数据元素信息外，还要存储它的后继元素的存储地址（指针）。我们把存储数据元素信息的域称为数据域，把存储直接后继位置的域称为指针域。指针域中存储的信息称为指针或链。这两部分信息组成数据元素称为

2022-03-24 18:00:06 776

原创数据结构与算法（1）——线性表与顺序存储结构

（本文是对于鱼c-小甲鱼的数据结构和算法的b站视频的笔记，目的是便于复习和加强记忆）首先我们要说的肯定是线性表到底是个什么东西线性表定义：数学语言进行定义，线性表相似于（a,…,an-1,an,an+1…afinal）的结构，我们称an-1为an的前驱元素，an+1为an的后继元素。注意的是，对于一个线性表，它要满足：“第一个元素无前驱，最后一个元素无后继，其他元素有且只有一个前驱和后继”而线性表元素个数即为线性表的长度，如果线性表有n个元素，则其长度就为n，当n为0的时候，我们称其为空表。抽象

2022-03-24 16:24:30 888

原创 2012美国大选献金项目数据分析

今天要讲的是2012美国大选献金项目数据分析的数据分析项目，这是一个比较综合的项目，要运用前面说的许多知识来解决问题。具体要求如下：首先还是老样子先导入必需的库和数据。（这里为了方便操作就先将月份和参选人以及所在政党进行定义，不要忘了定义哦）然后就可以将数据读取并转换为DataFrame了首先我们要先提取所需要的数据，将其他不需要的数据舍去。这步比较简单，只需要将你要选取的列的索引都放入同一个DataFrame就可以了。然后是用info函数查看新数据是否有缺少的数据可以看见总共应该有

2021-02-25 21:52:10 219

原创人口分析案例

今天是用人口分析作为案例项目，进行数据分析的综合运用。这是我们今天的目标。首先还是老样子导入库然后我们导入所需要的数据，使用read就行了。然后则是使用merge将几个表合并，我们先将州的缩写表与人口表进行合并，可以发现在州的缩写上即使索引有所不同但内容是一样的，这个时候就可以使用merge的left 与right进行合并然后使用drop将重复的缩写进行删除。之后我们要查看是哪里缺少了数据，这在项目中是十分常见的，这里有两种方法：这里使用info（）可以发现行数中应该是2544

2021-01-27 23:12:16 968 1

原创 pandas高级操作2

这次是接着上次的高级操作进行讲解，主要是来介绍高级数据聚合，透视表和交叉表高级数据聚合使用groupby分组后，也可以使用transform和apply提供自定义函数实现更多的运算df.groupby('item')['price'].sum() <==> df.groupby('item')['price'].apply(sum)transform和apply都会进行运算，在transform或者apply中传入函数即可transform和apply也可以传入一个lambda表达式

2021-01-21 16:28:33 266 2

原创 pandas的高级操作

今天说的是pandas的高级操作，包括替换操作，映射操作，随机抽样和分类处理。替换操作替换操作可以同步作用于Series和DataFrame中单值替换：普通替换：替换所有符合要求的元素:to_replace=15,value='e' 按列指定单值替换： to_replace={列标签：替换值} value='value'多值替换：列表替换: to_replace=[] value=[] 字典替换（推荐） to_replace={to_replace:value,to_replace:

2021-01-19 17:07:07 393

原创 pandas之DataFrame的级联、合并操作

今天讲的是pandas之DataFrame的级联、合并操作。1、级联操作（就是将多个DataFrame进行横向或者纵向的拼接）： pd.concat() pd.append()pandas使用pd.concat函数，这个与np.concatenate函数类似，只是多了一些参数： objs axis=0 keys join='outer'/'inner'：这个参数表示的是级联的方式，outer会将所有的项进行级联（忽略匹配和不匹配），而inner只会将匹配到的项级联到一起，不匹配的项不级联，

2021-01-14 16:20:28 1687

原创数据分析——股票双均线策略分析

在数据分析中，对于股票双均线策略分析是其中一个应用，这对于短期投资来说是非常有用的（虽然咱们不推荐）。什么是均线？对于每一个交易日，都可以计算出前N天的移动平均值，然后把这些移动平均值连起来，成为一条线，就叫做N日移动平均线。移动平均线常用线有5天， 10天， 30天， 60天， 120天和240天的指标。5天和10天的是短线操作的参照指标，称作日均线指标；30天和60天的是中期均线指标，称作季均线指标；120天和240天的是长期均线指标，称作年均线指标。均线计算方法： MA= （C1+C2+

2021-01-07 17:40:14 2054 1

原创数据清洗

在数据分析的过程中，原始数据可能在采集的过程中会出现空值或者重复值又或是异常值，为了避免对结果产生影响，我们会对这些数据进行清理。数据清洗主要做这样三件事： 1.处理缺失值 2.处理重复值（一般指重复行数据） 3.处理异常值对于缺失值，我们一般会用近邻数据来补充，这个时候主要会用到 fillna（）这个函数，在DataFrame中用fillna() 取近邻值，我们一般这么写：df.fillna（method = '', axis = ），在其中的method中，如果要向前取值，则可以写 ffill（f

2021-01-07 16:42:50 291

原创数据分析和python的环境搭建（python3.8.5 和python3.9.1的双环境搭建）

数据分析和python的环境搭建（python3.8.5 和python3.9.1的双环境搭建）1.安装annaconda寻找annaconda官网之后在Products里寻找individual Edition之后选择自己想要的版本，我自己选择的是Windows 64 Bit 那个在安装的时候不要勾选把anaconda作为系统默认python因为你要搭建双环境，不要勾选添加到环境变量因为之后我们要手动添加。之后我们需要添加环境变量，右击此电脑选择属性，选择高级系统设置之后选择环境变量

2021-01-05 22:19:09 852 1