卡鲁鼙欧！-CSDN博客

归并排序一、归并排序的思想1.主要思路二、Python代码详解展示1.完整python代码2.程序拆分4.程序jupyter运行结果三、归并排序分析1.好的情况2.最坏的情况3.选择排序和冒泡排序、归并排序的次数比较四、总结1.sort方法2.python内置函数sorted一、归并排序的思想1.主要思路归并排序的思想是分而治之。通常我们会把还有N个元素的列表，拆分成每个都包含N/2个元素的子列表对俩个子列表递归调用并排序合并俩个已经排好序的子列表下图展示为归并排序的示意图即采用分而治

2021-04-20 20:05:38 300

原创 python“插入排序“和“希尔排序“

"插入排序"和"希尔排序"一、插入排序思路：在数列中选定一个数，分成俩组，然后用后边数的和前一组数依次对比，得到新的排序。代码引入二、希尔排序补充一、插入排序思路：在数列中选定一个数，分成俩组，然后用后边数的和前一组数依次对比，得到新的排序。代码引入def insertionSor(array): for i in range(1,len(array): j = i while j > 0 and array[j] < array[j-

2021-04-14 19:29:22 141

原创递归的实现原理(栈）

栈栈：是只允许在一端进行插入或删除操作的线性表如果想要充分了解递归的调用过程，我们需要理解什么是栈：栈顶：线性表允许进行插入和删除的那一端栈底：固定的，不允许进行插进和删除的另一端空栈：不含有任何元素的空表栈的几种操作：(初始化栈，判断是否为空栈，进栈，出栈)递归的实现原理什么是递归递归边界：递归的出口递归假设：设想如何达到递归边界递归推到：将递归假设实现这里我将引入代码片段来说明：def f(x): if x < 0:

2021-04-09 19:52:44 847

原创 Datawhale 知识图谱组队学习之 Task 4 and 5 用户输入-＞知识库的查询语句

Datawhale 知识图谱组队学习之 Task 4 用户输入->知识库的查询语句目录一、引言所涉及的背景知识;代码和注释二、什么是问答系统？用来回答人提出的自然语言问题的系统2.1 问答系统简介2.2 Query理解2.2.1 Query理解介绍Query即询问词法；句法；语义；2.2.2 意图识别介绍：意图识别是用来检测用户当前输入的意图2.2.3 槽值填充绍：槽值填充就是根据我们既定的一些结构化字段，将用户输入的信息中与其对应的部分提取出来。因此，槽

2021-01-15 21:43:28 136

原创 ask Special & Task 11 综合练习（2020.12）

显卡日志【数据下载】链接：链接: https://pan.baidu.com/s/1CjfdtavEywHtZeWSmCGv3A.密码：：4mui下面给出了3090显卡的性能测评日志结果，每一条日志有如下结构：Benchmarking #2# #4# precision type #1##1# model average #2# time : #3# ms其中#1#代表的是模型名称，#2#的值为train(ing)或inference，表示训练状态或推断状态，#3#表示耗时，#4#表示精度

2021-01-13 22:28:32 317

原创 Datawhale 知识图谱组队学习之 Task 3 Neo4j图数据库导入数据

Datawhale 知识图谱组队学习之 Task 3 Neo4j图数据库导入数据目录一、引言图形作为一种特定的数据结构，用于表达数据之间的复杂关系,可以理解为你周边人际关系网络；二、Neo4j简介2.1 基本概念eo4j使用图相关的概念来描述数据模型，即结点和边，外加属性。2.2 索引neo4j的索引机制，就是为了快速定位起始节点2.3 Neo4j的优势Neo4j：查询的高性设计的灵活性开发的敏捷性等2.4 环境部署2.4.1 运行环境https://editor.cs

2021-01-13 20:22:44 212

原创 Datawhale 知识图谱组队学习之 Task 2 基于医疗知识图谱的问答系统操作介绍

Datawhale 知识图谱组队学习之 Task 2 基于医疗知识图谱的问答系统操作介绍目录一、引言二、运行环境1.导入数据三、搭建知识图谱四、启动问答测试目录一、引言二、运行环境python3.0及以上neo4j 4.2.2Jdk15.0.11.导入数据运行以下命令：python build_graph.py 载入本地neo4j库大约2个小时三、搭建知识图谱**运行介绍之后，打开浏览器进入网址：链接: http://localhost:7474/.以看到我们导入的数据的

2021-01-13 00:21:24 120

原创 Datawhale 知识图谱组队学习之 Task 1 知识图谱介绍

一、知识图谱简介1.1 引言知识图谱用于机器聊天，大数据风控，医疗和证券投资等等，越来越多的领域在应用知识图谱。1.2 什么是知识图谱呢？知识图谱可以理解为一种关系图，就像家族网络一般互相链接延展，抽象上说：“知识图谱就是语义网络的知识库”1.2.1 什么是图（Graph）呢？**图由节点（note）和边（edge）构成，如果你是理工科毕业，可以理解为电路中的节点和边： Note（节点）表示：人，地名，概念，药物，公司等等。

2021-01-11 22:29:51 876

原创 Pandas 10 序数据

一、时序中的基本对象在pandas中称为Timestamp。同时，一系列的时间戳可以组成DatetimeIndex，而将它放到Series中后，Series的类型就变为了datetime64[ns]，如果有涉及时区则为datetime64[ns, tz]二、时间戳Timestamp的构造与属性单个时间戳的生成利用pd.Timestamp实现，一般而言的常见日期格式都能被成功地转换：Datetime序列的生成一组时间戳可以组成时间序列，可以用to_datetime和date_range来生

2021-01-10 21:48:11 185 1

原创第九章分类数据

第九章分类数据一所需要知识点crosstab 第一个参数是列，第二个参数是行；pd.corsstab(df.A, df.B)结构语法如下：pd.crosstab(index, columns, values=None,rownames=None, colnames=None, aggfunc=None, margins=False,margins_name: str = ‘All’, dropna: bool = True,normalize=False)2

2021-01-07 21:50:30 345

原创 Pandas 文本数据

Ex1：房屋信息数据集现有一份房屋信息数据集如下：将year列改为整数年份存储。将floor列替换为Level, Highest两列，其中的元素分别为string类型的层类别（高层、中层、低层）与整数类型的最高层数计算房屋每平米的均价avg_price，以***元/平米的格式存储到表中，其中***为整数。小结：str对象的设计意图str对象是定义在Index或Series上的属性，专门用于逐元素处理文本内容，其内部定义了大量方法，因此对一个序列进行文本处理，首先需要获取其str对象

2021-01-06 19:55:39 111

原创 Pandas缺失数据

**一、缺失值的统计和删除缺失信息的统计**数据处理中经常需要根据缺失值的大小、比例或其他特征来进行行样本或列特征的删除，pandas中提供了dropna函数来进行操作。dropna的主要参数为轴方向axis（默认为0，即删除行）、删除方式how、删除的非缺失值个数阈值thresh（非缺失值 \color{red}{非缺失值} 非缺失值没有达到这个数量的相应维度会被删除）、备选的删除子集subset，其中how主要有any和all两种参数可以选择。例如，删除身高体重至少有一个缺失的行：

2021-01-03 19:42:17 137

原创 pandas综合练习

【任务一】企业收入的多样性【题目描述】一个企业的产业收入多样性可以仿照信息熵的概念来定义收入熵指标 :其中 p(xi)是企业该年某产业收入额占该年所有产业总收入的比重。在company.csv中存有需要计算的企业和年份 , 在company_data.csv中存有企业、各类收入额和收入年份的信息。现请利用后一张表中的数据 , 在前一张表中增加一列表示该公司该年份的收入熵指标I。【任务二】组队学习信息表的变换【题目描述】请把组队学习的队伍信息表变换为如下形态，其中’是否队长’一列取1表示队长

2021-01-01 22:49:51 271 1

原创 Pandas连接

美国疫情数据集现有美国4月12日至11月16日的疫情报表，请将New York的Confirmed, Deaths, Recovered, Active合并为一张表，索引为按如下方法生成的日期字符串序列：找到4月12日的报表数据：设置索引调出4月12日的的New York的Confirmed, Deaths, Recovered, Active以日期为主的字符串索引列表Ex2：实现join函数请实现带有how参数的join函数假设连接的两表无公共列调用方式为 join(df1, d

2020-12-29 19:42:26 3036

原创 pandas Task 005

四、练习Ex1：美国非法药物数据集现有一份关于美国非法药物的数据集，其中SubstanceName, DrugReports分别指药物名称和报告数量：**3*…(未完成）***Ex2：特殊的wide_to_long方法从功能上看，melt方法应当属于wide_to_long的一种特殊情况，即stubnames只有一类。请使用wide_to_long生成melt一节中的df_melted。（提示：对列名增加适当的前缀）小结：pivot的使用依赖于唯一性条件，那如果不满足唯一性条

2020-12-27 21:33:00 148

原创 Pandas的分组练习

练习一，汽车数据集现有一份汽车数据集，其中Brand, Disp., HP分别代表汽车品牌、发动机蓄量、发动机输出。1.先过滤出所属Country数超过2个的汽车，即若该汽车的Country在总体数据集中出现次数不超过2则剔除，再按Country分组计算价格均值、价格变异系数、该Country的汽车数量，其中变异系数的计算方法是标准差除以均值，并在结果中把变异系数重命名为CoV:中途换用Jupyternotebook，比pytorch简洁，易直观。2.按照表中位置的前三分之一、中间三分之一和后三

2020-12-25 18:26:05 785

原创 Pandas索引

Pandas索引的基础知识自我补充可变序列与不可变序列:复制列表和指向索引器一．列索引注：其中 x为多种类型的不同代称，我在手机端编辑，这边没有数据集为了方便统一写成了 x列索引是最常见的索引方式，一般通过 [ ]来实现，通过 [列名] 可以从DataFrame中取出相应的列，返回值为Seriesdf.= pd.read_csv(“data数据存储在你电脑的位置”, usecols = [“School”,”Grade”,”Name”,”Gende”,”weight”,”Transter

2020-12-22 20:35:31 449

原创 pandas基础和部分练习

import numpy as np＃导入nupmy库并记为npimport pandas as pd＃导入pandas 库并记为pdprint（np._ version_,）np._ show_config（）＃

2020-12-17 16:28:01 158

原创 Pandas基础认知和介绍

**感言**还有一个月就到2021年了，Pandas已经成长为一个非常大的库，也不像当初那样简洁和易用了。在代码中看到pd.，八九不离十就是Pandas了，关于Pandas有俩个重要的数据结构，这里申明是重要的：1.Series2.DateFrame关于Sries可以暂时认为是一维数组，通过一些数据后就可以产生最简单的Series特性：Series的字符串变现形式为：“索引”在左...

2020-12-16 21:38:02 105

原创 Task00 Pandas安装指令和初识

Pandas 是python的一个数据分析包,该工具是为了解决数据分析任务而创建的!“七星联盟的小伙伴”，直接使用“pip install pandas”直接安装第三方库就可以了

2020-12-13 18:09:36 116

原创 Numpy大作业

鸢尾属植物数据集.\iris.data，在这个数据集中，包括了三类不同的鸢尾属植物：Iris Setosa，Iris Versicolour，Iris Virginica。每类收集了50个样本，因此这个数据集一共包含了150个样本。sepallength：萼片长度sepalwidth：萼片宽度petallength：花瓣长度petalwidth：花瓣宽度#1.导入鸢尾属植物数据集，保持文本不变import numpy as npoutfile = r'.\iris.data'iris_dat

2020-12-01 20:57:17 219

原创 Task09线性代数（欧式距离）

练习题计算数组之间的欧式距离，需要掌握函数和线性代数的的相关知识。方法1方法2**上述程序中norm表示范数，linalg为liner线性和algbra代数

2020-11-29 18:34:59 198

原创 Numpy统计计算

计算最小值numpy.amin(a[, axis=None, out=None, keepdims=np._NoValue, initial=np._NoValue, where=np._NoValue])，即返回数组的最小值或沿轴的最小值我们发现当，axis= 0和 axis=1时，是沿着轴进行操作。计算最大值numpy.amax(a[, axis=None, out=None, keepdims=np._NoValue, initial=np._NoValue, where=np._NoVal

2020-11-27 22:24:28 1132 1

原创 Task2 Numpy随机抽样

这里写目录标题随机的二位为数组的创建？（知识点：随机抽样）关于Numpy随机抽样的定义三级目录二项分布泊松分布超几何分布均匀分布正态分布指数分布随机的二位为数组的创建？（知识点：随机抽样）假设我们要创建一个5X2的二维数组，包含5到9之间的随机数，即随机抽样！如何创建这样的的二维数组呢，我们以下列程序进行展现：列1得到一组数据，我们反复运行时，又会得到另一组随机抽样的数据，大家有兴趣的花可以试试看。关于Numpy随机抽样的定义* numpy.random 模块对 Python 内置的 r

2020-11-25 22:09:34 230

原创编程实践（Numpy）下

编程实践（Numpy）下Task01：输入输出npy格式npz格式numpy.save(file, arr, allow_pickle=True, fix_imports=True)numpy.load(file, mmap_mode=None, allow_pickle=False, fix_imports=True, encoding='ASCII')将多个数组保存到一个文件，可以使用numpy.savez()函数。文本格式选项文本文件Task01：输入输出save()、savez()和load()

2020-11-23 22:12:52 400

jjwan123的博客

原创【无标题】

原创 swap创建分区

原创 Python归并排序的程序详细拆分注释