![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
笔记
文章平均质量分 66
卡鲁鼙欧!
这个作者很懒,什么都没留下…
展开
-
Python归并排序的程序详细拆分注释
归并排序一、归并排序的思想1.主要思路二、Python代码详解展示1.完整python代码2.程序拆分4.程序jupyter运行结果三、归并排序分析1.好的情况2.最坏的情况3.选择排序和冒泡排序、归并排序的次数比较四、总结1.sort方法2.python内置函数sorted一、归并排序的思想1.主要思路归并排序的思想是分而治之。通常我们会把还有N个元素的列表,拆分成每个都包含N/2个元素的子列表对俩个子列表递归调用并排序合并俩个已经排好序的子列表下图展示为归并排序的示意图即采用分而治原创 2021-04-20 20:05:38 · 288 阅读 · 0 评论 -
python“插入排序“和“希尔排序“
"插入排序"和"希尔排序"一、插入排序思路:在数列中选定一个数,分成俩组,然后用后边数的和前一组数依次对比,得到新的排序。代码引入二、希尔排序补充一、插入排序思路:在数列中选定一个数,分成俩组,然后用后边数的和前一组数依次对比,得到新的排序。代码引入def insertionSor(array): for i in range(1,len(array): j = i while j > 0 and array[j] < array[j-原创 2021-04-14 19:29:22 · 137 阅读 · 0 评论 -
递归的实现原理(栈)
栈 栈: 是只允许在一端进行插入或删除操作的线性表如果想要充分了解递归的调用过程,我们需要理解什么是栈:栈顶:线性表允许进行插入和删除的那一端栈底:固定的,不允许进行插进和删除的另一端空栈:不含有任何元素的空表栈的几种操作:(初始化栈,判断是否为空栈,进栈,出栈)递归的实现原理什么是递归递归边界:递归的出口递归假设:设想如何达到递归边界递归推到:将递归假设实现这里我将引入代码片段来说明:def f(x): if x < 0:原创 2021-04-09 19:52:44 · 836 阅读 · 0 评论 -
Datawhale 知识图谱组队学习 之 Task 4 and 5 用户输入->知识库的查询语句
Datawhale 知识图谱组队学习 之 Task 4 用户输入->知识库的查询语句目录一、引言所涉及的背景知识;代码和注释二、什么是问答系统?用来回答人提出的自然语言问题的系统2.1 问答系统简介2.2 Query理解2.2.1 Query理解介绍Query即询问词法;句法;语义;2.2.2 意图识别介绍:意图识别是用来检测用户当前输入的意图2.2.3 槽值填充绍:槽值填充就是根据我们既定的一些结构化字段,将用户输入的信息中与其对应的部分提取出来。因此,槽原创 2021-01-15 21:43:28 · 129 阅读 · 0 评论 -
Datawhale 知识图谱组队学习 之 Task 3 Neo4j图数据库导入数据
Datawhale 知识图谱组队学习 之 Task 3 Neo4j图数据库导入数据目录一、引言图形作为一种特定的数据结构,用于表达数据之间的复杂关系,可以理解为你周边人际关系网络;二、Neo4j简介2.1 基本概念eo4j使用图相关的概念来描述数据模型,即结点和边,外加属性。2.2 索引neo4j的索引机制,就是为了快速定位起始节点2.3 Neo4j的优势Neo4j:查询的高性设计的灵活性开发的敏捷性等2.4 环境部署2.4.1 运行环境https://editor.cs原创 2021-01-13 20:22:44 · 196 阅读 · 0 评论 -
Datawhale 知识图谱组队学习 之 Task 2 基于医疗知识图谱的问答系统操作介绍
Datawhale 知识图谱组队学习 之 Task 2 基于医疗知识图谱的问答系统操作介绍目录一、引言二、运行环境1.导入数据三、搭建知识图谱四、启动问答测试目录一、引言二、运行环境python3.0及以上neo4j 4.2.2Jdk15.0.11.导入数据运行 以下命令:python build_graph.py 载入本地neo4j库大约2个小时三、搭建知识图谱**运行介绍之后,打开浏览器进入网址:链接: http://localhost:7474/.以看到我们导入的数据的原创 2021-01-13 00:21:24 · 113 阅读 · 0 评论 -
Datawhale 知识图谱组队学习 之 Task 1 知识图谱介绍
一、知识图谱简介1.1 引言知识图谱用于机器聊天,大数据风控,医疗和证券投资等等,越来越多的领域在应用知识图谱。1.2 什么是知识图谱呢?知识图谱可以理解为一种关系图,就像家族网络一般互相链接延展,抽象上说:“知识图谱就是语义网络的知识库”1.2.1 什么是图(Graph)呢?**图由节点(note)和边(edge)构成,如果你是理工科毕业,可以理解为电路中的节点和边: Note(节点)表示:人,地名,概念,药物,公司等等。原创 2021-01-11 22:29:51 · 868 阅读 · 0 评论 -
Pandas 文本数据
Ex1:房屋信息数据集现有一份房屋信息数据集如下:将year列改为整数年份存储。将floor列替换为Level, Highest两列,其中的元素分别为string类型的层类别(高层、中层、低层)与整数类型的最高层数计算房屋每平米的均价avg_price,以***元/平米的格式存储到表中,其中***为整数。小结:str对象的设计意图str对象是定义在Index或Series上的属性,专门用于逐元素处理文本内容,其内部定义了大量方法,因此对一个序列进行文本处理,首先需要获取其str对象原创 2021-01-06 19:55:39 · 107 阅读 · 0 评论 -
pandas综合练习
【任务一】企业收入的多样性【题目描述】一个企业的产业收入多样性可以仿照信息熵的概念来定义收入熵指标 :其中 p(xi)是企业该年某产业收入额占该年所有产业总收入的比重。在company.csv中存有需要计算的企业和年份 , 在company_data.csv中存有企业、各类收入额和收入年份的信息。现请利用后一张表中的数据 , 在前一张表中增加一列表示该公司该年份的收入熵指标I。【任务二】组队学习信息表的变换【题目描述】请把组队学习的队伍信息表变换为如下形态,其中’是否队长’一列取1表示队长原创 2021-01-01 22:49:51 · 262 阅读 · 1 评论 -
Pandas连接
美国疫情数据集现有美国4月12日至11月16日的疫情报表,请将New York的Confirmed, Deaths, Recovered, Active合并为一张表,索引为按如下方法生成的日期字符串序列:找到4月12日的报表数据:设置索引调出4月12日的的New York的Confirmed, Deaths, Recovered, Active以日期为主的字符串索引列表Ex2:实现join函数请实现带有how参数的join函数假设连接的两表无公共列调用方式为 join(df1, d原创 2020-12-29 19:42:26 · 3018 阅读 · 0 评论 -
Pandas的分组练习
练习一,汽车数据集现有一份汽车数据集,其中Brand, Disp., HP分别代表汽车品牌、发动机蓄量、发动机输出。1.先过滤出所属Country数超过2个的汽车,即若该汽车的Country在总体数据集中出现次数不超过2则剔除,再按Country分组计算价格均值、价格变异系数、该Country的汽车数量,其中变异系数的计算方法是标准差除以均值,并在结果中把变异系数重命名为CoV:中途换用Jupyternotebook,比pytorch简洁,易直观。2.按照表中位置的前三分之一、中间三分之一和后三原创 2020-12-25 18:26:05 · 777 阅读 · 0 评论 -
pandas基础和部分练习
import numpy as np#导入nupmy库并记为npimport pandas as pd#导入pandas 库并记为pdprint(np._ version_,)np._ show_config()#原创 2020-12-17 16:28:01 · 146 阅读 · 0 评论 -
Pandas基础认知和介绍
**感言**还有一个月就到2021年了,Pandas已经成长为一个非常大的库,也不像当初那样简洁和易用了。在代码中看到pd.,八九不离十就是Pandas了,关于Pandas有俩个重要的数据结构,这里申明是重要的:1.Series2.DateFrame关于Sries可以暂时认为是一维数组,通过一些数据后就可以产生最简单的Series特性:Series的字符串变现形式为:“索引”在左...原创 2020-12-16 21:38:02 · 100 阅读 · 0 评论 -
Task00 Pandas安装指令和初识
Pandas 是python的一个数据分析包,该工具是为了解决数据分析任务而创建的!“七星联盟的小伙伴”,直接使用“pip install pandas”直接安装第三方库就可以了原创 2020-12-13 18:09:36 · 108 阅读 · 0 评论 -
Numpy大作业
鸢尾属植物数据集.\iris.data,在这个数据集中,包括了三类不同的鸢尾属植物:Iris Setosa,Iris Versicolour,Iris Virginica。每类收集了50个样本,因此这个数据集一共包含了150个样本。sepallength:萼片长度sepalwidth:萼片宽度petallength:花瓣长度petalwidth:花瓣宽度#1.导入鸢尾属植物数据集,保持文本不变import numpy as npoutfile = r'.\iris.data'iris_dat原创 2020-12-01 20:57:17 · 208 阅读 · 0 评论 -
Task09线性代数(欧式距离)
练习题计算数组之间的欧式距离,需要掌握函数和线性代数的的相关知识。方法1方法2**上述程序中norm表示范数,linalg为liner线性和algbra代数原创 2020-11-29 18:34:59 · 190 阅读 · 0 评论 -
Numpy统计计算
计算最小值numpy.amin(a[, axis=None, out=None, keepdims=np._NoValue, initial=np._NoValue, where=np._NoValue]),即返回数组的最小值或沿轴的最小值我们发现当,axis= 0和 axis=1时,是沿着轴进行操作。计算最大值numpy.amax(a[, axis=None, out=None, keepdims=np._NoValue, initial=np._NoValue, where=np._NoVal原创 2020-11-27 22:24:28 · 1116 阅读 · 1 评论 -
Task2 Numpy随机抽样
这里写目录标题随机的二位为数组的创建?(知识点:随机抽样)关于Numpy随机抽样的定义三级目录二项分布泊松分布超几何分布均匀分布正态分布指数分布随机的二位为数组的创建?(知识点:随机抽样)假设我们要创建一个5X2的二维数组,包含5到9之间的随机数 ,即随机抽样!如何创建这样的的二维数组呢,我们以下列程序进行展现:列1得到一组数据,我们反复运行时,又会得到另一组随机抽样的数据,大家有兴趣的花可以试试看。关于Numpy随机抽样的定义* numpy.random 模块对 Python 内置的 r原创 2020-11-25 22:09:34 · 226 阅读 · 0 评论 -
编程实践(Numpy)下
编程实践(Numpy)下Task01:输入输出npy格式npz格式numpy.save(file, arr, allow_pickle=True, fix_imports=True)numpy.load(file, mmap_mode=None, allow_pickle=False, fix_imports=True, encoding='ASCII')将多个数组保存到一个文件,可以使用numpy.savez()函数。文本格式选项文本文件Task01:输入输出save()、savez()和load()原创 2020-11-23 22:12:52 · 364 阅读 · 0 评论 -
机器学习2-决策树的构建要点
决策树优点:计算复杂度不高,输出结果易于理解,中间值的缺失对其影响较小,可以处理无关联的“特征数据”。缺点;容易产生过度匹配。适用数据类型:数值型和标称型。构建决策树的注意点找到决定性特征(数据集的某个特征在划分数据分类时起确定作用,我们必须找到这个特征)评估每个特征(为了找到决定性特征,划分出最佳结果)一般设想思路测试结束后,原始数据被划分为几个“数据子集”几个“数据子集”在第一个决策点的所有分支上。这是如果有某个分支下的数据属于同一类型,则这些数据已经已经被正确的划分数据类型。相原创 2020-08-24 00:11:44 · 221 阅读 · 0 评论