自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

原创 【无标题】

笔记

2022-12-19 16:51:40 99 1

原创 swap创建分区

123

2022-12-13 11:00:44 494

原创 Python归并排序的程序详细拆分注释

归并排序一、归并排序的思想1.主要思路二、Python代码详解展示1.完整python代码2.程序拆分4.程序jupyter运行结果三、归并排序分析1.好的情况2.最坏的情况3.选择排序和冒泡排序、归并排序的次数比较四、总结1.sort方法2.python内置函数sorted一、归并排序的思想1.主要思路归并排序的思想是分而治之。通常我们会把还有N个元素的列表,拆分成每个都包含N/2个元素的子列表对俩个子列表递归调用并排序合并俩个已经排好序的子列表下图展示为归并排序的示意图即采用分而治

2021-04-20 20:05:38 287

原创 python“插入排序“和“希尔排序“

"插入排序"和"希尔排序"一、插入排序思路:在数列中选定一个数,分成俩组,然后用后边数的和前一组数依次对比,得到新的排序。代码引入二、希尔排序补充一、插入排序思路:在数列中选定一个数,分成俩组,然后用后边数的和前一组数依次对比,得到新的排序。代码引入def insertionSor(array): for i in range(1,len(array): j = i while j > 0 and array[j] < array[j-

2021-04-14 19:29:22 135

原创 递归的实现原理(栈)

栈 栈: 是只允许在一端进行插入或删除操作的线性表如果想要充分了解递归的调用过程,我们需要理解什么是栈:栈顶:线性表允许进行插入和删除的那一端栈底:固定的,不允许进行插进和删除的另一端空栈:不含有任何元素的空表栈的几种操作:(初始化栈,判断是否为空栈,进栈,出栈)递归的实现原理什么是递归递归边界:递归的出口递归假设:设想如何达到递归边界递归推到:将递归假设实现这里我将引入代码片段来说明:def f(x): if x < 0:

2021-04-09 19:52:44 829

原创 Datawhale 知识图谱组队学习 之 Task 4 and 5 用户输入->知识库的查询语句

Datawhale 知识图谱组队学习 之 Task 4 用户输入->知识库的查询语句目录一、引言所涉及的背景知识;代码和注释二、什么是问答系统?用来回答人提出的自然语言问题的系统2.1 问答系统简介2.2 Query理解2.2.1 Query理解介绍Query即询问词法;句法;语义;2.2.2 意图识别介绍:意图识别是用来检测用户当前输入的意图2.2.3 槽值填充绍:槽值填充就是根据我们既定的一些结构化字段,将用户输入的信息中与其对应的部分提取出来。因此,槽

2021-01-15 21:43:28 128

原创 ask Special & Task 11 综合练习(2020.12)

显卡日志【数据下载】链接:链接: https://pan.baidu.com/s/1CjfdtavEywHtZeWSmCGv3A.密码::4mui下面给出了3090显卡的性能测评日志结果,每一条日志有如下结构:Benchmarking #2# #4# precision type #1##1# model average #2# time : #3# ms其中#1#代表的是模型名称,#2#的值为train(ing)或inference,表示训练状态或推断状态,#3#表示耗时,#4#表示精度

2021-01-13 22:28:32 294

原创 Datawhale 知识图谱组队学习 之 Task 3 Neo4j图数据库导入数据

Datawhale 知识图谱组队学习 之 Task 3 Neo4j图数据库导入数据目录一、引言图形作为一种特定的数据结构,用于表达数据之间的复杂关系,可以理解为你周边人际关系网络;二、Neo4j简介2.1 基本概念eo4j使用图相关的概念来描述数据模型,即结点和边,外加属性。2.2 索引neo4j的索引机制,就是为了快速定位起始节点2.3 Neo4j的优势Neo4j:查询的高性设计的灵活性开发的敏捷性等2.4 环境部署2.4.1 运行环境https://editor.cs

2021-01-13 20:22:44 188

原创 Datawhale 知识图谱组队学习 之 Task 2 基于医疗知识图谱的问答系统操作介绍

Datawhale 知识图谱组队学习 之 Task 2 基于医疗知识图谱的问答系统操作介绍目录一、引言二、运行环境1.导入数据三、搭建知识图谱四、启动问答测试目录一、引言二、运行环境python3.0及以上neo4j 4.2.2Jdk15.0.11.导入数据运行 以下命令:python build_graph.py 载入本地neo4j库大约2个小时三、搭建知识图谱**运行介绍之后,打开浏览器进入网址:链接: http://localhost:7474/.以看到我们导入的数据的

2021-01-13 00:21:24 112

原创 Datawhale 知识图谱组队学习 之 Task 1 知识图谱介绍

一、知识图谱简介1.1 引言知识图谱用于机器聊天,大数据风控,医疗和证券投资等等,越来越多的领域在应用知识图谱。1.2 什么是知识图谱呢?知识图谱可以理解为一种关系图,就像家族网络一般互相链接延展,抽象上说:“知识图谱就是语义网络的知识库”1.2.1 什么是图(Graph)呢?**图由节点(note)和边(edge)构成,如果你是理工科毕业,可以理解为电路中的节点和边: Note(节点)表示:人,地名,概念,药物,公司等等。

2021-01-11 22:29:51 864

原创 Pandas 10 序数据

一、时序中的基本对象在pandas中称为Timestamp。同时,一系列的时间戳可以组成DatetimeIndex,而将它放到Series中后,Series的类型就变为了datetime64[ns],如果有涉及时区则为datetime64[ns, tz]二、时间戳Timestamp的构造与属性单个时间戳的生成利用pd.Timestamp实现,一般而言的常见日期格式都能被成功地转换:Datetime序列的生成一组时间戳可以组成时间序列,可以用to_datetime和date_range来生

2021-01-10 21:48:11 178 1

原创 第九章 分类数据

第九章 分类数据一 所需要知识点crosstab 第一个参数是列,第二个参数是行;pd.corsstab(df.A, df.B)结构语法如下:pd.crosstab(index, columns, values=None,rownames=None, colnames=None, aggfunc=None, margins=False,margins_name: str = ‘All’, dropna: bool = True,normalize=False)2

2021-01-07 21:50:30 331

原创 Pandas 文本数据

Ex1:房屋信息数据集现有一份房屋信息数据集如下:将year列改为整数年份存储。将floor列替换为Level, Highest两列,其中的元素分别为string类型的层类别(高层、中层、低层)与整数类型的最高层数计算房屋每平米的均价avg_price,以***元/平米的格式存储到表中,其中***为整数。小结:str对象的设计意图str对象是定义在Index或Series上的属性,专门用于逐元素处理文本内容,其内部定义了大量方法,因此对一个序列进行文本处理,首先需要获取其str对象

2021-01-06 19:55:39 107

原创 Pandas缺失数据

**一、缺失值的统计和删除缺失信息的统计**数据处理中经常需要根据缺失值的大小、比例或其他特征来进行行样本或列特征的删除,pandas中提供了dropna函数来进行操作。dropna的主要参数为轴方向axis(默认为0,即删除行)、删除方式how、删除的非缺失值个数阈值thresh( 非 缺 失 值 \color{red}{非缺失值} 非缺失值没有达到这个数量的相应维度会被删除)、备选的删除子集subset,其中how主要有any和all两种参数可以选择。例如,删除身高体重至少有一个缺失的行:

2021-01-03 19:42:17 124

原创 pandas综合练习

【任务一】企业收入的多样性【题目描述】一个企业的产业收入多样性可以仿照信息熵的概念来定义收入熵指标 :其中 p(xi)是企业该年某产业收入额占该年所有产业总收入的比重。在company.csv中存有需要计算的企业和年份 , 在company_data.csv中存有企业、各类收入额和收入年份的信息。现请利用后一张表中的数据 , 在前一张表中增加一列表示该公司该年份的收入熵指标I。【任务二】组队学习信息表的变换【题目描述】请把组队学习的队伍信息表变换为如下形态,其中’是否队长’一列取1表示队长

2021-01-01 22:49:51 260 1

原创 Pandas连接

美国疫情数据集现有美国4月12日至11月16日的疫情报表,请将New York的Confirmed, Deaths, Recovered, Active合并为一张表,索引为按如下方法生成的日期字符串序列:找到4月12日的报表数据:设置索引调出4月12日的的New York的Confirmed, Deaths, Recovered, Active以日期为主的字符串索引列表Ex2:实现join函数请实现带有how参数的join函数假设连接的两表无公共列调用方式为 join(df1, d

2020-12-29 19:42:26 3006

原创 pandas Task 005

四、练习Ex1:美国非法药物数据集现有一份关于美国非法药物的数据集,其中SubstanceName, DrugReports分别指药物名称和报告数量:**3*…(未完成)***Ex2:特殊的wide_to_long方法从功能上看,melt方法应当属于wide_to_long的一种特殊情况,即stubnames只有一类。请使用wide_to_long生成melt一节中的df_melted。(提示:对列名增加适当的前缀)小结:pivot的使用依赖于唯一性条件,那如果不满足唯一性条

2020-12-27 21:33:00 138

原创 Pandas的分组练习

练习一,汽车数据集现有一份汽车数据集,其中Brand, Disp., HP分别代表汽车品牌、发动机蓄量、发动机输出。1.先过滤出所属Country数超过2个的汽车,即若该汽车的Country在总体数据集中出现次数不超过2则剔除,再按Country分组计算价格均值、价格变异系数、该Country的汽车数量,其中变异系数的计算方法是标准差除以均值,并在结果中把变异系数重命名为CoV:中途换用Jupyternotebook,比pytorch简洁,易直观。2.按照表中位置的前三分之一、中间三分之一和后三

2020-12-25 18:26:05 777

原创 Pandas索引

Pandas索引的基础知识自我补充可变序列与不可变序列:复制列表和指向索引器一.列索引注:其中 x为多种类型的不同代称,我在手机端编辑,这边没有数据集为了方便统一写成了 x列索引是最常见的索引方式,一般通过 [ ]来实现,通过 [列名] 可以从DataFrame中取出相应的列,返回值为Seriesdf.= pd.read_csv(“data数据存储在你电脑的位置”, usecols = [“School”,”Grade”,”Name”,”Gende”,”weight”,”Transter

2020-12-22 20:35:31 440

原创 pandas基础和部分练习

import numpy as np#导入nupmy库并记为npimport pandas as pd#导入pandas 库并记为pdprint(np._ version_,)np._ show_config()#

2020-12-17 16:28:01 143

原创 Pandas基础认知和介绍

**感言**还有一个月就到2021年了,Pandas已经成长为一个非常大的库,也不像当初那样简洁和易用了。在代码中看到pd.,八九不离十就是Pandas了,关于Pandas有俩个重要的数据结构,这里申明是重要的:1.Series2.DateFrame关于Sries可以暂时认为是一维数组,通过一些数据后就可以产生最简单的Series特性:Series的字符串变现形式为:“索引”在左...

2020-12-16 21:38:02 97

原创 Task00 Pandas安装指令和初识

Pandas 是python的一个数据分析包,该工具是为了解决数据分析任务而创建的!“七星联盟的小伙伴”,直接使用“pip install pandas”直接安装第三方库就可以了

2020-12-13 18:09:36 106

原创 Numpy大作业

鸢尾属植物数据集.\iris.data,在这个数据集中,包括了三类不同的鸢尾属植物:Iris Setosa,Iris Versicolour,Iris Virginica。每类收集了50个样本,因此这个数据集一共包含了150个样本。sepallength:萼片长度sepalwidth:萼片宽度petallength:花瓣长度petalwidth:花瓣宽度#1.导入鸢尾属植物数据集,保持文本不变import numpy as npoutfile = r'.\iris.data'iris_dat

2020-12-01 20:57:17 200

原创 Task09线性代数(欧式距离)

练习题计算数组之间的欧式距离,需要掌握函数和线性代数的的相关知识。方法1方法2**上述程序中norm表示范数,linalg为liner线性和algbra代数

2020-11-29 18:34:59 187

原创 Numpy统计计算

计算最小值numpy.amin(a[, axis=None, out=None, keepdims=np._NoValue, initial=np._NoValue, where=np._NoValue]),即返回数组的最小值或沿轴的最小值我们发现当,axis= 0和 axis=1时,是沿着轴进行操作。计算最大值numpy.amax(a[, axis=None, out=None, keepdims=np._NoValue, initial=np._NoValue, where=np._NoVal

2020-11-27 22:24:28 1114 1

原创 Task2 Numpy随机抽样

这里写目录标题随机的二位为数组的创建?(知识点:随机抽样)关于Numpy随机抽样的定义三级目录二项分布泊松分布超几何分布均匀分布正态分布指数分布随机的二位为数组的创建?(知识点:随机抽样)假设我们要创建一个5X2的二维数组,包含5到9之间的随机数 ,即随机抽样!如何创建这样的的二维数组呢,我们以下列程序进行展现:列1得到一组数据,我们反复运行时,又会得到另一组随机抽样的数据,大家有兴趣的花可以试试看。关于Numpy随机抽样的定义* numpy.random 模块对 Python 内置的 r

2020-11-25 22:09:34 219

原创 编程实践(Numpy)下

编程实践(Numpy)下Task01:输入输出npy格式npz格式numpy.save(file, arr, allow_pickle=True, fix_imports=True)numpy.load(file, mmap_mode=None, allow_pickle=False, fix_imports=True, encoding='ASCII')将多个数组保存到一个文件,可以使用numpy.savez()函数。文本格式选项文本文件Task01:输入输出save()、savez()和load()

2020-11-23 22:12:52 357

原创 机器学习3-基于支持向量机的简易概念

1.什么是支持向量从数学角度引出其表达式:其中,Xi=【x1,......,Xn】∈XX_i=【x_1,......,X_n】\in XXi​=【x1​,......,Xn​】∈X, y∈y\iny∈{-1,1 }表示俩种类别即:“+,-”www为法向量,b为位移。图1-1所有在上间隔边界上方的样本属于正类,在下间隔边界下方的样本属于负类。两个间隔边界的距离 定义为边距(margin),位于间隔边界上的正类和负类样本为支持向量(support vect

2020-08-26 20:14:28 248

原创 机器学习2-决策树的构建要点

决策树优点:计算复杂度不高,输出结果易于理解,中间值的缺失对其影响较小,可以处理无关联的“特征数据”。缺点;容易产生过度匹配。适用数据类型:数值型和标称型。构建决策树的注意点找到决定性特征(数据集的某个特征在划分数据分类时起确定作用,我们必须找到这个特征)评估每个特征(为了找到决定性特征,划分出最佳结果)一般设想思路测试结束后,原始数据被划分为几个“数据子集”几个“数据子集”在第一个决策点的所有分支上。这是如果有某个分支下的数据属于同一类型,则这些数据已经已经被正确的划分数据类型。相

2020-08-24 00:11:44 220

原创 基于逻辑回归的分类预测

逻辑回归算法原理(个人理解)虽然叫逻辑回归,但就是一个很牛的二分类算法,是因为非常简单,实践非常容易,实际效果也不错!一般呢,我都是先用 逻辑回归,再用其他算法。(估计很多人,也是这样吧!)Sigmoid函数公式 :f(x)=1/(1+e^-x);自变量的取值范围即为任意实数【-∞,+∞】,值域则为【0.1】假设,当有线性回归预测一个值 ,放到sigmoid函数中 ,必须是一个实数值 ,此时y轴取值为【0.1】,这的确有一点抽象,建议各位根据图理解一下!##补充什么是回归和分类?回归:如房

2020-08-18 00:46:40 1276

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除