- 博客(51)
- 收藏
- 关注
原创 DataWhale_Pandas Task Special:第二次综合练习
【任务四】显卡日志下面给出了3090显卡的性能测评日志结果,每一条日志有如下结构:Benchmarking #2# #4# precision type #1##1# model average #2# time : #3# ms其中#1#代表的是模型名称,#2#的值为train(ing)或inference,表示训练状态或推断状态,#3#表示耗时,#4#表示精度,其中包含了float, half, double三种类型,下面是一个具体的例子:Benchmarking Infer
2021-01-13 22:18:56 186
原创 DataWhale_Pandas Task10 时序数据
第十章 时序数据一、时序中的基本对象时间序列的概念在日常生活中十分常见,但对于一个具体的时序事件而言,可以从多个时间对象的角度来描述。例如2020年9月7日周一早上8点整需要到教室上课,这个课会在当天早上10点结束,其中包含了哪些时间概念? 第一,会出现时间戳(Date times)的概念,即’2020-9-7 08:00:00’和’2020-9-7 10:00:00’这两个时间点分别代表了上课和下课的时刻,在 pandas 中称为 Timestamp 。同时,一系列的时间戳可以组成 Date
2021-01-10 23:24:38 287
原创 DataWhale_Pandas Task09 分类数据
第九章 分类数据一、cat对象1. cat对象的属性¶在 pandas 中提供了 category 类型,使用户能够处理分类类型的变量,将一个普通序列转换成分类变量可以使用 astype 方法。In [3]: df = pd.read_csv('data/learn_pandas.csv', ...: usecols = ['Grade', 'Name', 'Gender', 'Height', 'Weight']) ...: In [4]: s = df.Gra
2021-01-07 21:31:18 181
原创 DataWhale_Pandas Task08 文本数据
第八章 文本数据一、str对象1. str对象的设计意图¶str 对象是定义在 Index 或 Series 上的属性,专门用于逐元素处理文本内容,其内部定义了大量方法,因此对一个序列进行文本处理,首先需要获取其 str 对象。在Python标准库中也有 str 模块,为了使用上的便利,有许多函数的用法 pandas 照搬了它的设计,例如字母转为大写的操作:In [3]: var = 'abcd'In [4]: str.upper(var) # Python内置str模块Out[4]
2021-01-06 23:26:55 189
原创 DataWhale_Pandas Task07 缺失数据
第七章 缺失数据一、缺失值的统计和删除1. 缺失信息的统计缺失数据可以使用 isna 或 isnull (两个函数没有区别)来查看每个单元格是否缺失,结合 mean 可以计算出每列缺失值的比例:In [3]: df = pd.read_csv('data/learn_pandas.csv', ...: usecols = ['Grade', 'Name', 'Gender', 'Height', ...:
2021-01-03 21:58:16 207
原创 DataWhale_Pandas Task Special:第一次综合练习
【任务一】企业收入的多样性【题目描述】一个企业的产业收入多样性可以仿照信息熵的概念来定义收入熵指标:其中 p(xi) 是企业该年某产业收入额占该年所有产业总收入的比重。在company.csv中存有需要计算的企业和年份,在company_data.csv中存有企业、各类收入额和收入年份的信息。现请利用后一张表中的数据,在前一张表中增加一列表示该公司该年份的收入熵指标 I 。【数据下载】链接:https://pan.baidu.com/s/1leZZctxMUSW55kZY5WwgIw 48
2021-01-01 23:10:23 232
原创 DataWhale_Pandas Task6 连接
第六章 连接一、关系型连接1. 连接的基本概念把两张相关的表按照某一个或某一组键连接起来是一种常见操作,例如学生期末考试各个科目的成绩表按照 姓名 和 班级 连接成总的成绩表,又例如对企业员工的各类信息表按照 员工ID号 进行连接汇总。由此可以看出,在关系型连接中, 键 是十分重要的,往往用 on 参数表示。另一个重要的要素是连接的形式。在 pandas 中的关系型连接函数 merge 和 join 中提供了 how 参数来代表连接形式,分为左连接 left 、右连接 right 、内连接
2020-12-29 22:17:05 94
原创 DataWhale_sql Task06 综合练习
练习一: 各部门工资最高的员工(难度:中等)创建Employee 表,包含所有员工信息,每个员工有其对应的 Id, salary 和 department Id。+----+-------+--------+--------------+| Id | Name | Salary | DepartmentId |+----+-------+--------+--------------+| 1 | Joe | 70000 | 1 || 2 | Henry |
2020-12-27 20:56:31 154
原创 DataWhale_Pandas Task05 变形
第五章 变形一、长宽表的变形什么是长表?什么是宽表?这个概念是对于某一个特征而言的。例如:一个表中把性别存储在某一个列中,那么它就是关于性别的长表;如果把性别作为列名,列中的元素是某一其他的相关特征数值,那么这个表是关于性别的宽表。下面的两张表就分别是关于性别的长表和宽表:In [3]: pd.DataFrame({'Gender':['F','F','M','M'], ...: 'Height':[163, 160, 175, 180]}) ...:
2020-12-27 16:52:33 160
原创 DataWhale_Pandas Task04 分组
第四章 分组分组操作在日常生活中使用极其广泛,例如: 依据性别分组,统计全国人口寿命的平均值 依据季节分组,对每一个季节的温度进行组内标准化 依据班级分组,筛选出组内数学分数的平均值超过80分的班级 从上述的几个例子中不难看出,想要实现分组操作,必须明确三个要素:分组依据、数据来源、操作及其返回结果。同时从充分性的角度来说,如果明确了这三方面,就能确定一个分组操作,从而分组代码的一般模式即:df.groupby(分组依据)[数据...
2020-12-25 21:34:47 209
原创 DataWhale_sql Task05 SQL高级处理
5.1 窗口函数5.1.1 窗口函数概念及基本的使用方法窗口函数也称为OLAP函数。OLAP 是OnLine AnalyticalProcessing 的简称,意思是对数据库数据进行实时分析处理。为了便于理解,称之为窗口函数。常规的SELECT语句都是对整张表进行查询,而窗口函数可以让我们有选择的去某一部分数据进行汇总、计算和排序。窗口函数的通用形式:<窗口函数> OVER ([PARTITION BY <列名>] OR
2020-12-24 21:01:19 124
原创 DataWhale_sql Task04 集合运算
4.1 表的加减法4.1.1 什么是集合运算集合在数学领域表示“各种各样的事物的总和”, 在数据库领域表示记录的集合. 具体来说,表、视图和查询的执行结果都是记录的集合, 其中的元素为表或者查询结果中的每一行.在标准 SQL 中, 分别对检索结果使用 UNION, INTERSECT, EXCEPT 来将检索结果进行并,交和差运算, 像UNION,INTERSECT, EXCEPT这种用来进行集合运算的运算符称为集合运算符.以下的文氏图展示了几种集合的基本运算.在数据库中, 所有
2020-12-22 20:19:20 337
原创 DataWhale_Pandas Task03 索引
第三章 索引一、索引器1. 表的列索引列索引是最常见的索引形式,一般通过 [] 来实现。通过 [列名] 可以从 DataFrame 中取出相应的列,返回值为 Series ,例如从表中取出姓名一列:In [3]: df = pd.read_csv('data/learn_pandas.csv', ...: usecols = ['School', 'Grade', 'Name', 'Gender', ...:
2020-12-22 19:50:53 180
原创 DataWhale_sql Task03 复杂一点的查询
3.1 视图我们先来看一个查询语句(仅做示例,未提供相关数据)SELECT stu_name FROM view_students_info;单从表面上看起来这个语句是和正常的从数据表中查询数据是完全相同的,但其实我们操作的是一个视图。所以从SQL的角度来说操作视图与操作表看起来是完全相同的,那么为什么还会有视图的存在呢?视图到底是什么?视图与表有什么不同呢?3.1.1 什么是视图视图是一个虚拟的表,不同于直接操作数据表,视图是依据SELECT语句来创建的(会在下面具体介绍),所以操作
2020-12-20 22:55:29 177
原创 DataWhale_Pandas Task02 Pandas基础
第二章 pandas基础In [1]: import numpy as npIn [2]: import pandas as pd在开始学习前,请保证 pandas 的版本号不低于1.1.5,否则请务必升级!请确认已经安装了 xlrd, xlwt, openpyxl 这三个包,其中xlrd版本不得高于 2.0.0 。所用数据集下载可以在该项目的github地址:https://github.com/datawhalechina/joyful-pandas一、文件的读取和写入1. .
2020-12-19 22:54:28 253 1
原创 DataWhale_sql Task02 基础查询与排序
2.1 SELECT语句基础2.1.1 从表中选取数据SELECT语句从表中选取数据时需要使用SELECT语句,也就是只从表中选出(SELECT)必要数据的意思。通过SELECT语句查询并选取出必要数据的过程称为匹配查询或查询(query)。基本SELECT语句包含了SELECT和FROM两个子句(clause)。SELECT <列名>, FROM <表名>;2.1.2 从表中选取符合条件的数据WHERE语句当不需要取出全部数据,而是选取出满足
2020-12-17 21:23:32 171
原创 DataWhale_Pandas Task1 预备知识
一、Python基础1. 列表推导式与条件赋值[* for i in *] 。其中,第一个 * 为映射函数,其输入为后面 i 指代的内容,第二个 * 表示迭代的对象,可以代替循环进行嵌套[my_func(i) for i in range(5)]输出:[0, 2, 4, 6, 8]#单层循环[m+'_'+n for m in ['a', 'b'] for n in ['c', 'd']]输出:['a_c', 'a_d', 'b_c', 'b_d']#多层循环2. 匿名函数与map
2020-12-16 22:17:32 161 1
原创 DataWhale_sql Task1 数据库环境搭建及初步了解
po1.1 初识数据库数据库是将大量数据保存起来,通过计算机加工而成的可以进行高效访问的数据集合。该数据集合称为数据库(Database,DB)。用来管理数据库的计算机系统称为数据库管理系统(Database Management System,DBMS)。1.1.1 DBMS的种类DBMS 主要通过数据的保存格式(数据库的种类)来进行分类,现阶段主要有以下 5 种类型.层次数据库(Hierarchical Database,HDB) 关系数据库(Relational Database,R
2020-12-15 22:52:16 134
原创 Hdu2546 饭卡
饭卡 Time Limit: 5000/1000 MS (Java/Others)Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 48792Accepted Submission(s): 16525 Problem Description 电子科大本部食堂的饭卡...
2019-04-19 16:58:45 141
原创 oj图论汇总
oj图论问题分类链接:https://blog.csdn.net/BrcLi/article/details/763807851213:https://mp.csdn.net/postedit/889788111272:https://mp.csdn.net/postedit/889788471325:https://mp.csdn.net/postedit/88978917110...
2019-04-11 19:34:47 262
原创 Hdu1253 胜利大逃亡
胜利大逃亡 Time Limit: 4000/2000 MS (Java/Others)Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 47097Accepted Submission(s): 16247 Problem Description Ignatius被...
2019-04-11 19:28:20 132
转载 Hdu2208 唉,可爱的小朋友
唉,可爱的小朋友 Time Limit: 10000/3000 MS (Java/Others)Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 1670Accepted Submission(s): 490 Problem Description 唉,小朋友是比...
2019-04-11 19:26:03 187
原创 Hdu1874 畅通工程续
畅通工程续 Time Limit: 3000/1000 MS (Java/Others)Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 78122Accepted Submission(s): 30079 Problem Description 某省自从实行了很...
2019-04-11 19:22:14 80
原创 Hdu2544 最短路
最短路 Time Limit: 5000/1000 MS (Java/Others)Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 100267Accepted Submission(s): 43256 Problem Description 在每年的校赛里,所...
2019-04-11 19:20:24 200
原创 Hdu1875 畅通工程再续
畅通工程再续 Time Limit: 2000/1000 MS (Java/Others)Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 41638Accepted Submission(s): 13980 Problem Description 相信大家都听说...
2019-04-11 19:18:48 109
原创 Hdu1863 畅通工程
畅通工程 Time Limit: 1000/1000 MS (Java/Others)Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 42808Accepted Submission(s): 19128 Problem Description 省政府“畅通工程”...
2019-04-09 19:56:14 151
原创 Hdu1233 还是畅通工程
还是畅通工程 Time Limit: 4000/2000 MS (Java/Others)Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 65281Accepted Submission(s): 29590 Problem Description 某省调查乡村交...
2019-04-09 19:51:32 80
原创 Hdu1232 畅通工程
畅通工程 Time Limit: 4000/2000 MS (Java/Others)Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 77319Accepted Submission(s): 41021 Problem Description 某省调查城镇交通状...
2019-04-09 19:45:52 123
原创 Hdu1102 Constructing Roads
Constructing Roads Time Limit: 2000/1000 MS (Java/Others)Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 31205Accepted Submission(s): 11782 Problem Description...
2019-04-05 00:07:48 162
原创 Hdu1325 Is It A Tree?
Is It A Tree? Time Limit: 2000/1000 MS (Java/Others)Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 32125Accepted Submission(s): 7336 Problem Description A ...
2019-04-02 19:20:52 186
原创 Hdu1272 小希的迷宫
小希的迷宫 Time Limit: 2000/1000 MS (Java/Others)Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 70316Accepted Submission(s): 22094 Problem Description 上次Gardon...
2019-04-02 19:17:52 169
原创 Hdu1213 How Many Tables
How Many Tables Time Limit: 2000/1000 MS (Java/Others)Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 52180Accepted Submission(s): 25883 Problem Description ...
2019-04-02 19:13:45 162
原创 2019杭电计算机复试笔试回忆版
1.大家去电影院看电影,总共有n人来看电影,其中年龄不低于18岁的成年人的座位号为奇数,不满18岁的未成年人的座位号为偶数。现在请统计成年人与未成年的数目,以及他们在总人数里的比例。n<=1000。样例输入:5 2 3 6 7 11样例输出:3 0.60 2 0.40#include<cstdio>using namespace std;int n,man,ch...
2019-03-30 20:38:25 4390 3
原创 19考研落下帷幕 成功上岸 成为了杭电计算机的一员 谈谈复试的感想
首先,本人初试低分选手,电子信息工程跨考计算机,靠着复试逆袭,主要讲复试的经验。 复试成绩大约在80分多一点,今年的老师相比去年问的问题更细更专业,我回忆了几个问题,供大家参考:1.数据库:应该是这方面的,我没学过,数据流图与数据流程图的区别,我很干脆,因为没学过所以没有犹豫,直接了当的承认自己不会2.然后老师就开始问数据结构方面的问题:(1)列举下时间复杂度为o(nlo...
2019-03-28 17:46:54 3165 3
原创 2015杭电复试试题第一题
第一题给定一个字符串,计算字符串中的数值个数并求和,其中包含了负号,若紧跟一个负号则是一个数值,则并表示这是一个负数,若紧跟的不是数字,则不表示什么input: 312ab-2-- -9--aouttput: 3 301#include<iostream>#include<cstring>#include<cstdlib>#include...
2019-03-14 19:31:40 146
原创 Hdu2015
偶数求和 Time Limit: 2000/1000 MS (Java/Others)Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 124455Accepted Submission(s): 51444 Problem Description 有一个长度为n(...
2019-03-09 18:36:48 173
原创 Hdu2014
青年歌手大奖赛_评委会打分 Time Limit: 2000/1000 MS (Java/Others)Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 122982Accepted Submission(s): 60420 Problem Description ...
2019-03-09 18:33:44 634
原创 Hdu2013
蟠桃记 Time Limit: 2000/1000 MS (Java/Others)Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 91019Accepted Submission(s): 67122 Problem Description 喜欢西游记的同学肯定...
2019-03-09 18:30:35 151
原创 Hdu2012
素数判定 Time Limit: 2000/1000 MS (Java/Others)Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 196534Accepted Submission(s): 69476 Problem Description 对于表达式n^2...
2019-03-09 18:28:48 275
原创 Hdu2011
多项式求和 Time Limit: 2000/1000 MS (Java/Others)Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 111967Accepted Submission(s): 63078 Problem Description 多项式的描述如...
2019-03-09 18:26:12 196
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人