自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (4)
  • 收藏
  • 关注

原创 作业3(大作业):python数据分析与应用大作业,对用户用电量数据进行数据处理,包括数据转置、异常数据识别和处理、统计基本统计量(包括峰度、偏度)、按日/周(求和)差分、5%分位数等

Python数据分析与应用大作业使用学习过的知识(Numpy数值分析基础、Matplotlib数据可视化基础、Pandas统计分析基础),对data.csv用户用户用电量数据进行相关处理,其中数据中有编号为1-200的200位电力用户,DATA_DATE表示时间,如2015/1/1表示2015年1月1日,KWH为用电量。请完成以下工作:一、将数据进行转置,转置后行为用户编号、列为日期、值...

2020-04-13 10:27:07 18687 22

原创 【以图搜图】Python实现根据图片批量匹配(查找)相似图片

可以解决在本地实现根据图片查找相似图片的功能

2023-08-01 19:41:59 6019 2

原创 算法练习5:二进制字符串前缀一致的次数

[1, i]若是连续的,则当前数组中的最大值等于当前下标i,也就是说在[2, 3, 1, 5, 4]中,当i = 3时,此时[1, 3]的最大值等于i,且当i = 5时,[1, 5]的最大值等于i,所以有两个前缀一致。:当出现前缀一致时,此时的[1, i]数组中一定存在1且一定是连续的,比如说[2, 3, 1, 5, 4]中[1, 4]数组存在1但不连续所以不存在前缀一致,而[1, 5]数组存在1且连续则存在前缀一致。就可以说明是连续的,其中min和max分别为当前[1, i]中的最小值和最大值。

2023-06-14 11:35:47 807

原创 算法练习4-岛屿数量

给你一个由 '1'(陆地)和 '0'(水)组成的的二维网格,请你计算网格中岛屿的数量。2、当遇到二维网格的值为‘1’时,进行广度优先搜索BFS,将遇到的'1'变为'0';岛屿总是被水包围,并且每座岛屿只能由水平方向和/或竖直方向上相邻的陆地连接形成。1、遍历二维网格,计算遇到‘1’的次数,即为最终结果;3、继续遍历二维网格,遇到‘0’时continue。BFS循环中,往里面添加坐标时,会有重复判断的情况。此外,你可以假设该网格的四条边均被水包围。来源:力扣 No.200。

2023-06-09 18:22:30 188

原创 算法练习-3:两两交换链表中的节点

两两交换其中相邻的节点,并返回交换后链表的头节点,只能通过交互节点而不是修改内部值来解决问题

2023-05-25 15:40:42 170

原创 算法练习-2:送外卖

现有一个整数n,及两个长度为n的数组num1和num2,每个数组中的元素i表示能够在当前位置移动的距离(正/负),每次在位置i移动时可以选择num1[i]或num2[i],要求通过选择num1和num2来移动,最终到达n-1的位置,其中使用"a"和"b"分别表示选择的数组,最终得到一个字符串s,返回最小字典序的s,其他情况:若最小字典序无限长则返回"Infinity!",若不能到达n-1位置则返回"No solution!"

2023-05-24 18:41:57 1133

原创 算法练习-1:在长度为n的数组中找到一个连续子序列,该连续子序列满足最多只改变一个数,就可以使其成为一个严格上升的连续子序列,返回该连续子序列的最长长度

在长度为n的数组中找到一个连续子序列,该连续子序列满足最多只改变一个数,就可以使其成为一个严格上升连续子序列,返回该连续子序列的最长长度

2023-05-24 15:44:12 394

原创 几种python存储数据(海量数据)的方式及读取时间对比

使用背景:需要保存通过包括但不限于torch及numpy创建的数据(在这里主要测试的是通过网络训练,提取到的图片的特征向量)数据格式及大小:在这里使用torch创建数据,没用使用GPU(已经是该配置下能运行的最大数据量了,否则会爆内存)运行环境:具体参数参考R9000P 2021 3070版本;数据存储在新加的固态上型号是三星1tb 980测试内容:测试python主要的几种存储数据方式包括:h5py、npy、pkl、pt的读取速度。...

2022-08-26 22:18:07 6419

原创 Ubuntu 安装 openslide-python 步骤及报错处理

Ubuntu 安装 openslide-python 步骤及报错处理

2022-05-06 12:12:33 1637

原创 【论文学习】Opening the black box of Deep Neural Networks via Information

Opening the black box of Deep Neural Networks via InformationRavid Schwartz-Ziv, Naftali Tishby

2022-03-03 14:29:40 1991 1

原创 Linux中MPICH3.2.1安装步骤及遇到的问题并解决

一、下载Mpich并解压Downloads | MPICH到官方网站下载Mpich,并解压到自己的文件目录下二、安装过程及遇到的问题正确安装步骤,可以直接看Mpich解压文件下的README文件,有详细安装步骤及某些问题解决方式。1、Configure MPICH specifying the installation directoryfor csh and tcsh: ./configure --prefix=/home/<USERNAME...

2021-10-20 13:46:29 2488

原创 小练习:python简单验证哥德巴赫猜想(数据范围:2 ~ 2亿 内的偶数),判断是否为素数(质数),同时基于数论优化判断素数的算法。

小练习:python简单验证哥德巴赫猜想(数据范围:2 ~ 200000000内的偶数)考研休息的间隙,顺手敲了敲练习的算法,验证哥德巴赫猜想补充知识: 加法算式中,两个相加的数叫做加数。(doge) 合数是指在大于1的整数中除了能被1和本身整除外,还能被其他数(0除外)整除的数。题目:任何一个大于2的偶数总能表示为两个素数之和,比如 24 = 5 + 19,其中5和19都是素数。本实验的任务是设计一个程序,验证20亿以内的偶数...

2020-07-05 22:41:26 1572

原创 安装selenium与ChromeDriver的方法及遇到的错误。

安装selenium与ChromeDriver方法及遇到的错误一、安装selenium方法一:在pycharm中安装在Pycharm页面中File -> Settings -> Project:Name -> Project Interpreter -> 点击绿色‘+’ -> 搜索selenium安装可以在中设置pip镜像。清华:https://pypi.tuna.tsinghua.edu.cn/simple 阿里云:http://mirrors.a...

2020-05-11 12:41:49 1197

原创 作业4:网页前端基础(HTTP请求方式与过程、HTTP状态码、HTTP头部信息)及静态网页爬取(urllib3库、requests库、Xpath解析网页、Beautiful Soup解析网页)

网页前端基础及爬取静态网页一、HTTP请求方式与过程1、请求方法在HTTP/1.1协议中共定义了8种方法(也叫“动作”)来以不同方式操作指定的资源,常用的方法有GET、HEAD、POST等。请求方法 方法描述 GET 请求指定的页面信息,并返回实体主体。GET可能会被网络爬虫等随意访问,因此GET方法应该只用在读取数据,而不应当被用于产生“副作用”的操作中,例如在W...

2020-05-11 10:00:06 1867

原创 作业2:pandas统计分析基础知识(读写文件、DataFrame常用操作、转换与处理时间序列数据)及练习题

pandas统计分析基础知识及练习题1、读取不同数据源的数据(1)数据库数据读取pandas提供了读取与存储关系型数据库数据的函数和方法,除此之外还需要使用SQLAIchemy库建立对应的数据库连接。使用create_engine函数建立数据库连接。import pandas as pdfrom sqlalchemy import create_engineengin = c...

2020-03-28 22:01:06 2756 1

原创 作业1:关于使用python中scikit-learn(sklearn)模块,实现鸢尾花(iris)相关数据操作(数据加载、标准化处理、构建聚类模型并训练、可视化、评价模型)

操作题:利用鸢尾花数据实现数据加载、标准化处理、构建聚类模型并训练、聚类效果可视化展示及对模型进行评价一、数据加载from sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_splitdata = load_iris()train_data, test_data, trai...

2020-03-26 19:59:18 8682 1

维基中文语料库(非最新)(两部分此为Part2) zhwiki-latest-pages-articles.xml.bz2_.part2

维基中文语料库(非最新)(两部分此为Part2) zhwiki-latest-pages-articles.xml.bz2_.part2 | 原压缩包太大需要分两次上传,part1链接:https://download.csdn.net/download/Joker_Q/14967708

2021-01-30

维基中文语料库(非最新)(两部分此为Part1) zhwiki-latest-pages-articles.xml.bz2_.part1.rar

维基中文语料库(非最新)(两部分此为Part1) zhwiki-latest-pages-articles.xml.bz2_.part1 | Part2不需要积分, Part2链接:https://download.csdn.net/download/Joker_Q/14967774

2021-01-30

用户用电量数据data.rar

python数据分析与应用大作业,对用户用电量数据进行数据处理,对应文章《作业3(大作业)...》练习题数据

2020-04-13

chipotle.zip

“探索快餐数据”python操作题所需数据集文件,Pandas练习题数据集,对应文章《作业2:pandas统计分析基础知识(读写文件、DataFrame常用操作)及练习题》的练习题。

2020-03-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除