自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 python3基础系列【一】:值得了解的开胃菜

python3基础系列【一】:值得了解的开胃菜print(object):打印输出结果,默认换行,如果不想换行,括号内的尾部加end=’’type(object):查看对象类型len(object):返回对象长度、或者元素个数(列入字典、元祖、列表…)help(function):查看函数的帮助文档id(object):返回对象在其生命周期内的内存地址,参数类型是一个对象.help(id) 变量:Python 中的变量不需要声明,每个变量在使用前都必须赋值,变量

2021-09-02 07:47:01 133

原创 leetcode 153. 寻找旋转排序数组中的最小值

题目描述:已知一个长度为 n 的数组,预先按照升序排列,经由 1 到 n 次 旋转 后,得到输入数组。例如,原数组 nums = [0,1,2,4,5,6,7] 在变化后可能得到:若旋转 4 次,则可以得到 [4,5,6,7,0,1,2]若旋转 7 次,则可以得到 [0,1,2,4,5,6,7]注意,数组 [a[0], a[1], a[2], …, a[n-1]] 旋转一次 的结果为数组 [a[n-1], a[0], a[1], a[2], …, a[n-2]] 。给你一个元素值 互不相同 的数组

2021-04-28 11:26:23 115

原创 Numpy库基础知识与常用方法

文章目录开胃小菜 np.tile(A, reps)、np.c_[nd1, nd2]1、数据创建1)数组属性2)文件IO操作保存数据读取数据读写csv、txt⽂件2、数组运算1)四则运算:加 减 乘 除2)逻辑运算3、视图与复制1)完全没有复制2)查看或者叫浅拷贝3)深拷贝4、索引、切片和迭代1)什么是可迭代对象2)索引与切片 array[start : end : step]3)花式索引和索引技巧4)boolean值索引5、形状操作1)数组变形2)数组转置3)数据堆叠合并4)split数组拆分6、广播

2021-03-23 17:39:45 554

原创 数据挖掘之线性回归原理(附代码)

文章目录1.什么是线性回归2.最大似然估计(MLE)3.利用正规方程求解(矩阵求导)4.梯度下降1.什么是线性回归这里引用百度百科的解释:利用数理统计中的回归分析,来确定变量间相互依赖的定量关系的一种统计分析方法,其表达形式为 y(i)=wTx(i)+e(i)y^{(i)} = w^Tx^{(i)}+e^{(i)}y(i)=wTx(i)+e(i),eee为误差(用来代替统计误差或者抽样误差),它服从均值为0的标准正态分布。例如成年人的月收入与月消费的关系,二者之间肯定存在某种关系。在求解之前,通常会给

2021-03-23 17:38:33 878

原创 Python基本语法(必须了解)

文章目录餐前甜点:斐波那契数列(利用递归或者循环,建议最后观看)1、注释2、input 交互式输入3、格式化输出4、条件控制语句if else1)if - else2)if-elif...else5、循环语句 for、while2)whlie循环语句7、提前停止循环 break、continue1)break 是结束当前它归属最近的整个循环;2)continue8、函数9、递归函数10、匿名函数lambda11、实战案例写一个查询系统,结合循环、列表、字典、break,来一个多层嵌套,实现一个小功能。餐前

2021-03-23 17:34:47 380

原创 Pandas常用方法一

文章目录1、Series 有序(index)序列1)创建Series2)序列索引查找2、Dataframe1)创建dataftame (ndarray、dict、series)2)创建符合索引的dataframe3)数据信息概览3、数据的读取与保存1)读写excel文件2)读写csv文件3)读写HDF5文件4)读写SQL文件4、DataFrame的部分数据获取a)按顺序匹配df.iloc[row_index, col_index]2)按名字索引匹配 df.loc[row_index, col_index]3

2021-03-23 17:31:26 308

原创 Pandas常用方法二

文章目录1、数学和统计方法统计方法排序2、分箱等距分箱等频数分箱,每个箱子拥有相同的记录数3、分组聚合分组分组统计使用apply、transform来实现分组聚合applytransformagg多种方法一起聚合透视表4、时间序列时间戳序列时间戳索引上下移动数据移动日期移动频率转换asfreq()重采样resample()5、简易数据可视化线形图散点图条形图饼图面积图盒须图直方图1、数学和统计方法统计方法import numpy as npimport pandas as pddf = pd.D

2021-03-23 17:29:43 307

原创 SVD奇异值分解与PCA的底层原理解析

文章目录1、特征值与特征向量2、SVD的定义1、特征值与特征向量       在了解SVD分解前,先回顾一下特征值与特征向量。假设矩阵AAA为n阶方阵,向量viv_ivi​满足:Avi=λviAv_i=λv_iAvi​=λvi​用矩阵表示所有特征值与所有特征向量的关系则为:A∗V=V∗diag(λ1,λ2,...)A*V=V*diag(λ_1,λ_2,...)A∗V=V∗diag(λ1​,λ2​,...)因此只要满足上面的等式

2021-03-12 19:11:47 367 1

原创 刷题(二)1528. 重新排列字符串

给你一个字符串 s 和一个 长度相同 的整数数组 indices 。请你重新排列字符串 s ,其中第 i 个字符需要移动到 indices[i] 指示的位置。返回重新排列后的字符串。声明:本人,还未学习算法,所以解答中肯定存在非常多的不足,我也会不断修改完善。def restoreString(s, indices): # 3,1,0,2,4 temp = '' for i in range(len(indices)): # 0 找到0对应在第几个元素 idx = -1 for j i

2021-03-10 17:55:12 179

原创 Python-matplotlib库常用分析图(双周,子图,极坐标,雷达等)

这里写目录标题图形绘制坐标轴刻度、标签、标题图例脊柱移动(坐标轴移动)图片保存多图布局子视图嵌套均匀布局不均匀分布双轴显示文本、注释、箭头注释常用视图柱状图极坐标图极坐标线性图极坐标柱状图直方图箱型图散点图饼图一般饼图嵌套饼图甜甜圈案例(鸡肋)热力图面积图蜘蛛图3D图三维折线图散点图三维柱状图本篇文章包含了常用图形,其次有双坐标周,一个画布多个子图,极坐标图等等,仔细阅读加操作,相信收获是很大的。import numpy as npimport pandas as pdimport matplotl

2021-03-10 17:06:06 657

原创 爬虫之bs4、xpath数据解析(案例—scrapy获取菜鸟HTML页面数据)

下载菜鸟HTML网站坐标标题对应的子界面数据。url = https://www.runoob.com/html/html-basic.html项目结构如下:主要文件cnHtml.py,代码如下:import osimport scrapyfrom lxml import etreeimport kuser_agent as kuaclass CnhtmlSpider(scrapy.Spider): name = 'cnHtml' if not os.path.exi

2021-03-10 16:58:53 1843

原创 MySQL查连续记录、天数(2次或3次都可)的思路

文章目录1、查找连续记录2、查找连续n条记录1、查找连续记录问题好像是来源于力扣601题,因此做个记录。我随便造了一个数据,如下表conid赵3钱10孙11李12周13吴14郑17王18秦19汉4宋21元22明23皇甫1我们要找出id连续的记录,比如【3,4】;【21,22,23】等。思路如下,分为两步1、如果按照id升序排序,lag(1)位,找到二者差值为1的记录,

2021-02-09 11:21:47 1171

原创 MySQL之DQL、DDL、DML、TCL和函数、视图、存储过程的用法

@[TOC]b1、DDL(Data Define L)数据定义语句DDL语言(数据定义语言【库和表】--(1)库的操作CREATE DATABASE kkb;-- 更改数据库字符集,改成gbkALTER DATABASE kkb CHARACTER SET gbk;--(2)表的创建/* CREATE TABLE new( 字段名 字段类型【长度】 【约束】 ... );*/USE kkb;CREATE TABLE books( id INT, bname V

2021-02-05 01:06:13 601 2

原创 决策树算法原理详解ID3、C4.5和CART

文章目录什么是决策树熵、条件熵ID3、C4.5CART什么是决策树      决策树可以简单理解为是一种根据特征信息不断分裂,直至达到某一阈值(可以是max_depth、min_node_leafs等)分裂结束,就是一串的if…then…结构。那么谁作为第一个if判断的特征呢?这就需要熵、条件熵、信息增益登场了。熵、条件熵      熵是表示随机变量Y不确定的度量,熵越大则越混乱越无法确定;越小则越肯定,例如拜登是男的,entropy

2021-01-28 16:53:36 224

原创 os模块下关于读写文件的操作;以python直接读取doc文件,转存为docx文件为例。

话不多说了,直接po码`import osimport docximport xlrdimport timeimport pythoncomimport pandas as pdimport win32com.client as wcfor i,file in enumerate(os.listdir('C:/Intel/files')): word = wc.Dispatch("Word.Application") word.Visible = 0 # 后台

2021-01-19 18:36:39 277

原创 Python使用递归+遍历读取文件夹下所有docx文件

文章目录思路文件夹结构递归+遍历读取想要的文件思路首先遍历父文件夹下所有内容,如果内容是文件+【其他条件,如读取PDF,Excel】则直接读取,不是文件则递归重复上一步操作。文件夹结构话不多说,上菜!先给大家展示一下文件结构如下:实现代码如下:print(os.getcwd().rsplit('\\')[-1])for i in os.listdir(os.getcwd()): if os.path.isdir(i): print('\t{}'.format(i))

2021-01-13 10:28:42 2391 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除