自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 收藏
  • 关注

原创 Python_批量创建字符串&批量创建/读取变量

Python,变量,批量创建变量、批量读取变量

2023-03-20 16:51:11 428 1

原创 Python_sklearn_CountVectorizer使用详解

Python,sklearn,CountVectorizer,文本提取,计数矩阵,toarray

2023-03-16 16:56:10 694

原创 数据挖掘_LDA主题模型详解_Python手把手实战

Python,LDA主题模型,LatentDirichletAllocation,文本分类

2023-03-13 10:45:58 1632 1

原创 Python_encode编码和decode解码

Python,Unicode,encode,decode

2023-03-10 16:03:48 266

原创 Python_unicode编码_附带chr、ord用法详解

Python、Unicode编码、chr、ord

2023-03-10 16:00:13 217

原创 Python_re_[\u4e00-\u9fa5]+_提取所有中文文本

Python,re,\u4e00,\u9fa5,[\u4e00-\u9fa5]+,Unicode码,re.findall,提取中文,分词,jieba,

2023-03-10 14:13:42 3144

原创 Python_集合set方法

Python,集合,set,添加,add、update,删除,remove、discard、pop,空集合,集合运算,|、&、^、-

2023-02-27 16:54:26 78

原创 Python_字典方法_get

Python,列表,方法,get

2023-02-27 15:29:37 42

原创 LeetCode_Python_二分查找算法

LeetCode,Python,二分查找算法

2023-02-22 16:01:22 357

原创 LeetCode_Python_贪心系列一_区间_中等

Python,leetcode,贪心算法,区间系列处理方法,合并区间,用最少数量的箭引爆气球,无重叠区间

2023-02-10 14:24:34 62

原创 LeetCode_Python_回文串或回文数系列二_中等

关于LeetCode中用Python对回文数或回文串的中等难度的题目进行归类分析编程,最长回文子序列、最长回文子串、回文子串、回文素数

2023-02-01 15:01:53 337

原创 LeetCode_Python_回文串或回文数系列一_简单

针对LeetCode中关于回文系列编程题,并且是简单类型的回文串题目

2023-01-30 17:05:04 574

原创 Python中经常使用的操作

文件读写open、字符串操作、set操作、unicode编码字符、zip、迭代next、多条件判断、list的简单表达式、图像可视化中的中文标签显示

2021-12-21 11:30:26 702 1

原创 Python -- matplotlib:实时刷新的动态散点图、折线图

动态散点图import matplotlib.pyplot as pltimport numpy as npplt.ion()plt.figure(figsize = (4,4))# 画单位圆theta = np.arange(0, 2.1*np.pi, 2*np.pi/100)plt.plot(np.cos(theta), np.sin(theta))plt.xlim([-1,1])plt.ylim([-1,1])# 模拟的随机点数n = 100a = 2 * np.ra..

2021-09-13 10:02:09 9638 3

原创 Python -- matplotlib:plt.ion()、plt.ioff()、plt.show()三者的关系、用法及其代码尝试

plt.ion():将 figure 设置为交互模式,figure 不用 plt.show() 也可以显示。plt.ioff():将 figure 设置为阻塞模式,也是 figure 的默认模式,figure 必须用 plt.show() 才能显示。plt.show():显示所有的 figure(不管是阻塞模式的还是交互模式的)。若一个 figure 下一个 plt.show(),则只有关闭一个 figure,才会出现下一个 figure。若最后设置 plt.show(),则会显示设置的所有..

2021-09-13 09:33:08 9270

原创 机器学习 -- 维度灾难:降维技术

2021-09-11 16:40:07 156

原创 Python -- Sklearn:主成分分析PCA代码实现

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns# 导入主成分分析包from sklearn.decomposition import PCAimport warningswarnings.filterwarnings("ignore")# 初始化数据集from sklearn.datasets import load_breast_cancercan

2021-09-09 17:22:46 983 3

原创 Python -- Pyecharts: Faker生成模拟数据

from pyecharts.faker import Faker# 生成随机的7个标签Faker.choose()['可乐', '雪碧', '橙汁', '绿茶', '奶茶', '百威', '青岛']# 生成随机的7个整数Faker.values()[97, 26, 91, 49, 123, 44, 141]# 生成7个国家名Faker.country['China', 'Canada', 'Brazil', 'Russia', 'United States', 'Africa',

2021-04-08 16:00:14 2839 4

原创 Python -- Pandas & Sklearn:选取训练集&测试集

1. Pandas 中的 samplen,设置直接取原数据中的多少数据。frac,设置取原数据的多少比例。df = pd.DataFrame(np.random.randn(400).reshape(100,4))df.head() 0 1 2 30 0.014483 0.044465 0.850342 0.7642591 0.967565 0.174887 0.519950 0.4509562 -0.669433 -0.629411 -1.288723 0.1197293 0.995928

2021-03-22 14:31:21 2377

原创 Python -- Selenium:安装&爬取豆瓣上的数据

1. 下载安装selenium模块pip install -U selenium #安装pip show selenium #查看是否安装成功2. 安装与浏览器匹配的webdriver2.1 在浏览器里输入 chrome://version/ 这个链接来查看版本(自己使用的是谷歌浏览器)。下面第一栏就是版本信息。2.2 选择合适的driver进行下载,下载地址:http://chromedriver.storage.googleapis.com/index.ht

2021-03-02 15:40:39 395

原创 Python -- Pandas:根据列数据取多行

lt = [['zoo',2],['foo',1],['zff',2],['zoo',6],['dff',0]]df = pd.DataFrame(lt, columns=['string','int'])dfstring int0 zoo 21 foo 12 zff 23 zoo 64 dff 0df[ df['string'].isin( ['zoo','zff'] ) ] # 一列数据满足多个值的行string int0 zoo 22 zff 23 zoo 6df

2021-01-08 17:08:47 1909

原创 Python -- Pandas:读取时间序列的某些年月日的行

ts = pd.Series(np.random.rand(30))ts.index = pd.date_range('2013-05-01', periods = 30, freq='q')ts.head()2013-06-30 0.6301272013-09-30 0.6498872013-12-31 0.5554492014-03-31 0.1726442014-06-30 0.375650Freq: Q-DEC, dtype: float64ts[

2021-01-08 16:53:29 990

原创 Python - Seaborn:画出一数值列的概率分布曲线及中位数线、平均数线

生成偏态分布的代码:import seaborn as snssns.set()import matplotlib.pyplot as plt# s:一个数值型的 Seriessns.kdeplot(s, shade=True) # 给出 s 的概率密度曲线plt.axvline(s.mean(), label='mean',linestyle='-.', color='r')plt.axvline(s.median(), label='median',linestyle='-.',.

2020-12-22 14:18:07 2597

原创 CNN 卷积神经网络笔记(一)- 基本介绍

CNN 最擅长的是处理图片。图像由像素组成,每个像素又有颜色构成。比如,一张像素1000x1000x3的RGB图片,若用传统的神经网络(只有全连层),会有3百万的参数。这样处理起来,会非常费资源,又耗时,效率很低。而CNN就是将问题‘复杂简单化’,通过卷积降低数据维度,再作全连层处理。在大部分场景下,降维并不会影响结果。比如,1000像素的图片缩小成200像素,并不影响肉眼认出来图片中是一只猫还是一只狗,机器也是如此。基本原理典型的CNN有3个部分构成:卷积层负责提取图像局部特征池化层用来

2020-12-22 13:50:58 1234

原创 时间序列模型ARMA/ARIMA(二)

文章目录时序特点时序模型的前提时序模型的自相关图和偏自相关图时列模型训练&检验&预测模型评价时序特点一系列相同时间间隔的数据点只有一列数据,没有变量与变量之间的关系 线性回归中,有自变量和因变量数据在时间上有相关性,即前后相关 线性回归中,数据点间相互独立用历史数据预测未来数据时序模型的前提平稳性 数学上,时序的期望和方差基本上不随时间变动。 时序图上,数据点围绕一个常数上下波动。 统计学上,p-value 是否小于显著水平

2020-11-19 21:12:44 849

原创 Python -- Sklearn:MinMaxScaler(将数据预处理为(0,1)上的数)

方法一:自定义处理# 将数据scale为(0,1)间数据scaled_df = (df - df.min()) / (df.max()-df.min()) # 将(0,1)间数据scale回原来的范围scaled_df * (df.max() - df.min()) + df.min()方法二:MinMaxscalerfrom sklearn.preprocessing import MinMaxScalerscaler = MinMaxScaler(feature_range=(0,

2020-11-16 17:57:24 10362

原创 Python -- Numpy:添加一列

np.insert 指定位置添加一列a = np.arange(12).reshsape(3,4)print(a) array([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]]) b = np.ones(3)print(b)array([1., 1., 1.])np.insert(a,0,b,axis=1)array([[ 1, 0, 1, 2, 3], [ 1

2020-11-12 12:45:42 23868 1

原创 Python -- Pandas:DataFrame上添加新列

方法一在所有列后面添加新列df['新列名'] = new_value # new_value:列表 or 1d_array or Series方法二在指定位置添加新列,且直接修改原数据框&不返回值df.insert( int, '新列名', new_value) # int:指定位置的位置索引(从0开始的数字)# 新列名、new_value:同上...

2020-11-12 11:15:02 8463

原创 Python -- Matplotlib:解决标签(xlabel/ylabel)或标题(title)的中文显示问题

1. 解决标签的中文显示问题# 这里的 `Microsoft YaHei` 可以换成其它的中文字体# plt.xlabel/ylabel 中的中文标签会自动显示plt.rcParams['font.sans-serif'] = ['Microsoft YaHei']2. 解决标签的中文显示问题from matplotlib.font_manager import FontPropertiesfont_set = FontProperties(fname=r"C:\Windows\Fonts\s

2020-11-10 10:32:44 2016

原创 Python -- Matplotlib:画一条水平线或竖直线

竖直线# 画出 x=2 这条垂直线plt.axvline(2) 点击此链接axvline查看帮助文档水平线# 画出 y=1 条水平线plt.axhline(1) 点击此链接axhline查看帮助文档

2020-11-10 09:41:53 58491 1

原创 Python -- jupyter notebook的常用快捷操作

文章目录Ctrl系列Esc系列Shift系列运行一劳永逸Ctrl系列 Ctrl + /对选中的未注释的内容,加注释。对选中的已注释的内容,取消注释。 Ctrl + [选中内容,批量向左缩进。 Ctrl + ]选中内容,批量向右缩进。 Ctrl + A一次性全选中一个cell中的内容。 Ctrl + Z撤销刚删除的内容。Esc系列 Esc + A、B当前的cell上、下面添加新的cell。 Esc + X删除当前cell。 Esc + Z恢复被删除的cell。 E

2020-11-09 10:50:26 862

原创 Python -- 安装与卸载(解决了tensorflow的安装问题)

文章目录Python安装Python卸载Python安装点击链接https://www.python.org/downloads/进入下载页面选择与自己的电脑匹配的操作系统进入与此系统匹配的各个版本的Python包,然后选择对应位数的executable installer版本(我自己的是windows,这里是对windows的Python包。x86-64是64位,x86是32位)然后下载安装包即可 安装的时候环境变量要选择设置,其它的均为默认设置注: pip是

2020-11-08 14:04:41 2456 1

原创 Python -- Matplotlib:设置画布大小和子图个数

只有一个子图时plt.figure() #

2020-11-05 22:29:36 30036 3

原创 描述性统计 -- 偏态分布

三个描述性统计量 均值(mean)唯一(序列的所有值的和除以序列的数值总个数)用于连续数据易受极端值的影响 中位数(median)唯一(序列从小到大排序后中间的一个数据)不易受极端数据的影响 众数(mode)不唯一一般用于分类数据不易受极端数据的影响偏态分布 用均值、中位数、众数三者的位置关系判定和查看用中位数查看将数据一分为二(中位数的位置),哪边数据少,就是往哪边偏。用众数描述众数位置哪边尾巴长,就是往哪边偏。 数据分布往哪边偏,均值被

2020-11-05 13:03:44 6902

原创 Python -- Numpy:数据排序

sorted# 返回排好序的一维数组;不修改原数组sorted(1d_arr) sort# 不返回值;直接将原数组排序1d_arr.sort()1d_arr np.sort# 返回排好序的数组;不修改原数组np.sort(arr, axis=-1)# axis:设置排序的轴向arr是一维时,同sortedarr是二维时,沿axis=1方向arr是三维及以上时,沿最后一个轴向...

2020-11-04 22:39:47 1132

原创 Python -- Pandas: pivot_table用法

文章目录pivot_table用途pivot_table用途参数

2020-11-04 22:21:11 1836

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除