![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 63
最低调的奢华
忽有故人心上过,回首山河已是秋。
恍惚半生烂若泥,连哭都怕失了礼。
展开
-
时间序列的创建,差分,转换为timestamp ,从表格提取固定时间数据,以及ARIMA模型的构建和预测
选取ARIMA模型p,d,q参数,将表格中时间列转换为时间序列数据,创建ARIMA模型进行差分预测原创 2022-11-14 11:04:59 · 1231 阅读 · 1 评论 -
标准化,归一化,二值化,One-Hot,卡方检验选取重要特征,主成分分析,缺失值和异常值处理
python特征处理和选择 缺失值异常值重复值处理,卡方检验,归一化标准,二值化,One-Hot编码等处理原创 2022-10-17 18:12:28 · 3011 阅读 · 7 评论 -
concat,merge表格的拼接,concatenate数组的拼接以及数组添加列和行
concat,merge,concatenate,数组等操作原创 2022-09-28 11:35:41 · 1518 阅读 · 0 评论 -
time,datetime模块时间序列讲解
time datetime 时间序列以及在表格中取出某段时间的列原创 2022-08-30 15:18:04 · 715 阅读 · 0 评论 -
python提取pdf文件数据
提取pdf文件数据内容原创 2022-07-20 11:32:04 · 5004 阅读 · 5 评论 -
Pandas统计计算和描述
对DataFrame表格中的数据进行统计计算原创 2022-06-21 11:40:01 · 466 阅读 · 0 评论 -
最小二乘法,梯度下降法,sklearn中API来实现线性回归
导入模块import numpy as npimport pandas as pdfrom matplotlib import pyplot as plt1.导入训练集数据x = np.array([0.86, 0.96, 1.12, 1.35, 1.55, 1.63, 1.71, 1.78])y = np.array([12, 15, 20, 35, 48, 51, 59, 66])def fit(x,y): if len(x) != len(y): retu.原创 2022-01-24 19:39:30 · 1337 阅读 · 0 评论 -
机器学习之特征的抽取,特征预处理,以及特征的选择,归一化标准化主成分分析来进行特征处理
1.特征抽取1.字典数据的抽取首先导入APIfrom sklearn.feature_extraction import DictVectorizerdef dictvec(): """ 字典数据抽取 :return: """ # 实例化 dict1 = DictVectorizer() # 调用fit_transform data = dict1.fit_transform( [{'city': '北京', 't原创 2022-01-16 16:46:49 · 809 阅读 · 0 评论 -
pandas中groupby分组
import numpy as npimport pandas as pd导入模块df1 = pd.DataFrame({'fruit':['apple','banana','orange','apple','banana'], 'color':['red','yellow','yellow','cyan','cyan'], 'price':[8.5,6.8,5.6,7.8,6.4]})df11.求苹果的平原创 2022-01-13 20:27:03 · 463 阅读 · 0 评论 -
csv ,TXT ,Excel 以及数据库的保存和读取
导入pandas numpy 模块import numpy as npimport pandas as pd1.csv文件的读取和保存1.csv文件的读取chunksize=None 可以选择读取多少条df = pd.read_csv('上课数据/ex1.csv',engine='python') df2.让列索引变为第一行(header=None)engine=‘python’ 指定解释器sep=’,’ 指定分隔符df = pd.read_csv('上课数据/e.原创 2022-01-13 14:32:10 · 1248 阅读 · 0 评论 -
并行多图,顺序多图,选项卡地图,时间线轮播图的动态图片的绘制
1.并行多图from pyecharts import options as optsfrom pyecharts.charts import Bar, Geo, Gridfrom pyecharts.faker import Fakerbar = ( Bar(init_opts=opts.InitOpts(width="200px",height="300px")) .add_xaxis(Faker.choose()) .add_yaxis("商家A", Faker.v原创 2021-12-30 23:51:58 · 1681 阅读 · 0 评论 -
numpy数组拼接
1.数组的拼接1.行的拼接vstack方法import numpy as npa1 = np.random.randint(1,100,size = (3,4))a2 = np.random.randint(1,100,size = (1,4))a1array([[26, 8, 77, 22], [40, 84, 89, 88], [46, 14, 66, 40]])a2array([[ 4, 88, 85, 55]])将俩个行不相同列相同的数组进行原创 2021-10-11 13:43:59 · 307 阅读 · 0 评论 -
numpy的函数应用,生成随机数
1.生成[0,1)的随机数import randomrandom.random()# 生成一个随机的大于等于0小于1的数0.9974875675350712.生成随机的二维数组import randomnp.random.random((3,4))# 生成随机的三行四列的二维数组array([[0.22346273, 0.31560513, 0.12086595, 0.7976233 ], [0.48278617, 0.44617591, 0.67508186, 0.809原创 2021-10-10 14:22:47 · 1502 阅读 · 0 评论 -
numpy的数组多维度转化及其创建
1.numpy数组里面只有一种数据类型,如果既有整型又有字符串,那么都会变成字符串,如果既有整型又有浮点型,都会变成浮点型1.numpy运行速度之所以快是由c语言编写的,数据类型需要我们命名所以运算速度快1.浮点型创建数组import numpy as npa = np.array([1,2,3,1.5])a2.整型创建数组a = np.array([1,2,3])a3.字符串创建数组a = np.array(‘123’)a4.从头创建数组a原创 2021-09-24 12:59:27 · 2156 阅读 · 0 评论