数据分析
文章平均质量分 60
FakeOccupational
这个作者很懒,什么都没留下…
展开
-
向量数据库:Milvus
Milvus由Go(63.4%),Python(17.0%),C++(16.6%),Shell(1.3%)等语言开发开发,支持python,go,java接口(C++,Rust,c#等语言还在开发中),支持单机、集群部署,支持CPU、GPU运算。。。原创 2024-01-09 15:27:54 · 2276 阅读 · 0 评论 -
向量数据库:usearch的简单使用+实现图片检索应用
向量数据库usearch的简单使用和试用其实现图片查询应用原创 2024-01-07 20:19:24 · 1669 阅读 · 0 评论 -
向量数据库:faiss的IndexPQ中PQ的图解+实现质心表的融合
中包含pq对象中包含。其尺寸布局为 M * ksub * dsub:(M、ksub、dsub)(8,256,8)2n质心表中的具体数值。原创 2024-01-06 20:54:30 · 921 阅读 · 3 评论 -
向量数据库:faiss的常用三种数据索引方式(IndexFlatL2,IndexIVFFlat,IndexIVFPQ)的使用和持久化+索引融合的实现及库函数解读
向量数据库:faiss的常用三种数据索引方式(IndexFlatL2,IndexIVFFlat,IndexIVFPQ)的使用和持久化,索引融合的实现及库函数解读原创 2024-01-05 13:36:34 · 10494 阅读 · 0 评论 -
python爬虫与测试+视频文件处理
猫眼电影。pyimport requestsfrom lxml import etreeimport jsondef getonepage(n): url=f'http://www.6m5m.com/shop_list-page_size-20-path-S8A441-page-{n}.html' #要以http开头 f引导 {}占位符 #url='http://www.baidu.com={}'.format(n) #url='http://www.baidu.c原创 2021-02-27 22:30:38 · 204 阅读 · 0 评论 -
python对一个文件夹中的文件重命名
# coding = 'utf-8'import osdef rename(path): i = 29 FileList = os.listdir(path) for files in FileList: os.rename( 'C:\\Users\\**\\Desktop\\pythonp\\chengxu\\aaa\\'+files,'C:\\Users\\**\\Desktop\\pythonp\\chengxu\\aaa\\原创 2021-02-27 21:57:11 · 267 阅读 · 0 评论 -
python 读取csv读取部分csv文件到新的文件
#打印前100行import csv#读取csv文件with open("C:\\Users\\****\\Desktop\\pythonp\\chengxu\\shuju\\yellow_tripdata_2010-01.csv", "r", encoding='UTF-8') as f: reader = csv.reader(f) i=1 for row in reader: if i<100:原创 2021-02-27 21:53:14 · 1004 阅读 · 0 评论 -
格子乘法与卷积-》卷积定理-》小波分析(暂记)
MALLET分解算法卷积定理是傅立叶变换满足的一个重要性质。卷积定理指出,函数卷积的傅立叶变换是函数傅立叶变换的乘积。具体分为时域卷积定理和频域卷积定理,时域卷积定理即时域内的卷积对应频域内的乘积;频域卷积定理即频域内的卷积对应时域内的乘积,两者具有对偶关系。...原创 2021-02-20 11:28:53 · 1010 阅读 · 0 评论 -
滤波与滤波器
滤波:滤波(Wave filtering)是将信号中特定波段频率滤除的操作,是抑制和防止干扰的一项重要措施,滤波分为经典滤波和现代滤波。百度百科滤波器:只允许一定频率范围内的信号成分正常通过,而阻止另一部分频率成分通过的电路,叫做经典滤波器或滤波电路。实际上,任何一个电子系统都具有自己的频带宽度(对信号最高频率的限制),频率特性反映出了电子系统的这个基本特点。而滤波器,则是根据电路参数对电路频带宽度的影响而设计出来的工程应用电路。百度百科...原创 2021-02-20 10:55:09 · 878 阅读 · 2 评论 -
自变量是分类变量的线性拟合+哑变量
哑变量 dummy variable(也相当于对数据分类)何时引入哑变量顺序变量如(高,中,低)可按比例引入值(如1,3,5)而分类变量,或连续变量的划分:(如:1-10,11-20,21-30……)则可引入哑变量引入哑变量后,可以降低De,拟合效果较好引入哑变量后,可以降低D_e,拟合效果较好引入哑变量后,可以降低De,拟合效果较好(男,女)⇒(0,1) (男,女)\Rightarrow (0,1) (男,女)⇒(0,1)(春,夏,秋,冬)以冬天为参照D1={1春0其他D2={1夏0其他D3原创 2020-11-05 18:44:50 · 3115 阅读 · 0 评论 -
GARCH暂记
在时间序列的弱平稳条件中二阶矩是一个不变的、与时间无关的常数。由于数据之间的联系,首先提出自回归的AR模型,当拟合效果不好或所需的阶数过大时----->对噪声进行滑动平均的模型MA模型和二者综合的ARMA模型《在时间序列分析的工程应用》一书中对建模的各种具体方法有详细的描述但真实的序列往往是随时间发生多重变化的(1). 非平稳性(nonstationarity,也译作不平稳性,非稳定性):即时间序列变量无法呈现出一个长期趋势并最终趋于一个常数或是一个线性函数(2). 波动幅度随时间变化(T原创 2020-10-12 19:18:34 · 179 阅读 · 0 评论 -
Logistic回归
当因变量Y有两个值:认同(1),否定(0)限制在[0,1]之中的函数有很多,常用的是logist和正态分布的分布函数P{y=1∣x}=P{(α+βx+ε)>0}=P{ε>−(α+βx)}设ε的分布是logist分布=P{ε>(α+βx)}=11+e−(α+βx)P\{ y=1|x\}=P\{ (α+ βx+ ε)>0\}\\=P\{ ε> -(α+ βx)\} \\ 设ε的分布是logist分布\\=P\{ ε> (α+ βx)\} =\frac原创 2020-10-08 13:02:11 · 138 阅读 · 0 评论 -
基于关联规则与可平面图的商品摆放规划-----实验报告
摘要: 本文先对northwind数据库介绍与数据描述与简单分析(数据异常值处理,订单地址的文本挖掘),然后对购买的商品使用关联规则算法,进行关联分析与商品的购买情况分析,由关联规则的发现结果,使用图论方法分析商品的摆放图。关键词: Northwind数据库;关联规则;可平面图;1. Northwind数据库数据介绍 图1 Northwind数据库的安装文件 执行文件中的SQL语句,此时在你的SQL Server原创 2020-09-07 15:58:13 · 860 阅读 · 0 评论 -
ARMA模型带拟合的程序暂存
function[ddb,bbb,aaa, e,pos,yucezhi]=armaminerrordainihe2(cD)%没有作平稳性检验 相关函数https://blog.csdn.net/chamyto98/article/details/5181623%以下为系统自带函数% edit arima% edit garchaaa=ones(50,500)*10000;bbb=ones(50,500)*10000;gaotie=cD;N=size(gaotie,1);for k=1:原创 2020-08-25 09:54:28 · 416 阅读 · 0 评论 -
差分处理
function [Y]=chafen(P)for i=2:length(P) %一次差分 Yt(i)=P(i)-P(i-1); end for i=1:length(P)-1 %一次差分 Y(i)=Yt(i+1); end end原创 2020-08-25 09:52:48 · 1498 阅读 · 0 评论 -
差分预测总程序
function yucezhi=chafenyuce2(gaotie,n)yuanzhi=gaotie;y_h_adf = adftest(gaotie);y_h_kpss = kpsstest(gaotie);if y_h_adf==1 &&y_h_kpss==0 a=0;elsefor i=1:n a(i)=gaotie(length(gaotie));gaotie=chafen(gaotie);y_h_adf = adftest(gaotie);y_h原创 2020-08-25 09:51:16 · 259 阅读 · 0 评论 -
ARIMA模型暂记
clear; % P=[66 64 60 58 17 49 34 17 8 53 15 15 45 57 33 42 8 52 24 29 -13 37 37 4 32 38 68 77 95 119 161 184 276 247 251 193 226 213 195 182 166 188 149 132 167 181 203 219 226 216 234 197 219 230 247 238 259 270 232 202 243 223 202 235 184 215 217 209 19原创 2020-08-25 09:48:59 · 384 阅读 · 0 评论