笔记
文章平均质量分 73
py爱好者~
失去了你的我,获得了很多很多
展开
-
主成分分析(PCA)入门
首先考虑一个问题:对于正交属性空间中的样本点,如何用一个超平面(直线的高维推广)对所有样本进行恰当的表达?可以想到,若存在这样的超平面,那么它大概具有这样的性质:1两大依据最大可分性:样本点在这个超平面上的投影能尽可能的分开最近重构性:样本点到这个超平面的距离足够近目标:希望将这 m个数据的维度从 n维降到 n` 维,希望这 m 个 n` 维的数据集尽可能的代表原始数据集。2..基变换一般来说,欲获得原始数据新的表示空间,最简单的是对原始数据进行线性变换(基变换):其中 Y是样本原创 2022-02-28 00:15:35 · 240 阅读 · 0 评论 -
方差分析笔记
1 方差分析概述1.1 方差分析简介方差分析(analysis of variance,ANOVA)最早由英国统计学家R. A. Fisher 提出,主要用于两个及两个以上样本均数差别的显著性检验。通过检验多个总体均值是否相等来判断是否有显著影响,即通过分析数据的误差判断各总体均值是否相等。特点:方差分析可同时分析多个样本,提高检验效率;将所有信息结合在一起,增加了分析的可靠性。1.2 方差分析基本思想和原理方差分析的基本思想和原理基于两类误差。也就是随机误差和系统误差1。• 随机误差—原创 2022-02-28 00:07:36 · 655 阅读 · 0 评论 -
线性分析入门
一、回归算法:(1)机器学习监督学习算法分为分类算法和回归算法;回归算法运用于连续型分布预测,针对的是数值型的样本(2)回归分析中包括因变量和自变量(3)回归分析分为一元线性回归分析和多元线性回归分析二、一元线性回归:(1)、线性回归,是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法一元线性回归通用公式为:(2)实例:导入模块:from sklearn import linear_modelimport numpy as npimport m原创 2022-02-28 00:04:36 · 536 阅读 · 0 评论 -
Scipy入门
一、scipy中io模块使用import scipyimport numpy as npimport matplotlib.pyplot as pltfrom scipy import io#用io模块写入数据a = np.arange(7)io.savemat('a.mat',{'array':a})data = io.loadmat('a.mat')print(data['array'])[[0 1 2 3 4 5 6]]二、scipy中stats子模块产生符合特定规律的随机数f原创 2022-02-27 23:58:59 · 672 阅读 · 0 评论 -
numpy、pandas、matplotlib常用
一、numpyNumerical Python,即数值Python,是Python进行科学计算的一个基础模块。ndarray即N维数组,是numpy模块的核心数据结构。用多维数组计算,非常便捷高效并且可以节省空间。导入numpy库:import numpy as np,并取了一个更简略的别名,在调用库函数时,通过在函数名前加np.即可调用:np.function_name()。1、构造一维数组import numpy as npa = np.array([1,2,3,4]) ...原创 2022-02-27 23:44:23 · 398 阅读 · 0 评论 -
python爬虫学习笔记之数据存储
1、json文件处理:1.01、什么是json:JSON(JavaScript Object Notation,JS对象标记)是一种轻量级的数据交换格式。它基于ECMAScript(w3c制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁欸和清晰的层次结构使得JSON成为理想的数据交换语言。易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。1.02、JSON支持数据格式:对象(字典)。使用花括号。 列表(数组)。使用方括号。 整型、浮点原创 2021-11-30 23:37:39 · 1310 阅读 · 0 评论 -
python爬虫学习笔记之数据提取
1、XPath语法和lxml库1.01、什么是XPath?xpath(XML Path Language)是一门在XML和HTML文档中查找信息的语言,可用来在XML和HTML文档中对元素和属性进行遍历。1.02、XPath工具Chrome插件XPath Helper。 Firefox插件XPath Checker。1.03、XPath语法:选取节点:XPath使用路径表达式来选取XML文档中的节点或者节点集原创 2021-11-30 23:43:34 · 6263 阅读 · 0 评论 -
python爬虫学习笔记之网络请求
参考博客:python爬虫学习笔记_fdk少东家的博客-CSDN博客'requests'库安装和文档地址:利用pip进行安装:pip install requests中文文档:Requests: 让 HTTP 服务人类 — Requests 2.18.1 文档发送GET请求:1.最简单的发送get请求就是通过requests.get来调用:response = requests.get('http://www.baidu.com')2.添加headers和查询参数:如原创 2021-11-30 21:11:48 · 980 阅读 · 0 评论