数据分析
文章平均质量分 78
想七想八不如11408
一只积极进取的菜鸟
展开
-
【正则表达式】入门
但是我们只想要得到里的内容以便处理数据时删去,要怎么办呢?加上问好即可把贪婪匹配转化为懒惰匹配,原创 2024-06-18 22:16:56 · 662 阅读 · 0 评论 -
【Python】【Scrapy 爬虫】理解HTML和XPath
一个 URL 由不同的部分组成,其中一些是必须的,而另一些是可选的。http是协议。它表明了浏览器必须使用何种协议。它通常都是 HTTP 协议或是 HTTP 协议的安全版,即 HTTPS。Web 需要它们二者之一,但浏览器也知道如何处理其他协议,比如(打开邮件客户端)或者(处理文件传输)。是域名。它表明正在请求哪个 Web 服务器。或者,可以直接使用IP address,但是因为它不太方便,所以它不经常在网络上使用。:80是端口。它表示用于访问 Web 服务器上的资源的技术“门”。原创 2024-05-25 19:30:16 · 894 阅读 · 0 评论 -
【应用多元统计分析】--多元数据的描述和展示(R语言)
我们用协方差来刻画两个变量的相关关系,这里指的是线性相关关系。对于一元随机变量的可视化最简单的就是散点图,大致可以看出X和Y之间的相关关系。如果想更好的看X、Y之间的相关关系,可以画二维的散点图。总结:均值描述随机变量的中心方差描述随机变量的离散程度协方差和相关系数来描述变量之间的线性关系用散点图去描述两个变量的相关关系。原创 2024-03-07 22:13:38 · 621 阅读 · 0 评论 -
【应用多元统计分析】--数据矩阵及R语言表示
在多元分析中,数据通常以矩阵的形式出现,下面结合R语言介绍基本的。主要包括:创建矩阵向量,矩阵加减、乘积,矩阵的逆,行列式的值,特征值与特征向量,QR分解,奇异值分解,取矩阵的上下三角元素,向量化算子等。原创 2024-03-02 13:26:05 · 567 阅读 · 0 评论 -
【应用多元统计分析】--多元数据的直观表示(R语言作图)
例1.2 为了研究全国31个省、市、自治区2018年,根据调查资料做区域消费类型划分。指标:食品x1:人均食品支出(元/人)衣着x2:人均衣着商品支出(元/人)居住x3:人均居住支出(元/人)生活x4:人均家庭设备用品及服务支出(元/人)交通x5:人均交通和通讯支出(元/人)教育x6:人均娱乐教育文化服务支出(元/人)医疗x7:人均医疗保健支出(元/人)其他x8:人均杂项商品和服务支出(元/人)地区x1x2x3x4x5x6x7x8北京8064.92175.5。原创 2024-02-29 22:01:19 · 1743 阅读 · 0 评论