自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(146)
  • 收藏
  • 关注

原创 写静态页面5——粘性定位练习

* 首先是相对定位,top是0,left是0,到达临界值,就是绝对定位,top是0,left是0 *//* 粘性定位的前提是有滚动条 */

2024-01-31 23:31:57 368

原创 写静态页面4——浮动练习

0、效果:1、html代码:<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>浮动练习</title> <link rel="stylesheet"

2024-01-31 22:01:06 733

原创 写静态页面3——魅族导航_前端页面练习

【代码】写静态页面——魅族导航_前端页面练习。

2024-01-28 18:31:28 320

原创 写静态页面2——魅族声学_前端页面练习

1、效果:1、html代码:<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>魅族声学</title> <link rel="stylesheet"

2024-01-26 19:57:18 688

原创 写静态页面1——前端总结

CSS特点:继承性(后代可以从前一代继承自己没有的样式设定)、层叠性(一个元素可多次设置同一个样式,优先级相同的最后的生效,优先级不同的优先级高的生效)CSS语法:选择器 { 属性 : 值;属性 : 值;属性 : 值;CSS引入方式:内联样式(也称行内样式):通过style标签属性,将样式属性写在标签里。内部样式:在< head >中通过< style >标签用CSS语法写样式。

2024-01-26 16:54:01 1152

原创 GSEQ行为序列分析软件学习汇总

GSEQ是一款交互序列分析软件,通过这款软件,我们可以将编码之后的交互行为之间的关系,通过力导向图绘制出来,这样就可以知道每个编码行为之间的相关性了,举例来说就是通过这款软件分析你提供的行为编码序列,就能分析出来某个行为之后大概率会出现哪个行为,因此这款软件常用于分析教学行为的相关性。

2024-01-11 14:04:23 1160

原创 什么是显著性分析

这部分知识的学习主要是为了丰富大论文内容,添加一些关键实验。这部分内容中主要参考了“小破站”邵利民老师的课程内容(一键三连)事件通过一个检验统计量(test statistic) T来描述原假设(null hypothesis): 事件源自随机因素根据T的分布确定大概率事件和小概率事件的区间, “大概率”称为“置信度” (confidence, P);“小概率” 称为“显著性水平" (significance level, α);P+ α= 1。

2023-10-28 18:16:20 1108

原创 08_selenium实战——学习平台公开数据批量获取

要求1:可以控制爬取视频的主题(爬取主题搜索之后的内容)要求2:可以控制爬取视频的数量要求3:对于评论数不足5条的用0填充评论内容。

2023-10-07 09:11:53 177

原创 推荐算法——Apriori算法原理

首先名字别读错:an pu ruo ao rui 【拼音发音】Apriori是一种推荐算法推荐系统:从海量数据中,帮助用户进行信息的过滤和选择。主要推荐方法有:基于内容的推荐、协同过滤推荐、基于关联规则的推荐、基于知识的推荐、混合推荐。关联分析:是一种在大规模数据集中寻找有趣关系的非监督学习算法,是利用一些有趣性的量度来识别数据库中发现的强规则。

2023-09-28 16:25:26 1310

原创 机器学习——seaborn实用画图方法简介

前言:下面的总结只是介绍seaborn有哪些方法和属性,至于具体使用,通过下面给出的名称稍作查找即可。重点应该关注本文介绍的seaborn的使用方法从结果可以看出,周日来的抽烟人比较多,周五来的抽烟的人相对较少。小提琴图【小提琴图的最外围的形状展示了该位置的密度,数据在哪里分布密度高,哪里分布密度低。with sns.axes_style('whitegrid'): # 将第三个维度整合分为一边一半同样的从结果可以看出,周日来的抽烟人比较多,周五来的抽烟的人相对较少。

2023-09-25 20:55:14 573

原创 机器学习项目——泰坦尼克号乘船幸存者分类模型

【代码】机器学习项目——泰坦尼克号乘船幸存者分类模型。

2023-09-22 14:57:26 127

原创 机器学习——特征工程和评价指标

首先学习特征工程这部分知识之前,要对机器学习的算法用过使用。

2023-09-20 21:42:44 421

原创 数据分析回头看2——重复值检查/元素替换/异常值筛选/元素查找

这部分内容是对Pandas的回顾,同时也是对Pandas处理异常数据的一些技巧的总结,不一定全面,只是自己在数据处理当中遇到的问题进行的总结。

2023-09-20 17:29:32 516

原创 机器学习——pca降维/交叉验证/网格交叉验证

【代码】机器学习——pca降维/交叉验证/网格交叉验证。

2023-09-20 14:16:31 364

原创 机器学习——聚类算法

机器学习聚类算法主要就是两类:K-means和DBSCAN聚类:一种无监督的学习,事先不知道类别(相当于不用给数据提前进行标注),自动将相似的对象归到同一个簇中。

2023-09-19 16:48:46 440 2

原创 机器学习——SVM(支持向量机)

SVM应用:主要针对小样本数据进行学习、分类和回归(预测),能解决神经网络不能解决的过学习问题,有很好的泛化能力。(注意:SVM算法的数学原理涉及知识点比较多,所以应用比理解更重要)原理:由二分类问题引出,如下图,问题是找到一条最宽的路劲划分两种分类,且路径1/2处的直线就是最优的直线。

2023-09-18 15:53:50 374

原创 机器学习——决策树/随机森林

决策树可以做分类也可以做回归,决策树容易过拟合决策树算法的基本原理是依据信息学熵的概念设计的(Logistic回归和贝叶斯是基于概率论),熵最早起源于物理学,在信息学当中表示不确定性的度量,熵值越大表示不确定性越大。

2023-09-17 14:06:17 1081 1

原创 机器学习——贝叶斯(三种分布)/鸢尾花分类分界图/文本分类应用

机器学习中的贝叶斯的理论基础是数学当中的贝叶斯公式。这篇博客强调使用方法,至于理论未作深究。机器学习中三种类型的贝叶斯公式:高斯分布(多分类)、多项式分布(文本分类)、伯努利分布(二分类任务)贝叶斯算法优点:对小规模数据表现好,能处理多分类任务,常用于文本分类。缺点:只能用于分类问题。

2023-09-14 21:06:49 902

原创 机器学习——生成分类数据的坐标系边界需要用到的技术方法

如果遇到一种应用场景需要将x轴数据和y轴数据所有点映射到坐标系中,需要得到坐标系中x和y映射的坐标点,就要用到meshgrid把x和y映射到坐标系中,然后把得到的结果用ravel把结果转成一维的。用np.c_()把x数据和y数据堆叠在一起,就可以用来输入模型做训练。

2023-09-10 15:12:43 321

原创 机器学习——Logistic Regression

Logistic回归是解决分类问题的一种重要的机器学习算法模型在使用Logistic模型时,要根据数据集大小调整模型优化算法。通过实验发现,Logistic回归算法训练时间比KNN要长,但是预测时间要比KNN短。

2023-09-09 13:48:28 241

原创 机器学习——图片处理应用(人脸补全)

意义1:通过该项目掌握图片数据在机器学习当中的处理方法意义2:通过该项目可以掌握多个机器学习算法模型对比实验的应用方法概念1。

2023-09-07 20:34:01 344

原创 机器学习——线性回归/岭回归/Lasso回归

线性回归会用到python第三方库:sklearn.linear_model中的LinearRegression导入第三方库的方法:from sklearn.linear_model import LinearRegression使用LinearRegression(二维数据,一维数据)进行预测,其中数据类型可以是pandas中的DataFrame或者series,也可以是numpy中的array数据,但维度一定要正确输入。

2023-09-03 10:42:30 974

原创 机器学习——手写数字识别

这篇文章能够帮助你从数据到模型的整个过程实现不过至于安装第三方库等基础问题,本文不涉及,因为确实不难,搜一搜一大把本此实验运行环境为jupyter,当然通过pycharm也是可行的。

2023-08-30 10:56:43 1830

原创 机器学习——KNN回归

【代码】机器学习——KNN回归。

2023-08-28 14:59:01 726

原创 机器学习——KNN算法/机器学习模型的保存和加载

K近邻算法思想:有N个样本分布在m个类别中,要判定第x个样本为什么类别,就要求出x到N个样本每个样本的距离集合,从中找出K个最近的样本,然后通过k个样本的比例判断x所属类别,例如在k个样本中第一类占比较多,就判定x是第一类数据。KNN算法是机器学习算法中用于分类或者回归的算法,KNN全称为K nearest neighbour(又称为K-近邻算法)原理:K-近邻算法采用测量不同特征值之间的距离的方法进行分类。可以看出,曼哈顿距离计算复杂度较低,计算速度快。缺点:时间和空间复杂度高。

2023-08-27 20:22:43 1719

原创 数据分析15——office中的Excel基础技术汇总

这部分总结就是总结每个基础技术的定义,在了解基础技术名称和定义后,方便对相关技术进行检索学习。笔记不会详细到所有操作都说明,但会把基础操作的名称及作用说明,可自行检索。为什么要安装office的excel,而用wps不行?因为数据分析中excel是个重要的工具,wps中缺乏一些专业功能,或者说大多数人更喜欢白P,而WPS看似白P,实则付费,excel看似付费,但破解之后可以完美白P所有功能。保护设置:1、保护工作簿:将整个excel文件进行加密。

2023-08-18 14:04:59 1148

原创 深度学习入门知识总结

定义:感知机接收多个输入信号,输出一个信号,这里的信号理解为电流或者河流具备流动性的东西。感知机信号只有1/0两种取值(流/不流)用感知机可以实现“与门、与非门、或门”,但是无法直接实现“异或门”感知机的局限性就在于它只能表示由一条直线分割的空间可以通过“与门、与非门、或门”叠加实现异或门,以下是2层感知机实现“异或”门多层感知机的作用巨大:理论上用两层感知机就可以实现计算机的功能,感知机通过叠加层能够实现非线性表示。多层感知机就可以看作是神经网路了。

2023-07-09 20:31:05 259

原创 配置tensorflow1.15版本遇到的问题:conda环境管理/tensorflow历史版本下载/pycharm中如何使用conda中的虚拟环境

我之前在做配置环境,或者不懂的操作时,总是遇到问题在csdn或者网上搜就行了,然后解决问题之后,也不知道期间搜了哪些知识。也记不住一些修改的地方,这就导致,我十分担心好不容易搭好的环境奔溃掉,然后又是重新搜一遍,就很麻烦。而且有时候别人给的方法和答案对于我的问题而言完全不适用,举个例子,csdn中有人说新建conda虚拟环境的指令是:“conda create -name 虚拟环境的名字 python=虚拟环境中python的版本,然后我这么写就会一直报错,直到我把-name改成-n时,才能安装。

2023-07-06 14:39:52 562

原创 常用conda命令以及在jupyter中如何管理内核

第二步:在对应虚拟环境下运行下面代码,记得把display_name改成你想要这个环境在jupyter内核中显示的名称。第一步:在没有jupyter的环境中下载ipykernel:conda install ipykernel。

2023-07-04 20:22:21 991

原创 数据分析回头看1——Pandas中数据处理总结

pandas中series数据:series数据是一维数组,它有对应的索引(index)和数据(data)两部分组成,在初始化的时候可以不传index,只传data进去,注意不论是index还是data都是通过列表传入的数据,index默认是从0开始,你也可以自己传了index列表,index列表中不一定是数字,也可以是字符串。一般使用pandas就直接使用DataFrame,因为一维数组也可以用其表示,且一维的DataFrame可以转化为。

2023-06-29 16:04:43 503

原创 07_scrapy的应用——获取电影数据(通过excel保存静态页面scrapy爬虫数据的模板/通过数据库保存)

一般我们自己创建的一些python项目,我们都需要创建虚拟环境,其中会下载很多包,也叫做依赖。但是我们在给他人分享我们的项目时,不能把虚拟环境打包发送给别人,因为每个人电脑系统不同,我们可以把依赖导出为依赖清单,然后别人有了我们的依赖清单,就可以用一条指令把我们的依赖下载到它的项目环境中,这样就能快速运行和部署python项目了在终端中生成依赖清单的指令:pip freeze > requirements.txt。

2023-06-12 20:50:30 1571

原创 06_Scrapy爬虫框架

下载Scrapy的过程中报错了,之前我的pip是换过的源的,今天没办法又给conda换了源头,也搞清楚了一个用pip指令下载用的是pip的源,用conda指令下载使用的是Anaconda的源。最终今天是通过conda install scrapy下载的scrapy。其实换源的目的是为了下载方便一些,如果你不嫌麻烦,可以记下几个常用的源(清华、百度),然后不论是使用pip还是使用conda的时候,都指定一下源,就可以下载了。

2023-06-12 16:25:46 2327

原创 05_lxml模块介绍/通过XPath从html和xml中提取数据/二手房爬虫练习

一、什么是lxml模块lxml是python语言中用于处理xml和html的功能最丰富最完善最简单的模块。它利用XPath就可以实现从xml或者html中解析数据。lxml模块安装指令:pip install lxml二、什么是xml?xml指可拓展标记语言,xml是一种很像html的标记语言。但是xml和html完全属于两个领域的内容。html用于从网页显示数据,xml用于在网络中传输和存储数据。三、什么是XPath?XPath是一门在XML和HTMl文档中查找信息的语言。

2023-06-11 19:39:38 1150

原创 04_两种常见的网页反爬措施及应对方法

注意:截图一定要选最小刚好包含验证码的标签。

2023-06-09 21:00:38 1159

原创 03_selenium模块的学习和应用/阶段总结

文档这部分知识和爬虫之间的关系:第三方模块selenium适合动态页面爬取,当然静态页面也可以用selenium来爬。简介:selenium自动化测试工具selenium是一个用于web程序测试的工具,selenium是直接运行在浏览器中的,能够像真正的用户一样操作浏览器。支持IE浏览器、谷歌浏览器、Edge、火狐浏览器、Safari浏览器、欧鹏浏览器等。selenium主要用来解决爬虫中的JavaScript渲染问题。

2023-06-07 15:18:30 1377

原创 03_tqdm模块简介/API接口抓取/JSON数据/静态网页和动态网页

说明:python中的进度条模块,该模块一般使用在for循环中,注意如果使用该模块就不能够在该模块执行期间使用print下载指令:pip install tqdm使用举例from tqdm import tqdm for i in tqdm(range(1 , 10000001) , desc = '这是一个进度条') : # pass关键字:保证结构的完整性,不参与程序执行。pass该模块可以用在一些大型的python爬虫任务中,用于显示爬虫的爬取进度。

2023-06-06 15:45:30 459

原创 02_BeautifulSoup4模块简介与使用/数据持久化

本质:python的一个第三方库作用:在获取到网页源代码的前提下,在HTML文件或者XML文件中提取数据。安装指令:pip install BeautifulSoup4安装说明:除了上面的指令安装之外,还可以用pycharm中的图形化安装界面安装使用BeautifulSoup方法针对网页源代码进行文档解析,返回一个BeautifulSoup对象(本质:树结构),这个解析过程需要解析器。

2023-06-05 15:58:19 543

原创 01_爬虫基础知识和requests模块简介

requests模块作用: 向网站所在服务器发送请求,得到响应结果。安装指令:pip install requests说明:如果在pycharm中通过terminal安装,首先在setting中把terminal的路径改成cmd.exe,这样就能在pycharm看到自己当前在pycharm中的虚拟环境了。然后在terminal中执行上面指令,就能够安装requests模块了。

2023-06-04 21:31:34 1069

原创 前后端交互模型&http协议&Ajax简介

前端发送请求,后端响应请求。除了http协议还有一些其他协议,比如TCP协议是应用在游戏当中的,还有UDP协议。是一种可以创建交互网页开发的网页开发技术,可以使网页与服务器数据进行局部交互。特点是可以通过异步请求实现。流程:通过Ajax制作网络异步或同步请求——对获取得到数据(一般是json格式)作解析——对解析得到的数据通过js操作嵌入到网页标签中。

2023-06-01 20:11:30 420

原创 数据分析14——Pandas中的时间序列

可以查看pandas文档。

2023-05-20 18:24:34 190

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除