- 博客(163)
- 收藏
- 关注
原创 爬取深圳2024年链家二手房数据,共3000条数据(其他城市也可)
“可数据分析,机器学习,毕设等做数据支撑”。爬取深圳2024年链家二手房数据。
2024-05-08 16:45:06 2199 17
原创 基于随机森林和Xgboost对肥胖风险的多类别预测
此项目适合毕设和课设学习等等。代码可运行,有数据可视化,模型建立,准确率对比,模型检验。
2024-04-30 10:23:19 4612 42
原创 如何在 Windows上安装 Python
对于初学者和经验丰富的开发人员来说,Python 编程语言越来越受欢迎。Python 灵活且用途广泛,在脚本编写、自动化、数据分析、机器学习和后端开发方面具有优势。在本教程中,您将使用适用于 Windows 的 Python 安装程序在 Windows上安装 Python。
2024-04-08 09:36:25 9560 20
原创 正则表达式(2)
本节我们将了解-下正则表达式的相关用法°正则表达式是用来处理字符串的强大工具,它有自己特定的语法结构’有了它’实现字符串的检索、替换、匹配验证都不在话下°
2024-04-05 11:09:26 4151 5
原创 正则表达式(1)
本节我们将了解一下正则表达式的相关用法。正则表达式是用来处理字符串的强大工具,它有自己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证都不在话下。当然,对于爬虫来说,有了它,从HTML里提取想要的信息就非常方便了。
2024-04-03 10:30:42 6861 14
原创 基于XGBoost和数据预处理的电动汽车车型预测
***(很适合毕设和课程作业)***这组代码片段对通过华盛顿州许可部注册的纯电动汽车(BEV)和插电式混合动力汽车(PHEV)的数据集进行了各种分析。这些代码产生了一些见解,如按城市划分的电动续航里程统计数据、CAFV资格计数、电动汽车制造商的受欢迎程度、续航里程统计(最大、最小、平均)、电动汽车类型分布、按车型年份划分的采用趋势以及按县划分的采用情况。结果保存在CSV文件中,并通过条形图、折线图和饼图进行可视化。这些分析为华盛顿州的电动汽车前景和采用模式提供了宝贵的见解。
2024-03-27 11:29:48 6946 21
原创 python网络爬虫实战教学——requests的使用(2)
本节的requests库的基本用法就介绍到这里了,怎么样?有没有感觉它比urlib库使用起来更为方便。本节内容需要好好掌握,后文我们会在实战中使用requests库完成一个网站的爬取,顺便巩固requests库的相关知识
2024-03-26 10:13:50 8300 2
原创 python网络爬虫实战教学——requests的使用(1)
我们了解了urllib库的基本用法,其中确实有不方便的地方,例如处理网页验证和Cookie时,需要写Opener类和Handler类来处理。另外实现POST、PUT等请求时的写法也不太方便。为了更加方便地实现这些操作,产生了更为强大的库—requests。有了它,Cookie、登录验证、代理设置等操作都不是事儿。接下来,让我们领略一下requests库的强大之处吧。
2024-03-22 10:40:45 8603 14
原创 python网络爬虫实战教学——urllib的使用(3)
urlsplit:该方法用于将URL分解为不同的组件,如协议、网络位置、路径、参数和片段,方便单独处理这些部分。urlunsplit:与urlsplit相反,该方法将URL的各个组件重新组合成一个完整的URL字符串。urljoin:用于将基础URL与相对或绝对URL合并,生成一个完整的URL。它在处理相对路径或构建URL时非常有用。urlencode:该方法将字典或键值对编码为适用于URL查询字符串的格式。它通常用于对包含特殊字符的数据进行编码,以确保URL的正确性和可读性。
2024-03-21 10:01:32 9170 3
原创 python网络爬虫实战教学——urllib的使用(2)
掌握urllib库中的异常处理和URL解析功能,对于进行网络编程和网页数据抓取来说是非常重要的。它们能够帮助我们编写更加健壮和灵活的程序,应对各种网络请求场景。
2024-03-20 16:10:26 9189
原创 python网络爬虫实战教学——urllib的使用(1)
首先介绍一个Python库叫作urllib,利用它就可以实现HTTP请求的发送,而且不需要关心HTTP协议本身甚至更底层的实现,我们要做的是指定请求的URL`请求头`请求体等信息。此外urlljb还可以把服务器返回的响应转化为Python对象,我们通过该对象便可以方便地获取响应的相关信息’如响应状态码、响应头、响应体等。
2024-03-20 14:32:31 9208 17
原创 数据分析:当当网书籍数据可视化分析
随着互联网的快速发展,电子商务行业在中国经历了爆炸式的增长。作为国内知名的在线购物平台,当当网在其中发挥了举足轻重的作用。为了更好地满足消费者的需求,优化用户体验,提高运营效率,数据分析成为了当当网运营过程中不可或缺的一环。数据分析在电子商务中扮演着至关重要的角色。通过对大量数据的挖掘和分析,企业可以洞察市场趋势,了解用户行为,优化产品布局,制定营销策略等。当当网的数据分析流程旨在从海量数据中提取有价值的信息,为公司的决策提供数据支持。本次数据分析为当当网提供了有价值的洞察和建议。
2024-02-04 17:49:20 6488 43
原创 机器学习模型预测贷款审批
贷款是现代世界的主要需求。仅此一点,银行就获得了总利润的主要部分。它有利于学生管理他们的教育和生活费用,也有利于人们购买任何类型的奢侈品,如房子、汽车等。但在决定申请人的个人资料是否与获得贷款相关时。银行必须照顾很多方面。因此,在这里我们将使用Python机器学习来简化他们的工作,并使用婚姻状况、教育、申请人收入、信用记录等关键特征来预测候选人的个人资料是否相关。1贷款唯一的ID2性别申请人性别 男/女3已婚申请人的婚姻状况,值为是/否4家属它告诉申请人是否有任何家属。5。
2024-01-30 17:35:01 9898 26
原创 高级 Python 面试问题与解答
PIP 是 Python Installer Package 的缩写,它提供了安装各种 Python 模块的无缝接口。它是一个命令行工具,可以通过互联网搜索软件包并安装它们,而无需任何用户交互。Python zip() 函数返回一个 zip 对象,该对象映射多个容器的相似索引。它接受一个可迭代对象,将其转换为迭代器,并根据传递的可迭代对象聚合元素。它返回元组的迭代器。从 3.10 版本开始,Python 实现了一个称为“结构模式匹配”的 switch case 功能。
2024-01-16 16:31:20 1064 3
原创 中级Python面试问题
Python 是最广泛使用和流行的编程语言之一,由 Guido van Rossum 开发,并于 1991 年 2 月 20 日首次发布。Python 是一种免费的开源语言,具有非常简单和干净的语法,这使得它很容易开发人员学习Python。它支持面向对象编程,最常用于执行通用编程。Python 用于多个领域,如数据科学、机器学习、深度学习、人工智能、科学计算脚本、网络、游戏开发、Web 开发、网页抓取和各种其他领域。
2024-01-11 11:39:23 1231 1
原创 初学者的基本 Python 面试问题和答案
Python 是一种广泛使用的通用高级编程语言。它由 Guido van Rossum 于 1991 年创建,并由 Python 软件基金会进一步开发。它的设计重点是代码的可读性,其语法允许程序员用更少的代码行表达他们的概念。它用于:系统脚本Web开发游戏开发软件开发复杂数学列表理解是一种语法构造,可简化基于现有可迭代对象的列表的创建。my_list = [i 表示范围 (1, 10) 内的 i]lambda 函数是匿名函数。该函数可以有任意数量的参数,但只能有一个语句。
2024-01-09 13:37:35 1289 7
原创 使用Scikit Learn 进行识别手写数字
Scikit learn 是机器学习社区中使用最广泛的机器学习库之一,其背后的原因是代码的简便性以及机器学习开发人员构建机器学习模型所需的几乎所有功能的可用性。在本文中,我们将学习如何使用 sklearn 在手写数字数据集上训练 MLP 模型。其他一些好处是:1、它提供分类、回归和聚类算法,例如SVM算法、随机森林、梯度提升和k 均值。2、它还设计用于与Python 的科学和数值库NumPy和SciPy一起运行。
2024-01-08 15:20:55 1120 33
原创 基于决策树、随机森林和层次聚类对帕尔默企鹅数据分析
随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。Palmer Penguins 数据集是近年来在数据科学和机器学习领域受到关注的一个数据集,经常被用作鸢尾花数据集的一个替代品。数据集包含了对南极洲不同地区生活的企鹅种群的研究数据,主要用于数据探索和可视化,以及分类任务。这些聚类结果可能与企鹅的物理特征(如喙长、喙深、鳍状肢长度和体重)和/或其地理分布(如所在岛屿)有关。
2024-01-03 11:02:03 4234 35
原创 【i阿极送书——第六期】《YOLO目标检测》
随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。好书推荐|《YOLO目标检测》涵盖众多目标检测框架,附赠源代码和全书彩图!
2023-12-28 12:00:05 2260 32
原创 【i阿极送书——第五期】《Python机器学习:基于PyTorch和Scikit-Learn》
《Python机器学习:基于PyTorch和Scikit-Learn》这本书的定位是把机器学习理论和工程实践结合起来,从而降低读者的阅读门槛。从数据驱动方法的基础知识到最新的深度学习框架,本书每一章都提供了机器学习代码示例,用于解决实际应用中的机器学习问题。
2023-07-12 18:46:33 4497 95
原创 机器学习:基于Python 机器学习进行医疗保险价格预测
在本文中,我们将尝试使用 Python 中的机器学习从数据集中提取一些见解,该数据集包含有关购买医疗保险的人的背景以及向这些人收取的保费金额的详细信息。
2023-06-28 08:17:40 5245 93
原创 机器学习:基于逻辑回归对航空公司乘客满意度的因素分析
本文旨在基于逻辑回归方法对航空公司乘客满意度的因素进行分析。逻辑回归是一种广泛应用于分类问题的统计学习方法,能够帮助我们理解和预测不同因素对乘客满意度的影响程度。
2023-06-25 10:22:30 5100 86
原创 机器学习:基于Python实现人工神经网络训练过程
人工神经网络(ANN)是一种启发大脑的信息处理范例。人工神经网络与人一样,通过实例学习。ANN 通过学习过程配置用于特定应用,例如模式识别或数据分类。学习很大程度上涉及对神经元之间存在的突触连接的调整。
2023-06-22 23:16:35 1727 6
原创 端午节,不能只知道吃吃吃.....玩玩玩......
端午节在中国有着深厚的文化内涵和情感纽带。它不仅是对屈原的纪念和怀念,也象征着人们对和平、团结和祈福的追求。端午节的庆祝活动和习俗传承了几千年的历史,不仅增进了人与人之间的情感,也丰富了中国传统文化。
2023-06-21 10:30:11 637 42
原创 【数据分析之道-Matplotlib(九)】Matplotlib棉棒图
在Matplotlib中,可以使用stem()来绘制棉棒图。棉棒图是柱状图的变形,可以把它看成特殊的柱状图。stem()函数用于绘制离散数据的垂直线图,常用于显示离散的数据点以及它们的垂直变化。
2023-06-17 09:24:13 4407 128
原创 机器学习:基于AdaBoost算法模型对信用卡是否违约进行识别
AdaBoost算法 (Adaptive Boosting) 是一种有效而实用的Boosting算法,它以一种高度自适应的方法顺序地训练弱学习器.
2023-06-13 11:19:36 3038 96
原创 【i阿极送书——第四期】《ChatGPT时代:ChatGPT全能应用一本通》
本书从ChatGPT等自然语言大模型基础知识讲起,重点介绍了ChatGPT等语言大模型在生活中的实际应用,让每一个人都能了解未来的生活和工作。本书分为16章,涵盖的主要内容有人工智能、OpenAI、ChatGPT的介绍、ChatGPT的使用技巧,向大家展现ChatGPT在学术教育、商业管理、新媒体、办公、求职、法律、电商等不同领域的应用,以及ChatGPT当下的问题、大模型的未来。本书通俗易懂,用最简单的语言解释人工智能的入门知识,案例丰富,实用性强,适合每一个想要了ChatGPT等自然语言处理大模型的
2023-06-09 14:36:07 5381 114
原创 【数据分析之道-Matplotlib(八)】Matplotlib箱线图
箱线图(Box Plot)是一种用于显示数据分布和异常值的可视化方法。它展示了一组数据的五个统计量:最小值(minimum)、第一四分位数(lower quartile)、中位数(median)、第三四分位数(upper quartile)和最大值(maximum)。箱线图还可以显示异常值(outliers)和数据的分布情况。
2023-06-09 09:55:44 6644 77
原创 【数据分析之道-Matplotlib(七)】Matplotlib直方图
直方图是一种常用的数据可视化方法,用于显示数据的分布情况。在Matplotlib中,可以使用hist()函数绘制直方图。
2023-06-06 08:36:38 8532 99
原创 机器学习:基于XGBoost对信用卡欺诈行为的识别
XGBoost(eXtreme Gradient Boosting)是一种梯度提升树算法,它是基于决策树的集成学习方法。相对于传统的梯度提升树算法,XGBoost引入了一些创新的技术,如正则化、并行计算和缺失值处理,以提高模型的准确性和效率。
2023-06-03 14:04:17 4789 94
原创 【i阿极送书——第三期】《Hadoop大数据技术基础与应用》
本书由浅入深地介绍了Hadoop技术生态的重要组件,让读者能够系统地了解大数据相关技术。第1章主要从整体上介绍了Hadoop大数据技术,并搭建Hadoop运行环境。
2023-06-02 08:38:19 4619 96
原创 【数据分析之道-Matplotlib(六)】Matplotlib饼图
Matplotlib中的饼图(Pie Chart)是一种常用的数据可视化方式,用于展示各个部分相对于整体的比例关系。饼图可以清晰地显示数据的相对大小,并可以通过添加标签和颜色来增强可读性。
2023-06-01 11:57:11 5851 80
原创 InsCode AI 创作助手围绕《程序员应如何应付AI带来的影响》为主题
CSDN AI写作助手上线了!InsCode AI 创作助手不仅能够帮助用户高效创作文章,而且能够作为对话式AI回答你想知道的问题。成倍提高生产力!
2023-05-30 15:39:15 942 9
原创 【数据分析之道-Matplotlib(五)】Matplotlib柱状图
柱状图(Bar Plot)是一种常用的数据可视化方式,用于显示各个类别之间的比较。在Matplotlib中,可以使用bar()函数或barh()函数来绘制柱状图。
2023-05-29 10:12:41 8571 87
原创 机器学习:基于Apriori算法对中医病症辩证关联规则分析
Apriori算法是一种经典的关联规则挖掘算法,用于发现数据集中频繁出现的项集和关联规则。该算法基于一种称为"先验原理"的观念,即如果一个项集是频繁的,那么它的所有子集也必须是频繁的。通过利用这个原理,Apriori算法逐步构建频繁项集,并生成关联规则。
2023-05-26 09:43:13 3886 115
原创 【数据分析之道-Numpy(八)】numpy统计函数
当我们处理数据时,经常需要对数据进行统计分析,NumPy提供了一些方便的统计函数,可以帮助我们计算数组的各种统计指标。下面详细介绍一些常用的NumPy统计函数
2023-05-23 13:01:45 4467 94
原创 私有GitLab仓库 - 本地搭建GitLab私有代码仓库并随时远程访问「内网穿透」
Gitlab是被广泛使用的基于git的开源代码管理平台, 基于Ruby on Rails构建, 主要针对软件开发过程中产生的代码和文档进行管理, Gitlab主要针对group和project两个维度进行代码和文档管理, 其中group是群组, project是工程项目, 一个group可以管理多个project, 可以理解为一个群组中有多项软件开发任务, 而一个project中可能包含多个branch, 意为每个项目中有多个分支, 分支间相互独立, 不同分支可以进行归并。
2023-05-20 12:34:10 5131 112
原创 【数据分析之道-基础知识(十一)】面向对象
Python 是一种面向对象的编程语言,它提供了丰富的面向对象编程特性和语法。面向对象编程(OOP)是一种编程范式,它将数据和与之相关的操作封装在对象中,通过定义类和实例化对象来实现程序的组织和设计。
2023-05-19 13:38:31 1170 14
原创 【数据分析之道-Matplotlib(四)】Matplotlib散点图
散点图(Scatter Plot)是一种常用的数据可视化方式,用于展示两个变量之间的关系。Matplotlib提供了丰富的功能来绘制散点图,并可以根据需求进行自定义和调整。在Matplotlib中,可以使用scatter()函数来绘制散点图。该函数接受两个参数,分别是x和y,表示散点图中各个点的横坐标和纵坐标。
2023-05-17 11:12:44 8467 76
深圳2024年链家二手房数据集和源码
2024-05-08
基于随机森林和Xgboost对肥胖风险的多类别预测数据集与源码
2024-05-03
基于随机森林对酒店预订分析预测源码
2024-05-02
基于逻辑回归对航空公司乘客满意度的因素分析源码
2024-05-02
基于Python 机器学习进行医疗保险价格预测源码
2024-05-02
基于PCA对人脸识别数据降维并建立KNN模型检验
2024-04-18
基于KNN对葡萄酒质量进行分类数据集
2024-04-18
基于KNN模型对高炉发电量进行回归预测分析数据集
2024-04-18
基于Apriori算法对中医病症辩证关联规则分析
2024-04-18
基于Python 机器学习进行医疗保险价格预测数据集
2024-04-18
24万条基于高斯贝叶斯对面部皮肤进行预测分析数据集
2024-04-17
基于神经网络对用户评论情感分析预测数据集
2024-04-17
当当网书籍数据可视化分析数据集
2024-04-17
65万条餐厅订单数据分析数据集
2024-04-17
数据分析104万条电商优惠卷数据集
2024-04-17
数据分析消费者数据分析数据集
2024-04-17
麦当劳食品营养数据探索并可视化数据集
2024-04-17
旅游景点销售门票和消费情况分析数据集
2024-04-17
基于逻辑回归对股票客户流失预测分析数据集
2024-04-11
基于Kmeans聚类算法对银行客户进行分类数据集
2024-04-11
基于K-近邻(KNN)对Pima人糖尿病预测分析数据集
2024-04-11
基于随机森林(RFC)对酒店预订分析预测数据集
2024-04-09
基于XGBoost对信用卡欺诈行为的识别数据集
2024-04-09
帕尔默企鹅数据集.csv
2024-04-09
基于逻辑回归对优惠券使用情况预测分析数据集
2024-04-09
基于逻辑回归对航空公司乘客满意度的因素分析数据集
2024-04-09
55万4千多条汽车销售价格数据..csv
2024-03-21
55万条汽车销售价格数据预测项目详细源码.ipynb
2024-03-21
3600条视频弹幕数据集
2024-03-20
金融时间序列分析数据集.zip
2024-03-19
金融时间序列分析实战详细源码
2024-03-19
某电商优惠卷数据集市场策略制定与消费者行为分析
2024-02-25
利用Turtle库绘制绚烂的樱花图案
2024-02-06
提供处理文本数据的详细步骤
2023-05-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人