自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(60)
  • 收藏
  • 关注

原创 史上最全pytorch学习笔记2完结【文末附有源代码和参考书籍】

Module 类是 nn 模块⾥提供的⼀个模型构造类,是所有神经⽹络模块的基类,我们可以继承它来定义我们想要的模型。下⾯继承 Module 类构造本节开头提到的多层感知机。这⾥定义的 MLP 类加载了Module 类的函数和 forward 函数。它们分别⽤于创建模型参数和定义前向计算。前向计算也即正向传播。以上的 MLP 类中⽆须定义反向传播函数。系统将通过⾃动求梯度⽽⾃动⽣成反向传播所需的backward 函数。我们可以实例化 MLP 类得到模型变量 net。

2024-03-26 18:31:00 604

原创 史上最全pytorch学习笔记1【附有源代码和参考书籍】

此外,还可以⽤ with torch.no_grad() 将不想被追踪的操作代码块包裹起来,这种⽅法在评估模型的时候很常⽤,因为在评估模型时,我们并不需要计算可训练参数( requires_grad=True )的梯度。每个 Tensor 都有⼀个 .grad_fn 属性,该属性即创建该 Tensor 的Function , 就是说该 Tensor 是不是通过某些运算得到的,若是,则 grad_fn 返回⼀个与这些运算相关的对象,否则是None。在另⼀类情景中,模型输出可以是⼀个像图像类别这样的离散值。

2024-03-26 18:29:49 993

原创 PyTorch深度学习实践1——线性回归和Logistic回归

对比线性回归和Logistic回归构造的类,Logistic回归是使用torch.nn.functional模块中的sigmoid函数。如下图所示,与线性回归模型不同的是,Logistic回归是对线性回归计算的值使用sigmoid函数对其进行变换,映射在0-1之间。Logistic回归的损失函数为BCELoss。说明:预测与标签越接近,BCE损失越小。Logistic回归损失函数计算公式。构建Logistic回归模型。

2023-09-11 19:20:40 314 1

原创 2023东华大学机试OJ进阶版1-81题

先排序。每次找两个最小的数,把其中一个置为两数之和,并累加这个和值,另一个数置为-1,然后再排序,重复操作,直到只剩下一个数。105。

2023-03-25 22:17:48 1324 1

原创 2023东华大学机试OJ 71-109题

东华大学计算机研究生复试题71 发牌题目描述:编制一个模拟发牌的程序。有编号为1,2,3,4四个人,将一付去掉大小怪的扑克按照如下顺序排列梅花c0-c12,方块d0-d12,红桃h0–h12,黑桃s0-s12,然后按照1,2,3,4四个人的顺序发牌,问最后每个人手上的牌有哪些。思路:每次先输出第一章牌的花色和序号【梅花】】,输出一次就累加4,若数字大于12,则取模,发另一种类型的牌,直到发完13张#include<stdio.h>//每个人都是隔4次发一张,可以用num表示牌的数字,直

2023-03-25 22:15:25 1704

原创 2023东华大学OJ机试题110-135

期间最长的至少有一个农民在挤奶的连续时间为900秒(从300时刻到1200时刻),而最长的无人挤奶的连续时间(从挤奶开始一直到挤奶结束)为300秒(从1200时刻到1500时刻)。题目描述:你的程序需要从标准输入设备(通常为键盘)中输入N(1≤N≤10)个学生的信息,每项信息包含该学生的编号、姓名、性别、年龄、成绩共五项,按成绩进行排序,然后按成绩从低到高输出,输入保证没有相同的成绩。给定若干行短文,要求按字符出现的频度由高到低输出,当两个字符出现的频度相同时,按字符大小的顺序输出。这时候必然不是循环数!

2023-03-25 22:14:10 906

原创 2023东华大学OJ机试题22-70

东华大学计算机考研复试机试22 约瑟夫环223、整除的尾数24、回文质数25、汽水瓶26、阶乘最后的非0位27、算菜价28、 水果价格29、求奇数的乘积30、求最晚和最早日期31、素数32、计算e33 数字之和34 繁殖问题35 奇妙的数字36 整除的尾数37 黑色星期五38 树39 约瑟夫环40 最大与最小41 环42 求数列项43 最高频率44 三艘船45 回文数46 特殊四位数47 最大值48 数列149 修理牛棚50 按要求输出序列51 部落人乘法52 序列53 双重回文数54 等差数列55 人见人

2023-03-25 22:10:04 1332

原创 【Python数据分析实战】豆瓣读书分析(含代码和数据集)

@[TOC]豆瓣一.导入数据二.数据清洗2.1清理null值2.2清洗出版时间列2.3转换评分及平均数量的数据类型2.4清洗页数列2.5清洗价格列2.6去除书名重复的数据2.7哪个出版社的书籍评分较高?2.8哪些书值得一读?2.9作者排名(10部作品及以上)三.数据分析与可视化3.1各年作品出版数量折线图3.2各价位作品数量直方图3.3各出版社出版作品数量条形图&评分折线图3.4作者作品评分条形图3.5作品评分树状图...

2021-12-29 18:05:36 12152 15

原创 【python-sklearn】中文文本处理LDA主题模型分析

数据集和资料:链接:LDA主题模型提取码:rlns数据概览代码:import osimport pandas as pdimport reimport jiebaimport jieba.posseg as psg#######预处理output_path = 'D:/lda/result'file_path = 'D:/lda/data'os.chdir(file_path)data=pd.read_excel("data.xlsx")#content typeos.

2021-12-29 15:17:50 9248 10

转载 Redis基本命令与操作汇总(侧重于代码)

@[TOC]redis启动:redis-cli --raw正常启动用redis-cli即可,加上–raw是为了能够显示中文1.Redis数据类型String(字符串SET命令)127.0.0.1:6379> SET test "字符串"OK127.0.0.1:6379> GET test字符串Hash(哈希HMSET命令)127.0.0.1:6379> DEL test1127.0.0.1:6379> HMSET test field1 "Hello" f

2021-12-28 21:10:19 457

原创 【数据分析与挖掘实战】B站影视区数据分析

一.分析目标与内容B站作为一个视频内容平台,具有广泛的受众,其数据具有巨大的分析价值。在本次数据分析项目中,分别从视频角度和up主角度对B站影视区数据集进行了分析,通过描述性统计,维度拆解,聚类等方式进行了较为全面的分析。在分析过程中,特别关注了原创或搬运这个特征,并发现了一些有趣的结论。二.数据来源链接:点击获取提取码:srtc三.数据导入与基本情况查看import numpy as npimport pandas as pdimport matplotlib.pyp

2021-12-22 16:16:40 5856 1

原创 pyecharts可视化BI数据大屏实战(含代码和数据集)

数据集和代码:链接:https://pan.baidu.com/s/1RAEOUwLjTVuVqSIa1P12kg提取码:191h

2021-12-14 10:56:59 2692 2

原创 【数据分析与挖掘实战】二手车价格预测1数据分析与特征构造详解(有数据集合代码)

一.题目概况数据集:点击下载根据给定的数据集,建立模型,二手汽车的交易价格。来自 Ebay Kleinanzeigen 报废的二手车,数量超过 370,000,包含 20 列变量信息,为了保证 比赛的公平性,将会从中抽取 10 万条作为训练集,5 万条作为测试集 A,5 万条作为测试集 B。同时会对名称、车辆类型、变速箱、model、燃油类型、品牌、公里数、价格等信息进行 脱敏。二.查看数据import pandas as pdimport numpy as nppath = './da

2021-12-12 21:28:40 4570

原创 【数据分析与挖掘实战】二手车价格预测3建模调参模型融合详解(有数据集合代码)

本题模型融合示例:数据集:链接:https://pan.baidu.com/s/1bbgT3bfNVcbQKEnpgBt4PQ提取码:au99import pandas as pdimport numpy as npimport warningsimport matplotlibimport matplotlib.pyplot as pltimport seaborn as snswarnings.filterwarnings('ignore')%matplotlib inline

2021-12-12 20:37:03 1280

原创 【数据分析与挖掘实战】二手车价格预测2建模调参模型融合详解(有数据集合代码)

四. 建模调参4.1读取数据reduce_mem_usage 函数通过调整数据类型,帮助我们减少数据在内存中占用的空间import pandas as pdimport numpy as npimport warningswarnings.filterwarnings('ignore')def reduce_mem_usage(df): """ iterate through all the columns of a dataframe and modify the data typ

2021-12-12 20:31:14 924

原创 【数据分析与挖掘】基于Apriori算法的中医证型的关联规则挖掘(有数据集和代码)

中医药治疗乳腺癌有着广泛的适应证和独特的优势。从整体出发,调整机体气血、阴阳、脏腑功能的平衡,根据不同的临床证候进行辨证论治。确定“先证而治”的方向:即后续证侯尚未出现之前,需要截断恶化病情的哪些后续证侯。找出中医症状间的关联关系和诸多症状间的规律性,并且依据规则分析病因、预测病情发展以及为未来临床诊治提供有效借鉴。能够帮助乳腺癌患者手术后体质的恢复、生存质量的改善,有利于提高患者的生存机率。目前,中医治疗一般都是采用中医辨证的原则,结合临床医师的从医经验和医学指南进行诊断,然而此方法也存在一定

2021-12-12 15:37:56 4794 3

原创 【数据分析与挖掘】财政收入影响因素分析及预测模型(有数据集和代码)

案例背景在我国现行的分税制财政管理体制下,地方财政收人不仅是国家财政收入的重要组成部分,而且具有其相对独立的构成内容。如何有效的利用地方财政收入,合理的分配,来促进地方的发展,提高市民的收入和生活质量是每个地方政府需要考虑的首要问题。因此,对地方财政收人进行预测,不仅是必要的,而且也是可能的。科学、合理地预测地方财政收人,对于克服年度地方预算收支规模确定的随意性和盲目性,正确处理地方财政与经济的相互关系具有十分重要的意义。某市作为改革开放的前沿城市,其经济发展在全国经济中的地位举足轻重。目前,该市在财

2021-12-12 14:48:56 19999 10

原创 【数据分析与挖掘】天猫超市复购预测实战(含代码和数据集)

一.背景商家有时会在特定日期,例如Boxing-day,黑色星期五或是双十一(11月11日)开展大型促销活动或者发放优惠券以吸引消费者,然而很多被吸引来的买家都是一次性消费者,这些促销活动可能对销售业绩的增长并没有长远帮助,因此为解决这个问题,商家需要识别出哪类消费者可以转化为重复购买者。通过对这些潜在的忠诚客户进行定位,商家可以大大降低促销成本,提高投资回报率(Return on Investment, ROI)。众所周知的是,在线投放广告时精准定位客户是件比较难的事情,尤其是针对新消费者的定位。不过,

2021-12-09 17:32:46 18067 14

原创 【数据分析与挖掘实战】金融风控之贷款违约预测详解2(有代码和数据集)

本文接着上一篇博客,如果您未阅读上篇博客,请点击【数据分析与挖掘实战】金融风控之贷款违约预测详解1(有代码和数据集)七.建模和调参7.1模型相关原理介绍由于相关算法原理篇幅较长,本文推荐了一些博客供初学者们进行学习。7.1.1 逻辑回归模型7.1.2 决策树模型7.1.3GBDT模型7.1.4 XGBoost模型7.1.5 LightGBM模型7.1.6 Catboost模型7.2 模型对比与性能评估7.2.1逻辑回归优点训练速度较快,分类的时候,计算量仅仅只和特征的数目相关;

2021-12-09 12:09:30 2977 3

原创 【数据分析与挖掘实战】金融风控之贷款违约预测详解1(有代码和数据集)

金融风控一.题目理解1.1.题目概况1.2数据概况1.3预测指标二.数据来源三.查看数据四.分类指标计算示例4.1混淆矩阵4.2准确度4.3precision(精确度),recall(召回率),f1-score4.4P-R曲线4.5ROC曲线4.6AUC曲线4.7KS值五.数据分析5.1基本信息5.2查看数据集中特征缺失值,唯一值等5.3查看特征的数值类型有哪些,对象类型有哪些5.3.1数值连续型变量分析5.3.2非数值类别型变量分析5.3.3总结:5.4变量分布可视化5.4.1单一变量分布可视化更新中~

2021-12-08 21:10:05 10325 11

原创 【数据分析与挖掘】基于LightGBM,XGBoost,逻辑回归的分类预测实战:英雄联盟数据(有数据集和代码)

机器学习-LightGBM一.LightGBM的介绍与应用1.1 LightGBM的介绍1.2 LightGBM的应用二.数据集来源三.基于英雄联盟数据集的LightGBM分类实战Step1:函数库导入Step2:数据读取/载入Step3:数据信息简单查看Step4:可视化描述Step5:利用 LightGBM 进行训练与预测Step7: 利用 LightGBM 进行特征选择Step8: 通过调整参数获得更好的效果四.总结本次我们选择英雄联盟数据集进行LightGBM的场景体验。英雄联盟是2009年美国拳

2021-12-08 12:40:26 2139

原创 【数据分析与挖掘】基于LightGBM,XGBoost,逻辑回归的二分类/多分类的分类预测实战(有数据集和代码)

【机器学习】基于逻辑回归,LightGBM,XGBoost额的分类预测一.基于逻辑回归的分类预测1 逻辑回归的介绍和应用1.1 逻辑回归的介绍1.2逻辑回归的应用2.Demo实践**Step1:库函数导入****Step2:模型训练****Step3:模型参数查看****Step4:数据和模型可视化****Step5:模型预测**3.基于鸢尾花(iris)数据集的逻辑回归分类实践**Step1:库函数导入****Step2:数据读取/载入****Step3:数据信息简单查看**Step4:可视化描述Step

2021-12-08 12:22:09 5408 1

原创 【数据分析与挖掘】淘宝用户行为分析(带数据集和代码)

一.背景描述针对项目:淘宝用户分析使用。2014年是阿里巴巴集团移动电商业务快速发展的一年,例如2014双11大促中移动端成交占比达到42.6%,超过240亿元。相比PC时代,移动端网络的访问是随时随地的,具有更丰富的场景数据,比如用户的位置信息、用户访问的时间规律等。本次大赛以阿里巴巴移动电商平台的真实用户-商品行为数据为基础,同时提供移动时代特有的位置信息,而参赛队伍则需要通过大数据和算法构面向建移动电子商务的商品推荐模型。希望参赛队伍能够挖掘数据背后丰富的内涵,为移动用户在合适的时间、合适的地点精

2021-12-08 10:16:41 6491 2

原创 【数据分析系列】Python数据预处理总结篇

史上最全的Python数据分析预处理总结篇,不看后悔!!!

2021-12-06 17:45:10 13128

原创 【数据分析系列】数据特征分析详解

【数据分析系列】数据特征分析详解,有数据集和代码

2021-12-06 16:16:51 811

原创 【数据分析与挖掘系列】基于基站定位数据的商圈分析(全数据集和代码)

数据集:分享资料提取码:au99案例背景随着当今个人手机终端的普及,出行群体中手机拥有率和使用率已达到相当高的比例,手机移动网络也基本实现了城乡空间区域的全覆盖。根据手机信号在真实地理空间上的覆盖情况,将手机用户时间序列的手机定位数据,映射至现实的地理空间位置,即可完整、客观地还原出手机用户的现实活动轨迹,从而挖掘得到人口空间分布与活动联系特征信息。移动通信网络的信号覆盖从逻辑上被设计成由若干六边形的基站小区相互邻接而构成的蜂窝网络面状服务区,手机终端总是与其中某一个基站小区保持联系,移动通信网络的

2021-12-06 10:52:53 3121 4

原创 【数据分析与挖掘实战】电信用户流失分析与预测

背景关于用户留存有这样一个观点,如果将用户流失率降低5%,公司利润将提升25%-85%。如今高居不下的获客成本让电信运营商遭遇“天花板”,甚至陷入获客难的窘境。随着市场饱和度上升,电信运营商亟待解决增加用户黏性,延长用户生命周期的问题。因此,电信用户流失分析与预测至关重要。数据集来自kesci中的“电信运营商客户数据集”数据集:添加链接描述本文将从以下方面进行分析:1.背景2.提出问题3.理解数据4.数据清洗5.可视化分析6.用户流失预测7.结论和建议提出问题1.分析用户特征与流失

2021-12-05 21:47:35 11041 1

原创 Matplotlib 最具价值的20个可视化项目

matplotlib最具价值的20个可视化项目,看完这篇就够了!

2021-12-05 21:26:15 467

原创 【数据分析与挖掘实战】航空公司客户价值分析

1.案例背景二八定律: 20%的客户,为企业带来约80%的利益。在企业的客户关系管理中,对客户分类,区分不同价值的客户。针对不同价值的客户提供个性化服务方案,采取不同营销策略,将有限营销资源集中于高价值客户,实现企业利润最大化目标。在竞争激烈的航空市场里,很多航空公司都推出了优惠的营销方式来吸引更多的客户。在此种环境下,如何将公司有限的资源充分利用,提示企业竞争力,为企业带来更多的利益。2.传统方法存在的缺陷广泛用于分析客户价值的是RFM模型,它是通过三个指标(最近消费时间间隔(Recency

2021-12-05 17:40:23 8614 4

原创 【机器学习】数据预处理类型总结

数据预处理总结基于sklearn包1、标准化:去均值和方差按比例缩放(scale,StandardScaler)1.1将特征缩放至特定范围内(MinMaxScaler,MaxAbsScaler)1.2缩放稀疏矩阵数据2.归一化(Normalizer)3.类别特征编码(OneHotEncoder)4.离散化4.1K-bins离散化(KBinsDiscretizer )4.2特征二值化(Binarizer)5.缺失值补全5.1单变量插补全(SimpleImputer)5.1.1平均数替换5.1.2众数替换5.2

2021-12-04 17:29:32 1252

原创 【数据挖掘之关联规则实战】关联规则智能推荐算法

[数据挖掘之关联规则实战】关联规则智能推荐算法

2021-12-04 16:05:54 2943 3

原创 【数据挖掘时间序列分析】餐厅销量预测

【数据挖掘时间序列分析】基于ARIMA模型的餐厅销量预测

2021-12-04 13:34:27 2146

原创 数据挖掘与Python实战之数值预测

1.线性回归1.1简单例子from sklearn import linear_modelx=[[0,0],[1,1],[2,2]]y=[0,1,2]reg=linear_model.LinearRegression()reg.fit(x,y)print(reg.predict([[3,3]]))1.2糖尿病数据集import matplotlib.pyplot as pltimport numpy as np#导入数据集包与回归模型需要的包from sklearn impor

2021-12-04 11:11:48 2036

原创 Tkinter学习笔记(四)

tix和ttk控件介绍ttk.NoteBook控件ttk.Treeview控件form表格几何管理器tix.Balloon气球窗口控件tix.ButtonBox按钮框控件tix.combobox组合框控件tix.control控制窗口组件介绍tix库提供了tk库缺失的常用小控件,如hlist控件,combobox控件,control控件和各种可滚动的小控件,借助tix超级控件可以设计出更加美观的应用程序。ttk提供了一种与平台无关的窗口工具包ttk.NoteBook控件import tkinter

2021-01-08 17:05:54 407 2

原创 Tkinter学习笔记(三)

Tkinter常用控件1.Label控件2.Frame控件3.Button控件4.Entry控件5.Text控件6.Scrollbar控件7.Canvas控件1.Label控件语法格式:label=tk.Label(master,option,…)其中master是其父控件,用来放置这个控件的。Tkinter容器控件没有背景属性,通常利用Label图片属性来给容器控件增加背景图片import tkinter as tkimport timefrom PIL import Image,Ima

2021-01-08 11:11:26 190

原创 Tkinter学习笔记(二)

一:读取、改变屏幕和窗口信息#获取屏幕和窗口信息import tkinter as tkroot=tk.Tk()#获取屏幕宽度和高度screenwidth=root.winfo_screenwidth()screenheight=root.winfo_screenheight()#获取窗口宽度和高度winwidth=root.winfo_width()winheight=root.winfo_height()#获取窗口的x,y坐标x=root.winfo_x()y=root.w

2021-01-07 23:21:49 216

原创 Matplotlib和tkinter学习笔记(一)

文章目录前言绘图matplotlib的绘图流程:tkinter的使用流程tkinter控件属性控件的值和单位总结前言1 关于 Matplotlib 模块Matplotlib 是一个由 John Hunter 等开发的,用以绘制二维图形的 Python 模块。它利用了 Python 下的数值计算模块 Numeric 及 Numarray,克隆了许多 Matlab 中的函数, 用以帮助用户轻松地获得高质量的二维图形。Matplotlib 可以绘制多种形式的图形包括普通的线图,直方图,饼图,散点图以及误差

2021-01-07 17:09:23 1341 1

原创 Python量化交易学习入门

量化交易-Python实现一.量化交易的流程和概念1.数据分析I2O流程2.量化交易和高频交易、自动交易的区别3.量化交易的流程二.量化交易的分类三:常用量化框架四.一个完整的策略五.常用数据源和模块库1.tushare模块库获取数据1.1获取历史行情数据其他做法类似2.pandas获取数据六.策略的评价指标一.量化交易的流程和概念1.数据分析I2O流程在了解量化交易概念之前,我们先了解数据分析领域的流程划分模式。I2O模式不仅适用于IT行业和数据分析,实际上大部分行业和日常工作中都可以采用。对于

2021-01-07 11:49:25 10142 1

原创 机器学习之Logistic回归简单实例

logistic是一种线性分类器,针对的是线性可分问题。利用logistic回归进行分类的主要思想是:根据现有的数据对分类边界线建立回归公式,以此进行分类。这里的“回归”一词源于最佳拟合,表示要找到最佳拟合参数集,因此,logistic训练分类器时的做法就是寻找最佳拟合参数,使用的是最优化方法.例如:在两个类的情况下,函数输出0或1,这个函数就是二值型分类器的sigmoid函数; ...

2021-01-04 14:11:19 1508 1

原创 机器学习之线性回归简单实例

线性回归简介:线性回归目标是提取输入变量和输出变量的关联线性模型。线性回归属于有监督学习,有监督学习的基本架构和框架如下:1.准备训练数据,可以是文本数据、图像数据和音频数据2.然后抽取所需要的特征形成特征向量。3.把这些特征向量已经对应的目标一起导入机器学习算法模型中,训练出一个预测模型。4.采用同样的特征抽取方法作用与新数据,得到用于测试的特征向量。5.最后使用预测模型对这些待测试的特征向量进行预测得到结果。线性回归也不例外,下面运用一个简单的实例来了解线性回归。(1)导入数据#线性回

2021-01-04 13:24:08 1342

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除