机器学习
文章平均质量分 62
LouHerGetUp
欢迎大家学习交流
展开
-
【机器学习】10.1 在ubuntu上安装lgb gpu(cuda)版本
记录在ubuntu(AutoDL)上安装lightgbm gpu(cuda)版本的方法。原创 2023-12-26 19:38:52 · 1360 阅读 · 3 评论 -
【机器学习】9.2.Tfidf 随机森林 朴素贝叶斯 自然语言处理 航空公司评论分类
观察每一个类别被错误分类的情况,以矩阵形式将数据集中的记录按照真实的类别与分类模型预测的类别判断两个标准进行汇总。F1-Score 同时兼顾了分类模型的精确率和召回率。查准率 sklearn.metrics.precision_score()召回率 sklearn.metrics.recall_score()召回率 recall = TP/(TP+FN)平滑参数,越小越容易过拟合,越大越容易欠拟合。TP:将正类预测为正类数。FN:将正类预测为负类数。FP:将负类预测为正类数。TN:将负类预测为负类数。原创 2023-12-11 10:07:38 · 629 阅读 · 0 评论 -
【机器学习】9.1.随机森林 多分类 鸢尾花数据集
【代码】【机器学习】9.1.随机森林 多分类 鸢尾花数据集。原创 2023-12-11 09:43:03 · 653 阅读 · 0 评论 -
【机器学习】8.1.电影推荐
选出预测评分最高的10部电影做推荐。原创 2023-12-10 12:26:35 · 533 阅读 · 0 评论 -
【机器学习】7.2.基于项目的协同过滤
选择相似度最高的两人,做推断。原创 2023-12-10 11:11:44 · 564 阅读 · 0 评论 -
【机器学习】7.1.余弦相似度 协同过滤
可能有些用户对所有物品的评分都比较高,所以对行取平均值。原创 2023-12-09 13:12:36 · 516 阅读 · 0 评论 -
【机器学习】6.3.SVM 信用卡欺诈数据集
【代码】【机器学习】6.3.SVM 信用卡欺诈数据集。原创 2023-12-09 13:03:51 · 668 阅读 · 0 评论 -
【机器学习】6.2.决策树 随机森林 泰坦尼克数据集
为什么需要交叉验证——解决随机划分的差异和参数选择的问题,让所有的数据都参加到训练和评价当中。如果特征为连续值,需要根据需求对数据进行离散化处理。模型要求y必须为1列,用。原创 2023-12-08 11:02:11 · 883 阅读 · 0 评论 -
【机器学习】6.1.过拟合和欠拟合
用新的数据集进行模型预测。原创 2023-12-08 10:30:17 · 463 阅读 · 0 评论 -
【机器学习】5.1.预测 房产成交价格预测
拼接特征成交单价,成交总价到dataframe。如果添加了两个相关的特征,模型的准确率会降低。拼接特征涨幅,套数到dataframe。选择成交数量大于5的小区。原创 2023-12-07 13:08:58 · 525 阅读 · 0 评论 -
【机器学习】4.1.DBSCAN聚类
从结果可以看出 K-means 对于这种数据的分类效果并不好。原创 2023-12-07 12:39:55 · 473 阅读 · 0 评论 -
【机器学习】3.1.多元回归模型 房产估价模型
取出成交量前十五的小区的成交数据。原创 2023-12-06 13:35:20 · 464 阅读 · 0 评论 -
【机器学习】2.1.一元回归模型 房产成交价格预测
【代码】【机器学习】2.1.一元回归模型 房产成交价格预测。原创 2023-12-06 12:48:08 · 510 阅读 · 0 评论 -
【机器学习】1.4.分类问题 信用卡欺诈数据集
【代码】【机器学习】1.4.分类问题 信用卡欺诈数据集。原创 2023-12-05 12:28:17 · 499 阅读 · 0 评论 -
【机器学习】1.3.k均值聚类
改进后评价指标下降,说明应。原创 2023-12-05 12:19:13 · 638 阅读 · 0 评论 -
【机器学习】1.2.多元线性回归 广告数据集
选择对于预测比较有用的特征,特征并不是越多越好。原创 2023-12-04 21:41:09 · 600 阅读 · 0 评论 -
【机器学习】1.1.线性回归
train和test的数据分布不均匀,导致模型测试结果不好。绘图,可以看出训练集和测试集分布不均匀。调整一下预测函数,看误差是否变大。输入变成一个个的向量。原创 2023-12-04 21:31:24 · 471 阅读 · 0 评论 -
【Pandas】5.1.链家成交数据分析
销售的成交总价和从业年限分布。取每个销售成交单价最高的5单。原创 2023-12-03 12:44:50 · 634 阅读 · 0 评论 -
【Pandas】4.1.时间序列
将时间序列从一个频率转换到另一个频率:降采样、升采样,采样时间点变化。设置开始时间,长度为20天。设置截止时间,长度为20天。选取2000年5月的数据。每个月的最后一个工作日。选取2000年的数据。原创 2023-12-03 12:12:49 · 470 阅读 · 0 评论 -
【Pandas】3.3.知乎用户分析
统计各职业的博主数量。原创 2023-12-02 10:41:09 · 474 阅读 · 0 评论 -
【Pandas】3.2.共享单车骑行数据分析
删除最大值,可能是异常值。原创 2023-12-02 10:18:59 · 541 阅读 · 0 评论 -
【Pandas】3.1.分组运算
多重索引变换成dataframe。不同,行列进行了互换。原创 2023-12-01 13:24:46 · 634 阅读 · 0 评论 -
【Pandas】2.6.绘图
把三列画在三个字表,共享同一个x轴。取出第5行数据,画柱状图。原创 2023-12-01 13:09:33 · 768 阅读 · 0 评论 -
【Pandas】2.5.空难数据再处理
前20个国家的空难次数占所有空难次数的比值。前20个品牌的空难次数占所有空难次数的比值。这一行有一个nan值就会被记为True。中都没有nan,删除他们中的nan值。空难次数前20的地区。原创 2023-11-30 13:00:13 · 490 阅读 · 0 评论 -
【Pandas】2.4.布尔过滤和数据离散化分析
将数据大于零的置为1,小于零的置为-1。分成4类,从最小值到最大值区间平均划分。选取包含绝对值大于3的行。左闭右开,默认左开右闭。分成4类,样本个数等分。原创 2023-11-30 12:44:58 · 434 阅读 · 0 评论 -
【Pandas】2.3.字符串方法
去掉字符串开头结尾的空字符。原创 2023-11-29 13:04:32 · 476 阅读 · 0 评论 -
【Pandas】2.2.数据清理
对整个DataFrame替换。根据k1,k3进行去重。原创 2023-11-29 08:59:38 · 377 阅读 · 0 评论 -
【Pandas】2.1.合并数据集
根据one列进行横向合并,data1根据one1,data2根据one2。根据one列进行横向合并,左边根据two1,右边根据index。快速合并,根据index,且没有相同的列,index不同也可以。根据one列进行横向合并,只保留one中共有元素,交集。根据one列进行横向合并,根据index合并,并集。根据one列进行横向合并,以data1为准。根据one列进行横向合并,以data2为准。以data1为准,join data2。根据one列进行横向合并,并集。原创 2023-11-28 14:58:20 · 565 阅读 · 0 评论 -
【Pandas】1.5.简单分析 空难数据
选择空难次数最多的前十种机型。原创 2023-11-28 12:37:13 · 418 阅读 · 0 评论 -
【Pandas】1.4.数据的加载与存储
给表格添加列名并保存,不会多一列索引,使用。给表格添加列名并保存,但会多一列索引。也可以保存为json。原创 2023-11-27 11:52:08 · 514 阅读 · 0 评论 -
【Pandas】1.3.汇总统计方法与应用函数
函数,求每列最大值减最小值。新建DataFrame。新建Dataframe。统计每个值出现的次数。原创 2023-11-26 22:50:37 · 411 阅读 · 0 评论 -
【Pandas】1.2.DataFrame
单列是Series,多列是DataFrame。不赋值回去不会覆盖原dataframe。返回单个值,前面是行,后面是列。切片返回多行多列,前后都包含。切片返回多行多列,前包后不包。筛选,返回boolean值。取多列,效果和删除多列相同。但是不赋值回去不会删除成功。新建DataFrame。新建DataFrame。dataframe相加。原创 2023-11-25 22:41:37 · 647 阅读 · 0 评论 -
【Pandas】1.1.Series
【代码】【Pandas】1.Series。原创 2023-11-24 13:53:27 · 472 阅读 · 0 评论 -
【Matplotlib】6.显示中文与保存图像
【代码】【Matplotlib】6.显示中文与保存图像。原创 2023-11-23 12:59:50 · 446 阅读 · 0 评论 -
【Matplotlib】5.面向对象绘图
【代码】【Matplotlib】5.面向对象绘图。原创 2023-11-22 13:26:33 · 116 阅读 · 0 评论 -
【Matplotlib】4.绘制多图
【代码】【Matplotlib】4.绘制多图。原创 2023-11-21 10:07:44 · 193 阅读 · 0 评论 -
【Matplotlib】3.堆积图和饼图
【代码】【Matplotlib】3.堆积图和饼图。原创 2023-11-20 12:23:32 · 109 阅读 · 0 评论 -
【Matplotlib】2.数据可视化 箱型图 散点图
可用于观察数据分布,判断异常值。原创 2023-11-19 14:26:49 · 130 阅读 · 0 评论 -
【Matplotlib】1.数据可视化 折线图 条形图 直方图
【代码】【Matplotlib】1.数据可视化 折线图 条形图 直方图。原创 2023-11-18 11:09:00 · 686 阅读 · 0 评论 -
【Numpy】6.排序与搜索 随机数生成 文件读写
【代码】【Numpy】6.排序与搜索 随机数生成 文件读写。原创 2023-11-17 13:55:23 · 139 阅读 · 0 评论