自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 机器学习,关于np和pd

总的来说,NumPy适用于数值计算和处理多维数组的操作,而Pandas则更适合于数据清洗、处理和分析,提供了更高级的数据操作和处理工具。Pandas在NumPy的基础上提供了更多的数据处理、清洗、转换和分析操作,如数据整合、合并、筛选、分组、聚合等。Pandas中的Series和DataFrame可以容纳不同数据类型的列,并为缺失值提供了更灵活的处理方式。Pandas的Series和DataFrame使用标签索引,可以根据标签进行数据选择和操作,更方便地进行数据分析和处理。

2023-09-16 17:32:02 421 1

原创 机器学习,错误踩坑

这可能是因为输入的字符串包含了非数字字符,或者是空格或其他不可识别的字符。sklearn.base包的时候,它的输出结果会自动转变成np数组,之后可以使用DataFrame(data)把数据集转化回来。问题算是numpy没有,转换成pd,用dataFrame()方法。(没全懂就不要写那么多,最多来个encoding来显示解码)仔细检查代码,查找并修复语法错误,基本上就是拼写问题。2、缩进错误:检查代码块的缩进是否正确。在读取csv文件时,写了一个参数。1、括号不匹配:括号数量不匹配。

2023-09-16 11:48:04 58 1

原创 机器学习学习路程

我有一亿条数据,均对我的需求有高影响,但我不可能从一亿选择中,做出选择,写手应该给我缩减选项。通过删除Time列和转化一下At列,然后检测一下离群值,删去相关性不高的列,然后进行分箱处理,再往下来却发现直接0.99了,这算是方法错了吗?实话说,没想到自己会卡在数据预处理这里,现在想来也对,方法就那些,大不了来个集成化,最后谁更好,就看谁的数据处理的更完美。对呀,我现在只处理二十来列数据,如果数据更多,不说结果怎样,死用关联规则,电脑也许都不一定跑得起来。现在想来,建立关联规则,也许方法之一,但实用吗?

2023-09-07 18:31:19 33 1

原创 机器学习学习路程

(最小二乘法的详解,算是我查的,肯定不详细,但是这里不多赘述,因为在我看来,最普遍的应该是逻辑回归)逻辑回归只是对对线性回归的计算结果加上了一个Sigmoid函数,将数值结果转化为了0到1之间的概率,Sigmoid函数的图像一般来说并不直观,只需要理解对数值越大,函数越逼近1,数值越小,函数越逼近0。但我看来,机器学习不一样,它更像是编程语言的一种进阶,并不是说它很高大上,而是它一上来就没有所谓基础知识什么的,它直接从方法、编程步骤开始。不行,还是学的不精,就到这里了,之后会二编,尽量补充。

2023-09-06 19:37:37 69 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除