机器学习
Pepei.
一步一步变成自己的大佬
展开
-
机器学习100天——第一天(数据预处理)
step 1:导入库 NumPy:包含数学计算函数 Pandas:用于导入和管理数据集 step 2:导入数据集 数据集通常都是 .csv格式。CSV文件以文本形式保存表格数据。文件的每一行是一条数据记录。 用 Pandas 的 read_csv 读取本地csv文件为一个数据帧。 ...原创 2019-04-12 13:38:00 · 245 阅读 · 0 评论 -
机器学习100天——第三天 (多元线性回归)
虚拟变量(Dummy Variable)和虚拟变量陷阱(Dummy Variable Regression) 虚拟变量又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的质变量,通常取值为0或1。 引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到两个方程的作用,而且接近现实。 例如,反映文程度的虚拟变量可取为:1:本科学历;0...原创 2019-04-21 16:52:31 · 451 阅读 · 0 评论 -
python_5.fit()函数,transform()函数,与fit_transform()函数
参考博客: https://blog.csdn.net/weixin_38278334/article/details/82971752 https://blog.csdn.net/quiet_girl/article/details/72517053 https://blog.csdn.net/anshuai_aw1/article/details/82498374 sklearn里的封...转载 2019-04-15 14:22:10 · 14368 阅读 · 0 评论 -
机器学习100天——第7天(K近邻法)
一篇非常好的参考博客:https://blog.csdn.net/c406495762/article/details/75172850#commentBox 1、KNN基础概念 KNN作为一种有监督分类算法,是最简单的机器学习算法之一,顾名思义,其算法主体思想就是根据距离相近的邻居类别, 来判定自己的所属类别。算法的前提是需要有一个已被标记类别的训练数据集,具体的...转载 2019-04-24 20:43:58 · 148 阅读 · 0 评论 -
信用卡欺诈检测——唐宇迪
听课之后进行了思维导图的逻辑总结,网上的博客分享很多,基本上也写的都很详细。所以我就作为参考,自己先不写详细的博客了,后续再对实际案列进行实践的时候,会在反复琢磨,现在仅作为快速入门。 https://blog.csdn.net/mountain623/article/details/80128812 https://blog.csdn.net/weixin_35885196/article/...转载 2019-08-19 20:42:08 · 285 阅读 · 0 评论