机器学习系列实验楼课程补充

Pandas数据处理基础

原课程:https://www.shiyanlou.com/courses/906

  1. Matplotlib中的%matplotlib inline:内嵌画图,不需要plt.show()
    参考:https://blog.csdn.net/liangzuojiayi/article/details/78183783
  2. numpy.random.randint用法:返回一个随机整型数,范围从低(包括)到高(不包括),即[low, high);大小(size):x*y
    参考:https://blog.csdn.net/u011851421/article/details/83544853
  3. Numpy 与 DataFrame对比与应用:数组和表?
    参考:https://www.cnblogs.com/yangzhizong/p/10118549.html
  4. 在python和numpy中切片:取2~4行=1:4=取索引1到索引4
    参考:https://www.cnblogs.com/Sinte-Beuve/p/6573246.html
  5. pandas模块drop函数的使用:DataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')
    其中参数:labels(标签或列表) columns(列名) axis=0:index axis=1:column
    参考:https://jingyan.baidu.com/article/cb5d6105b9d051005c2fe095.html

Matplotlib 数据绘图基础课程

原课程:https://www.shiyanlou.com/courses/1093

  1. 安装jupyter,并修改默认浏览器和工作区间
  2. matplotlib.pyplot.plot(*args, **kwargs)的理解:
    https://blog.csdn.net/u014539580/article/details/78207537
    https://blog.csdn.net/u011511601/article/details/82183889
  3. 神秘引申:为什么 np.sin(np.pi)的结果不为 0?
    https://www.v2ex.com/t/532190
  4. 饼图:https://www.cnblogs.com/zyg123/p/10504640.html
  5. axes.legend:图例
  6. 子图的自定义顺序排列:axes[0]
  7. rect.get_x() # 获取柱形图横坐标
  8. mpl_toolkits.mplot3dmatplotlib中专门画3d的工具包
  9. np.arange:格式np.arange([start, ]stop, [step, ]dtype=None),用于创建等差数列。
    start:可忽略不写,默认从0开始;起始值
    stop:结束值;生成的元素不包括结束值
    step:可忽略不写,默认步长为1;步长
    dtype:默认为None,设置显示元素的数据类型
    参考:https://www.jianshu.com/p/d7d3ae1f096f
  10. fig.add_subplot(234):2*3网格,第四子图
    参考:https://www.jianshu.com/p/7b68e01952b4

机器学习开放基础课程

原课程:https://www.shiyanlou.com/courses/1283

实验1:使用Pandas进行数据探索

  1. Python中的Warnings模块忽略告警信息:import warning warnings.filterwarnings("ignore")
    参考:https://blog.csdn.net/u013544265/article/details/28617527
  2. bool类型:布尔
  3. ascending=False 倒序排列,True正序
  4. ilocloc的区别:位置索引和标签索引
    参考:https://blog.csdn.net/qiao8756/article/details/80843440
  5. lambda用法:lambda argument_list: expression
    参考:https://blog.csdn.net/zjuxsl/article/details/79437563
  6. describe(percentiles=[]):查看分布情况
  7. pivot_table:pandas透视表具体操作
    https://www.cnblogs.com/onemorepoint/p/8425300.html
  8. normalize=True:计算占比
    参考:https://www.cnblogs.com/keye/p/9664414.html
  9. seaborn模块:数据可视化
    https://www.jianshu.com/p/94931255aede
  10. 交叉表:后加.T是倒置
    https://blog.csdn.net/hustqb/article/details/78086394

实验2:Python数据可视化分析

  1. plot()函数详解
    https://blog.csdn.net/brucewong0516/article/details/80524442

  2. 四分位距

    如果有一个数,它大于的数据个数有整个数据的25/100,就称第1四分位数,如果有一个数,它大于的数据个数有整个数据的75/100,就称第3四分位数,
    第1四分位数和第3四分位数的差的1/2,就称标准四分位距,它是测定一个分布的离散程度的。

  3. 箱型图读图
    https://blog.csdn.net/uinglin/article/details/79895993

  4. 未解决:_, axes = plt.subplots(1, 2, sharey=True, figsize=(6, 4))(为什么在axes前有_,,不添则报错)
    补充问题:相同用法fig, axes=,搜索可能得解释:此函数同时返回一个figure图像和一个子图ax的array列表。
    参考:https://www.cnblogs.com/nju2014/p/5620776.html

  5. pandas中的.corr()函数用法:

    1. corr()可以计算两列值得相关系数,默认用的是pearson相关系数
      (参考:http://wenda.chinahadoop.cn/question/5146
    2. 相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱
      (参考:https://baike.baidu.com/item/Pearson相关系数/6243913?fr=Aladdin
  6. 笛卡尔坐标系:笛卡尔坐标就是两条(或三条)不相交的坐标轴组成的坐标系,当这两条坐标轴互相垂直的时候就是正交(也称直交)坐标系。所以直交坐标系是笛卡尔坐标系的一个特例,如果不加以强调的话,也可以默认笛卡尔坐标就是指直交坐标系。

  7. jointplot()用法:综合散点图
    强力安利:https://blog.csdn.net/qq_42554007/article/details/82625118

  8. %config InlineBackend.figure_format的解释

    虽然交互式 GUI 具有其独特的优势,但在使用 IPython Notebook 或 Qtconsole 时,显示直接嵌入 notebook 中的 Matplotlib 生成图形通常更方便。此行为是使用 IPython 命令 %matplotlib inline 激活的,该命令激活为 IPython 提供支持的“内联(inline)后端”。这会将 Matplotlib 配置为使用非交互式后端生成图形,然后将其显示为 IPython Notebook 中的静态图像。IPython “内联后端” 也可以使用 IPython的 %config 命令进行微调。例如,我们可以使用 InlineBackend.figure_format 选项(对于 Mac OS X 用户 %config InlineBackend.figure_format=‘retina’ 是另一个有用的选项,它能提升 Matplotlib 图形在 Retina 屏上的质量)生成图形的输出格式。

         %matplotlib inline
         %config InlineBackend.figure_format='svg' 

    参考:https://blog.csdn.net/And_w/article/details/79944188

  9. lmplot():回归模型;fit-reg:如果为真,返回xy有关线性回归模型。
    参考(1):https://www.sohu.com/a/164340723_718302
    参考(2):http://seaborn.pydata.org/generated/seaborn.regplot.html

  10. enumerate() 函数:将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。
    参考: https://www.runoob.com/python/python-func-enumerate.html

  11. catplot()用法:分类型数据绘图
    https://blog.csdn.net/u013317445/article/details/88196373
    参数参考:https://blog.csdn.net/wmx3ng/article/details/82418712

  12. groupby():分类
    https://blog.csdn.net/m0_37870649/article/details/80979809

  13. sort_values:排序函数
    模板:DataFrame.sort_values(by=‘##’,axis=0,ascending=True, inplace=False, na_position=‘last’)
    部分参数:by(指定列名和索引值)、ascending(true为升序)
    参考:https://blog.csdn.net/MsSpark/article/details/83154128

  14. t-SNE算法理解
    http://bindog.github.io/blog/2016/06/04/from-sne-to-tsne-to-largevis/

  15. StandardScale():预处理数据,标准化
    https://blog.csdn.net/sinat_33761963/article/details/53433799

  16. fit_transform:fit+transform
    https://blog.csdn.net/weixin_38278334/article/details/82971752

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
目 录 ............................................................... I 实验 1 监督学习中的分类算法应用 .................................. - 1 - 实验目标 .................................................. - 1 - 实验软、硬件环境 .......................................... - 1 - 实验任务.................................................. - 2 - 实验 1.1 Python 开发环境搭建 ...................................... - 2 - 实验目标 .................................................. - 2 - 实验任务 .................................................. - 2 - (1)Python 安装与配置 ............................. - 2 - (2)Pycharm 安装和配置 ............................ - 4 - (3)Python 中安装第三方库 ........................ - 11 - 实验 1.2 K-近邻算法实现 ......................................... - 14 - 实验目标 ................................................. - 14 - 实验任务 ................................................. - 14 - (1)电影类别分类 ................................. - 14 - (2)约会网站配对效果判定 ......................... - 14 - 实验 1.3 决策树算法实现 ......................................... - 16 - 实验目标 ................................................. - 16 - 实验任务 ................................................. - 16 - (1)银行房屋贷款申请 ............................. - 16 - (2)患者佩戴隐形眼镜类型预测 ..................... - 17 - 实验 1.4 朴素贝叶斯算法实现 ..................................... - 19 - 实验目标 ................................................. - 19 - 实验任务 ................................................. - 19 - (1)文本分类 1 ................................... - 19 - (2)文本分类 2 ................................... - 19 - 实验 1.5 Logistic 回归算法实现 ................................... - 21 - 实验目标 ................................................. - 21 - 目 目 录 II 实验任务 ................................................. - 21 - (1)构建 Logistic 回归分类模型 .................... - 21 - (2)预测患疝气病的马的存活问题 ................... - 21 - 实验 1.6 SVM 算法实现 ............................................ - 23 - 实验目标 ................................................. - 23 - 实验任务 ................................................. - 23 - (1)构建 SVM 分类模型 ............................. - 23 - 实验 1.7 监督学习中的分类算法综合应用 ........................... - 24 - 实验目标 ................................................. - 24 - 实验任务 ................................................. - 24 - (1)手写识别系统 ................................. - 24 - (2)电子邮件垃圾过滤 ............................. - 25 - 实验 2 监督学习中的回归算法应用 ................................. - 26 - 实验目标 ................................................. - 26 - 实验软、硬件环境 ......................................... - 26 - 实验任务 ................................................. - 26 - (1)鲍鱼年龄预测 ................................. - 26 - (2)乐高玩具价格预测 ............................. - 27 - 实验 3 无监督学习中的聚类算法应用 ............................... - 29 - 实验目标 ................................................. - 29 - 实验软、硬件环境 ......................................... - 29 - 实验任务 ................................................. - 29 - (1)使用 K 均值算法对数据进行聚类分析 ............. - 29 - (2)对地图上的点进行聚类 ......................... - 30 -
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值