2018.01.28.一周机器学习周记

时间:2018.01.28.一周


主要内容


1.TensorFlow环境搭建完工

2.把jupyter notebook 用起来

3.拓展:实践Python圈中的符号计算库-Sympy

4.继续对腾讯算法大赛进行项目研究

  4.1 为进一步了解体会机器学习的流程,实践了两个微型精简项目(关于sklear提供的数据集iris)

  4.2 特征工程在项目中举住轻重,由此本周还拜读了一篇有关于特征工程的优秀文章并实践了相关实例



内容概况


TensorFlow环境搭建

  具体内容整理于文档 关于TensorFlow的安装和心得


jupyter notebook

  具体内容整理于文档 关于Jupyter notebook的安装以及一些使用心得


符号计算库-Sympy

  Sympy库提供了诸多符号计算的方法函数,如解方程、解方程组(二式二元一次方程组可以用一行代码解决)、函数赋值运算、求导数及偏导数、求积分、求极限的函数等等,十分实用,方便快捷!此处附上相关文档链接


关于腾讯算法大赛

  具体内容整理于文档 关于腾讯算法大赛


两个关于数据集iris精简项目

  参考文档 scikit-learn-intro

项目一思路及步骤总结

1.抽取特征(萼宽,瓣长)

2.散点画图(x,y|萼宽,瓣长)完成直观分布

3.染色完成分类(染色分类依据每条记录对应的target属性值及其值对应的target_names,即何值何类何色)

补充:关于clim函数:matplotlib官方文档->docs->The Pyplot API->clim

项目一代码解析


9125154-597032f908db5e9f.PNG

项目一实现


9125154-44fe935f3d627e35.PNG

项目二代码


9125154-bdc73d4e820ea297.png

项目二实现


9125154-0d68ddccff11eba2.png
特征工程解读

   参考文档 使用sklearn做单机特征工程

补充

1.哑编码实例:(参考于使用scikit-learn对数据进行预处理

>>>from sklearn.preprocessing import OneHotEncoder

9125154-53a564f4b723e30a.png

2.连续型特征:相对于离散型特征而言

3.缺失值

4. “2.5 数据变换”中多项式的“度”:可以联想一下“阶”进行思考

5.关于lamda  :python lambda的用法

6.关于filter对象的注意事项:filter函数

7.利用sklearn训练LDA主题模型及调参详解

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

凌川江雪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值