自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 SQL基础语句总结

写在前面:SQL是工作中一个非常重要的工具,它使用的关键字和语法并不复杂,今天稍作总结,加深记忆。

2016-10-11 11:38:52 486

原创 推荐系统实践学习笔记(二):代码实现

写在前面:今天基于Movielens数据集把《推荐系统实践》上的部分算法实现了一下,顺便巩固python和pandas库的使用,发现书本上的代码有很多不靠谱之处(也许是我水平不够),所以基本都是自己写的,不当之处,还望指正。

2016-10-08 15:33:39 7518 4

原创 推荐系统实践学习笔记(一)

写在前面:这几天学习了一下《推荐系统实践》这本书,出于兼顾学生读者和工程师读者的考虑,作者在理论上讲得不算太深,但是非常系统、全面。由于看得比较快,其中的方法没有来得及一一实现,打算写几篇博客记录一下,便于日后有空时翻看实践。

2016-10-02 21:26:40 4359

原创 机器学习基础(二):决策树

写在前面:决策树是一种常用的分类方法,也是我开始学习数据挖掘后接触的第一个算法,它的原理非常好理解,但在学习过程中也有一些容易忽略的细节,今天就来总结一下。

2016-10-02 15:10:46 1377

原创 机器学习基础(一):K-means聚类

写在前面 前几天参加了我在校招季的第一次面试,发现整个过程中只有讲到自己课题的时候才特别流畅,果然熟练度是一样很难替代的东西,只有花时间实践才能不断地加强。和面试官的交流让我意识到自己学习方法的不足,以往对待任何问题,只是习惯地去看公式、敲代码,很少彻底地/从数学的角度思考:这种方法为什么能解决这个问题?所以,今天我想好好总结一下几种最基础的机器学习算法,弥补之前学习的纰漏之处。

2016-09-27 19:10:36 1351 1

原创 拉勾网职位数据爬取与分析(一)

写在前面:开始数据挖掘的学习已有一段时间,由于研究生阶段一直使用C++,代码的熟练度还远远不够,对算法的理解也不够深刻。因此,想要写点东西记录自己学习的过程,希望可以在积累中不断提升自己。今天写一写最近几天爬取分析拉勾网岗位数据的过程,用到了python数据整理常用的pandas库、可视化操作的matplotlib和seaborn库、爬虫算法常用框架scrapy。

2016-09-23 22:30:00 6897 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除