自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 python爬虫学习roadmap

Python中常用的爬虫根据包括scrapy,requests+bs4等,链接中(点这里)最后一部分”Web scraping”有两种方法的比较。总体来讲,大家比较推荐用scrapy。网络抓取需要用到Python的Scrapy包,Chrome浏览器以及Xpath表达式。Scrapy教程可以参考1和2。可以一边阅读一边运行几个样例代码。Chrome浏览器主要用开发者工具中的Elements以及Net

2017-06-05 11:22:27 829

原创 远程服务器设置jupyter

先按照链接(点这里) 在服务器端配置。配置完成后一般就可以在自己的浏览器输入https://IP:JupyterPort,密码访问jupyter了。 如果不行,那么可以尝试使用远程端口映射的方法。 比如在本地shell运行ssh username@IP -L127.0.0.1:newPort:127.0.0.1:JupyterPort,然后在本地浏览器输入https://127.0.0.1:ne

2017-04-06 21:34:06 649

转载 MarkDown使用方法

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2017-04-06 21:22:29 308

原创 XGBoost使用说明

在下面我将逐渐补充XGBoost学习过程中使用的资料等内容。

2017-03-03 15:47:53 5847

原创 XGBoost处理缺失值(Null)问题

对于数据缺失的问题,XGBoost设计了很好的默认机制处理这个问题。以下摘自陈天奇在GitHub讨论组中的讨论。 You can directly feed data in as sparse matrix, and only contains non-missing value. i.e. features that are not presented in the sparse fea

2017-03-02 16:36:29 14348 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除