自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 在pyCharm Community中创建django项目

在pyCharm Community中创建django项目pyCharm professional 与 pyCharm Community在创建django项目时不同。其中专业版在安装django模块后,可直接在创建new project 中选择django项目。但是社区版则需要在命令行下输入命令进行创建,基于两者不同,并且暂时不能获得pyCharm professional版本,所以记录社区版本怎么创建。1. 安装djangopip 工具因为已经全局环境可使用,所以在任何路径下都可以 pip(不确认

2021-06-01 07:11:07 658

原创 机器学习项目清单(5)

选择与训练模型… …对于模型本身的研究并不在这里面进行讨论。而训练模型的重要的思想是:在合理的时间训练有效的模型(数据集很大的话,需要采样为小数据集)、使用交叉验证进行筛选模型、查看分析每个算法最重要的变量、分析各个模型产生的错误类型,讨论手动怎么识别这样的错误、快速进行特征选择与处理;列出较为有效的2-5个模型并存储。… …在合理的时间训练有效的模型在合理的时间是十分有必要进行说明与强调的,无论是理论研究还是工程思维,合理的时间都是科学方法之一。训练模型过程中不需要进行模型本身的讨论,此

2021-01-14 19:47:25 103

原创 机器学习项目清单(3)

机器学习项目清单(3)… …研究数据以获取灵感… …对数据的研究不需要额外再进行讨论,按照流水线般的数据研究工作就可以。大致包含部分:数据之前准备工作、数据探索准备工作、常用的几个分析方法、数据总结。然后这个工作需要因为对数据有可能进行补充,所以是一个需要循环的工作。…数据之前的准备工作在之后的所有项目的甘特图当中,这个部分预先补充,进行操作。创建数据副本如果数据集很大,创建一个探索集(要注意分层抽样),如果数据集不大,可以采用副本直接进行分析。分析的工作确保数据具有一定的代

2021-01-12 18:51:50 102 1

原创 机器学习项目清单(2)

机器学习项目清单2. 获取数据Aurelien Geron 关于获取数据的清单如下列出需要的数据及其体量查找并记录获取数据的途径检查需要的空间检查法律义务,必要时获取授权获取访问权限创建工作空间(确保具有足够的存储空间)获取数据将数据转化为可操作的格式(不改变数据本身)确保删除或保护敏感信息(例如、匿名)检查数据的类型和大小(时间序列、样本、地点等)采样一个测试数据集,放在一边,永远不要用它(没有数据窥视)。… …以上完整的记录了《机

2021-01-11 18:13:42 157

原创 机器学习项目清单(1)

机器学习项目清单机器学习项目清单最重要得是其中得思想,在工作中得应用虽然也很值得推广,但其思想更值得重视。…不过在《机器学习实战》Aurelien Geron 的书中,并没有讨论真实工作场景中管理在其中的作用。其原因大多是巨头互联网公司在机器学习项目组中,其管理者也都是技术人员,所以更多的精力会集中在机器学习本身的理论与实践结合后的指标提升中或者项目本身对业务的推动效用中,其创造性或者容错性更强。但一些互联网结合业务中的公司,因为更加重视业务性,所以在这方面的管理者容易是业务管理者,那这个问题将在业务

2021-01-08 17:51:30 192

原创 学习笔记-数据分析

数据分析jupyter notebook1. 研究下,怎么在pycharm里面应用jupyter,因为如果在浏览器使用的话,需要的步骤挺多的 a. 需要在自己确定的一个文件夹里创建,所以需要cd 过去 b. jupyter notebook c. 粘贴url 4. 再创建文件夹2. 还有一个原因,jupyter 自己不提示命令: pip install jupyter_contri...

2020-03-03 12:05:09 203

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除