- 博客(32)
- 资源 (2)
- 收藏
- 关注
原创 关于阅读顺序、数据获取和笔记的逻辑。欢迎大家一起学习,共同成长。
事情再多,一件一件来,永远只有一件事情;乱七八糟的状态哪怕只有一件事,也会晕得七荤八素的。条理。理性。
2019-01-14 12:08:28 340
原创 2.excel—if、vlookup(hlookup)、match函数
最近在某五百强公司做数据分析的实习工作,除了一些sql以外,发现需要在excel里面的操作很频繁,包括一些函数、数据有效性,插件等,笔记一一补起来。
2019-07-24 15:17:08 1480
原创 9.sklearn——logistic regression 参数解释 及 案例
sklearn logistic regression;参数;案例;混淆矩阵。
2019-05-31 17:40:10 10221
原创 5.python~递归(em......)
最近的学习总是绕不开递归的这个东西了,我决定学一下这个东西,刚接触还是理解有点问题,感觉理解了,也就那么回事,可是合上书,关掉博客,自己一写就一脸懵逼。多写写应该会好点,练上二十到题我再来BB。1.递归问题,从整数阶乘引入该问题。设函数 f(n)=n!=1∗2∗3∗⋅⋅⋅∗(n−1)∗nf(n)=n!=1 * 2 * 3 * ···* (n-1) * nf(n)=n!=1∗2∗3∗⋅⋅⋅∗(n...
2019-04-17 22:42:05 329
原创 2. 数据结构——串(python描述)
参考文献:[1]张光河.数据结构——python语言描述[M]. 北京:人民邮电出版社,2018,161-185.[2]文章目录1. 串1.1 串的基本概念1.2 串的顺序存储及运算1.3 串的链式存储及运算1. 串字符串通常被称为串。顺序存储链式存储模式匹配1.1 串的基本概念长度:字符个数空串:string="",长度为0空格串:stringBlank=" ",仅...
2019-04-01 21:37:12 1979 2
原创 【实习总结】特征工程、降维、随机森林调参(思维脑图)
非常感谢实习期间带我的师兄对我的指导。这个思维脑图是有道云笔记做出来的,没有图片分享功能,但是可以网页链接分享,全图看这里:点击这里!传送门!然后我这个总结基本上是我实习干的工作,在总结的时候有参考以下几篇博客:第一篇:阿里云栖社区-特征工程,点击!传送门第二篇:新闻?点这儿查看原文第三篇:标准化和哑变量处理、无监督分箱,传送门!以上。...
2019-03-29 14:54:41 1345 1
原创 3.python的几个函数:itertools.combinations()排列组合、zip()压缩打包、format、enumerate、np.linalg.norm求范数
1.itertools.combinations()排列组合2.combinations_with_replacement(),可重复组合3.zip()压缩打包4.format()5.enumerate()6.np.linalg.norm求范数
2019-03-26 12:02:11 1368
原创 jupyte使用方法(清华镜像暂时停用,改配置中科大镜像)
1.清华镜像站的配置。2,jupyter 的默认文件夹配置。3.jupyter的常用快捷键。
2019-03-24 16:46:37 3059
原创 8.关于python里面的混淆矩阵(confusion_matrix)排列问题,与教科书、R语言、SPSS都反着的!!!
python里面的混淆矩阵(confusion_matrix)排列问题,true 和 predict 的位置是反着的,并且positive 和negative也反着排列的!!!与教科书、R语言、SPSS都反着的!!!如果是从R转过来使用python的话,这个小偏差会造成巨大巨大巨大的损失!
2019-03-08 14:06:35 2958 1
原创 7.关于ADASYN使用中出现两种类型的报错
1.在使用ADASYN自适应综合过采样处理不平衡数据的时候遇到一个错误: No samples will be generated with the provided ratio settings.2.TypeError:fit_resample() missing 1 required positional argument: 'y'
2019-03-05 18:18:17 1932
原创 6.sklearn(机器学习)—简介分类和回归
现在的机器学习这么火,无论是推荐算法还是预测模型。本质上无非就是回归与分类两个问题。回归问题离不开均方误差,分类问题离不开距离公式、混淆矩阵、损失函数。本文简介常用的回归和分类算法。
2019-01-30 18:11:04 803
原创 5.sklearn之转换器(划分训练集和测试集、以及标准化、归一化数据会用transform,独热编码也会用到)
在sklearn中划分训练集和测试集、以及标准化、归一化数据
2019-01-29 17:04:19 5054 1
原创 3.sklearn—聚类分析详解(聚类分析的分类;常用算法;各种距离:欧氏距离、马氏距离、闵式距离、曼哈顿距离、卡方距离、二值变量距离、余弦相似度、皮尔森相关系数、最远(近)距离、重心距离)
聚类分析的分类;常用算法;各种距离:欧氏距离、马氏距离、闵式距离、曼哈顿距离、切比雪夫距离、卡方距离、二值变量距离、Jaccard距离、余弦相似度、汉明距离、皮尔森相关系数、最远(近)距离、重心距离、ward方法(离差平方和距离)、组间平均链锁距离、组内平均链锁距离;
2019-01-25 17:19:01 12550 2
原创 2.sklearn—评价指标大全(平均误差、均方误差、混淆矩阵、准确率、查全率、查准率、召回率、特异度,F1-score、G-mean、KS值、ROC曲线、AUC值、损失函数、结构风险最小)
平均误差、均方误差、混淆矩阵、准确率、查全率、查准率、召回率、特异度,F1-score、G-mean、KS值、ROC曲线、AUC值、损失函数、经验风险最小、结构风险最小
2019-01-23 17:27:13 35333 8
原创 1.关于scikit-learn简介
说明:这个sklearn系列的笔记,在我的分类scikit-learn里面,主要介绍常用的模型的参数,并且附带数据、案例、代码、结果。这个系列的笔记不会限于sklearn,还会包括一些时间序列(StatsModels)、词云(jieba & wordcloud)、LDA(NLP的最最最简单部分)。笔记整理自一下书目(同时推荐这些书,书中有交叉知识,我个人比较喜欢第一本):张良均,王...
2019-01-22 12:59:46 859
原创 4.pandas数据预处理(完)(数据清洗:重复值、异常值、缺失值;标准化、哑变量、离散化、无监督分箱)
整理完了。附带数据、代码、结果。
2019-01-14 17:57:35 9636 12
原创 3.Matplotlib数据可视化基础(下)(散点图、折线图、直方图、饼图、箱线图)
接上文笔记说明:本文是我的学习笔记,大部分内容整理自 黄红梅,张良均等.Python数据分析与应用[M].北京:人民邮电出版社,2018:52-77. 还有部分片断知识来自网络搜索补充。可视化这块的内容我以后会专门学习一本参考书然后整理笔记的,现在仅仅是整理上述参考书的一个章节的基础知识。接上文的目录2.2折线图两个栗子!2.2折线图plt.plot()参数名称说明...
2019-01-14 11:49:30 2137
原创 3.Matplotlib数据可视化基础(上)(pyplot、rc参数、散点图、折线图)
笔记说明:本文是我的学习笔记,大部分内容整理自 黄红梅,张良均等.Python数据分析与应用[M].北京:人民邮电出版社,201852-77. 还有部分片断知识来自网络搜索补充。可视化这块的内容我以后会专门学习一本参考书然后整理笔记的,现在仅仅是整理上述参考书的一个章节的基础知识。
2019-01-10 17:50:54 2289
原创 2.pandas统计分析基础(读取数据、dataframe、索引)
笔记说明:本文是我的学习笔记,大部分内容整理自 黄红梅,张良均等.Python数据分析与应用[M].北京:人民邮电出版社,2018,80-130. 还有部分片断知识来自网络搜索补充。推荐 这个博客帖子https://blog.csdn.net/hhtnan/article/details/80080240文章目录1.读写文本文件1.1文本读取1.2文本文件储存1.3读写excel2. 掌握da...
2019-01-09 17:59:02 1291 1
原创 2.python基础知识(分支循环、列表、元组、字典、集合、函数)(一)
笔记说明:这是我的学习笔记,这部分内容整理自小甲鱼的python零基础入门,但不限于小甲鱼。目录文章目录目录基础知识分支循环列表、元组、字典、集合、函数列表、元组函数字典与集合基础知识import osos.getcwd()os.chdir('D:\codes\python')print('i love python \n' *3)"""---小甲鱼说这是一个游戏,哈哈哈哈哈-...
2019-01-09 00:54:00 307
原创 1.Numpy数值计算基础(随机数、索引、数组形状、矩阵、去重、排序)
笔记说明:本文是我的学习笔记,大部分内容整理自 黄红梅,张良均等.Python数据分析与应用[M].北京:人民邮电出版社,2018,21-49. 还有部分片断知识来自网络百度。一个目录1.数组对象ndarray1.1创建数组类型1.1.1数组属性1.1.2数组创建1.2生成随机数1.3索引访问数组1.3.1一维数组的索引1.3.2多维数组的索引1.4变换数组的形态1.4.1 改变数组形状1.4....
2019-01-08 16:19:08 749
pandas数据预处理数据
2019-01-14
国民经济核算季度分数
2019-01-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人