2020年01月_Robin_Pi

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创机器学习——Sklearn学习笔记——总章

Sklearn学习笔记 0| 总章写在前面预处理模型选择算法分类回归聚类降维写在最后写在前面Sklearn 官方文档相当地详实，反而显得对初学者学习不太友好。本 “学习笔记” 系列就是参照Sklearn官方文档整理而得，结构上基本维持不变，内容少会有少许删减（过于详细和”偏“），以便自己以后查阅和复习。预处理模型选择算法分类回归聚类降维写在最后后续还会继续更新 “学习总结”...

2020-01-14 14:10:21 733

原创 Python数据分析之可视化——用 Seaborn 做数据可视化（0）总章

目录1. 介绍＆框架1.1 Seaborn 与 Matplotlib 的关系1.2 Seaborn 的优势1.31.4 框架（理解）2. 绘图函数2.1 可视化统计关系2.2 可视化分类数据分类散点图同类观测值分布同类统计评估可视化“宽型”数据使用分面图进行多变量关系分析2.3 可视化数据集的数据分布可视化单变量分布可视化双变量分布（二元分布）可视化数据集中的成对关系2.4 可视化线性关系绘制线...

2020-01-13 09:48:51 757

原创 Robin的技术博客导航（2020）

目录PythonPython 编程Python 常用库（Numpy、Pandas、Matplotlib）数据分析数据挖掘数据分析机器学习（传统）sklearn深度学习NLPCV网课学习打卡总的目标是数据科学。知识总结Python包括 Python 编程、Python 库、Python数据结构与算法Python进阶之路Python 编程Python 常用库（Numpy、Pandas、M...

2020-01-07 16:52:23 371

原创 Python 进阶之路（一）Python 核心知识 ——框架＆总章

目录一. 写在前面1. 反思＆搭建框架2. 参考＆资料二. Python 从基础到进阶1.1 基础篇之「基础&数据类型&控制流」1.2 基础篇之「函数&函数式编程」1.3 基础篇之「模块&面向对象编程」1.4 基础篇之「文件对象&错误处理」2.1 数值计算库之「NumPy」2.2 值计算库之「Pandas」2.3 数据可视化之「Matplotlib」3.1....

2020-01-07 15:21:46 576

原创如何使用NumPy快速创建我们需要的数据？

不论是在平时的零碎学习还是网课的学习中，在代码上现实或者跑通一个算法或者模型不仅能够让自己理解的更深还能加强我们的记忆。所以，专门花点时间学习一下如何创建和组织出我们想要的数据很有必要。NumPy 数组NumPy 数组需要注意的一点是，数组是相同类型的元素按照一定顺序排列的组合。NumPy 数组的生成方式：生成一般数组生成一维数组：传入列表生成元组的数组：传入元组生成多维数组：传入嵌...

2020-01-06 17:23:23 1414

原创 Python数据分析之可视化——用一篇文章总结：matplotlib、Pandas、seaborn

目录1. 使用 matplotlib 进行数据可视化1.1 基础概念1.2 核心步骤：画图三步走1.3 详细介绍：1.建立画布2. 建立坐标系（确定画图区域）3. 设置坐标轴设置坐标轴的标题设置坐标轴的刻度设置坐标轴的范围其他设置5.绘制图表6.图标显示1.4 常见问题1.5 极简代码实现一个坐标系多个坐标系2. 使用 Pandas 进行数据可视化线图条形图直方图箱线图散点图饼图3. 使用 sea...

2020-01-06 11:54:55 3205

原创 AI 之路——数据分析（1）Pandas小结与框架整理

写在前面主要是阶段性框架总结AI 之路：数据分析——机器学习——深度学习——CV/NLP工具/技能：Python、NumPy、Pandas、Matplotlib——Scikit-learn；LR、SVM…——TensorFlow、Keras、Pytorch；CNN、RNN…数据分析使用 NumPy 或者 Pandas 进行数据分析，后者更为强大和专业，而且有自己的 Matplotli...

2020-01-04 18:02:19 443

原创 Python 数据类型（1）序列

Python 数据类型之序列概念操作内置函数概念操作内置函数

2020-01-18 18:19:20 323

原创 Python 标准数据类型

Python 核心知识 1 —— 数据类型1. 类型2. 标准类型2.1 标准数据类型2.2 标准类型操作符2.3 内置函数3. 数值类型4. 其它1. 类型2. 标准类型2.1 标准数据类型2.2 标准类型操作符2.3 内置函数3. 数值类型4. 其它...

2020-01-17 23:07:05 227

原创深度之眼比赛实战（未来销售预测）项目记录——3——基础模型Baseline

任务学习时长：1/16——1/17任务名称：特征工程的数据预处理对排名的提升任务简介：特征工程之数据预处理详细说明：本节是在上一节的基础上进行新的数据预处理和数据的特征工程的方式，包括：数据清洗、数据的特征重做、以及数据特征的增加等，最后利用xgb算法去进行拟合，并预测之后得到结果。并利用kaggle的notebook来运行代码并提交结果。通过不同的特征工程的知识进行添加可以得到不同的...

2020-01-17 16:23:49 271

原创 python数据分析——数据结构

0117 先搭框架，待完善！数据数据结构Python及相关库中的经常用到数据结构形式汇总：列表特性：有序、可变存储内容：任何数据（不同类型）结构形式：[ 2020, 'is', $$, [2019, 'was', ￥￥] ]所以，见到下面这样的数据也不要觉得惊奇：它也是列表data = [['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada...

2020-01-17 11:46:00 272

原创深度之眼比赛实战（未来销售预测）项目记录——2——基础模型Baseline

任务学习时长：1/14任务名称：特征工程以及构建baseline任务简介：数据预处理，特征选择以及特征重做，构建baseline提交有成绩详细说明：针对于数据的处理与特征之间的重做和上一个比赛的一样，构建baseline提交，利用自己查找到的背景资料来进行特征工程对于成绩的提高。代码下载链接：https://pan.baidu.com/s/19oJnAwp6vBBZa6b5-OZmCg...

2020-01-16 12:29:47 251

原创机器学习——Sklearn学习笔记（2）模型选择和评估

Sklearn学习笔记（2）模型选择和评估写在前面SML基本步骤基本概念1. 交叉验证：评估评估器的性能2. 交叉验证的指标cross_val_score()cross_validate()通过交叉验证获取预测3. 交叉验证的迭代器Kfold()RepeatedKFold()LeaveOneOut()LeavePOut()ShuffleSplit()StratifiedKFold()、Strati...

2020-01-14 22:54:32 2847 1

原创 Sklearn学习笔记（1）——数据预处理

Sklearn学习笔记 1-数据预处理写在开始1. 标准化/去均值和方差缩放目的原因：具体实现：StandardScaler()2. 将特征缩放至特定范围内2.1 MinMaxScaler() ：缩放到0 和 1 之间2.2 MaxAbsScaler()3. 归一化3.1 normalize ()3.2 Normalizer()4. 类别特征编码4.1 OrdinalEncoder ()4.2 O...

2020-01-14 12:57:46 907

原创深度之眼比赛实战（未来销售预测）项目记录——1——赛题分析

任务学习时长：1/13——1/14任务名称：赛题解读以及数据下载导入、赛题的理解分析任务简介：赛题的初步理解分析详细说明：本节将会赛题的背景资料的了解以及数据文件的分布以及数据的下载以及本地导入，赛题的理解分析通过对构建自己对构建特征来说有一个比较大的作用，针对于数据的解读来说比较重要的一环。数据的解读包括数据的EDA、数据的可视化，数据的类型、数据的文件分布、数据的特征组合的一些猜测...

2020-01-14 00:51:57 661

原创深度之眼Kaggle比赛实战项目记录—8—一周学习任务总结

任务任务时长：1/12任务简介：温故而知新，详细总结回顾本阶段所学习内容，与同学分享自己在学习和作业中遇到的问题。详细说明：每第一阶段的学习任务都比较重，第一次学过之后特别容易忘，所以及时做一个要点回顾，会让学习效率大大的提升。如果复习时还有很多不会的，一定要和小伙伴交流或询问助教和老师，不要把问题留到下一阶段。打卡截止时间：1/12打卡内容：图片至少1张，一周总结反思打卡操作...

2020-01-14 00:27:08 424

原创深度之眼Kaggle比赛实战项目记录—7—第二周第二节特征工程知识点的讲解以及特征工程对成绩的提高（二）

任务作业名称（详解）：截图排名top20%及以上，描述一下模型的叠加对结果的影响，还有哪些方法可以对成绩有所提高？，之前的模型叠加的成绩不是很好，然后自己运用所学到的知识把排名提高到top10%，参考老师提供的代码方案，截图提交。作业提交形式：PPT截图或手写拍照,打卡提交.打卡内容：（可以只是文字提交，或图片提交，或组合都行）文字要求最少200字图片要求最少2张打卡截止时间：1/11...

2020-01-14 00:12:02 222

原创 CSDN 写作小技巧（4）——如何修改图片大小并进行图片居中

修改插入图片大小过程：鼠标放到括号内（最后位置）——按一个空格——一个等号——编辑大小（比如300x300）注意：空格在最前面别忘进行图片居中过程：鼠标放到括号内（最后位置）——输入 “ #pic_center ”（引号不算）注意：需要在图片大小设置的前面进行...

2020-01-13 17:37:56 736 6

原创用 Seaborn 做数据可视化（1）——绘图功能（4）可视化线性关系

传送门：用 Seaborn 做数据可视化（0）总章目录：可视化线性关系1. 绘制线性回归模型的函数1.1 regplot()1.2 implot()2. 不同情况下的使用2.1 变量 x 是离散值2.2 解决非线性关系的拟合（拟合不同的模型）2.3 离群点的问题（“outlier” observations）2.4 变量 y 是离散的（二元）3. regplot() 和 lmplot() 真正的...

2020-01-13 10:52:06 1099 5

原创用 Seaborn 做数据可视化（1）——绘图功能（3）可视化数据集的数据分布

传送门：用 Seaborn 做数据可视化（0）总章目录：可视化数据集的数据分布1. 可视化单变量分布：distplot()2. 可视化二元分布：jointplot()2.1 散点图分布：jointplot() （默认 Kind=“scatter” ）2.2 核密度分布：jointplot(kind="kde" )2.3 六边形分布： jointplot(kind="hex")3. 成对关系：...

2020-01-13 09:44:57 698

原创用 Seaborn 做数据可视化（1）——绘图功能（2）可视化分类数据：sns.catplot()

目录0. 概述1. 分类散点图1.1 catplot() 默认 kind='strip'1.2 catplot(kind='swarm')2. 类中观测值分布2.1 catplot(kind='box')2.2 catplot(kind="boxen")2.3 catplot(kind="violin")3. 类中统计评估3.1 catplot(kind="bar")3.2 catplot(kin...

2020-01-13 00:33:29 3609

原创用 Seaborn 做数据可视化（1）——绘图功能（1）可视化统计关系：sns.relplot()

目录0. 介绍1. 概论2. 可视化统计关系 relplot( )2.1 两个方法scatterplot()lineplot()2.2 几个参数kindcihuestylesize1. 散点图（scatter plot）绘制二维散点图绘制三维散点图2. 线图（line plot）2.1 聚合和表示不确定性2.2 绘制语义映射数据子集2.3 绘制时间序列3. 分面图（facets）：展示多变量关系...

2020-01-12 22:48:56 3061 1

原创深度之眼吴恩达机器学习课程学习记录——（2）——week1 打卡1

任务打卡1：1）提交Anaconda的安装后启动jupyter notebook后的界面截图，以及个人申请博客后的展示（博客形式不限，推荐CSDN）。2）提交学习吴恩达《机器学习》第一课的课程笔记，谈谈你对机器学习的理解。打卡内容：不少于2张图片，不少于50字PS：鼓励大家积极把笔记写到博客上哦，还要机会赢取价值千元的礼品，具体评分规则可以看这个：https://appuaAoe86p4...

2020-01-11 23:12:16 347

原创 Kaggle —— 房价预测经验整理

参考几篇牛逼的 Kernel，好好学习；有相关的 CSDN 文章辅助：https://blog.csdn.net/qilixuening/article/details/75153131https://blog.csdn.net/qilixuening/article/details/75151026

2020-01-11 21:54:33 257

原创数学知识——概率统计（3）：随机变量

目录写在前面起源与发展概率基本计数原理本质1. 随机变量(random variable)1.1 随机变量1.2 随机变量三要素2.分类2.1 离散型随机变量2.2 随机变量三要素（离散）：1. 随机变量的取值2. 试验中每个对应取值的概率3. 随机变量的统计特征和度量方法2.2 连续型随机变量随机变量三要素（连续）：1. 随机变量的取值2. 试验中每个对应取值的概3. 随机变量的统计特征和度量方...

2020-01-11 14:19:11 6484

原创深度之眼Kaggle比赛实战项目记录—7—第二周第二节特征工程知识点的讲解以及特征工程对成绩的提高（一）

任务学习时长：1/9——1/10任务名称：特征工程知识点的讲解以及特征工程对成绩的提高任务简介：运用特征工程知识对成绩提高到top80%详细说明：由于特征工程对于后续成绩的提高有着奇特的效果，所以在两次课中会运用特征组合以及管道知识对数据进行处理和特征的组合，希望大家不要完全按照我的方法来进行特征组合，这个时候大家自己要尝试不同的组合，对特征的重要度也需要进行区分。代码下载链接：http...

2020-01-10 22:42:03 328

原创数学知识——概率统计（2）：一文快速了解入门知识与框架

0. 写在前面概率统计第二篇，作为补充。主要依据框架记录一下相关的具体概念。概率统计（1）1. 本质概率学|概率分布|统计学通过随机变量的概率分布可以掌握它的随机特性，从而对它进行预测。而概率分布的获得需要进行试验（抽样）并进行数据记录（统计量）。因此，可以说概率分布是连接概率论和统计学的至关重要的桥梁。2. 内容2.1 统计量2.1.1 集中趋势的度量—— 平均数注意...

2020-01-08 23:32:09 874

原创数学知识——概率统计（1）从接近“本质”的地方看概率统计

目录写在前面本质理解详细概念总结框架写在前面人人都说”概率统计“，为什么不是”统计概率“？概率论与统计学的关系又是什么？一直以来对统计与概率学的理解不是很深，借此做一个小结。本质理解方式：由里及表（从目的出发）我们想通过随机变量的概率分布来掌握它的随机特性，从而进行预测。过程：想对随机变量进行预测——（为了预测）需要找到其概率分布——（为了找到”概率分布“）需要试验并记录——...

2020-01-08 14:34:37 855

原创思考·感悟：从接近本质的地方去思考、学习

自己在学习的过程中衍生出了两种思考角度，但对于如何控制和运用它们有不少困惑：① 由表及里，似乎沿着人们发现客观规律的顺序开展开来（有人说它是应试教育的产物）；② 抓住问题的核心，直接从本质出发，一切围绕着这个核心进行。在我看来，似乎前者属于人类视角，后者属于上帝视角。问题是，到底这两个维度应该如何把握？人人都在说的“本质”到底指的是什么？为什么都推崇本质思考？到底如何去思考思考？（元问...

2020-01-08 11:38:41 257

原创深度之眼Kaggle比赛实战项目记录—6—第二周第一节构建baseline

任务学习时长：1/6——1/7任务名称：构建baseline任务简介：完成一个基本的baseline提交到kaggle上然后有成绩详细说明：本节将会向大家介绍利用python数据清洗和数据预处理以及模型的构建，拟合数据，进行对test数据集进行预测，提交到成绩有排名。会先从理论讲起，再到实际的的一个操作。数据清洗和数据处理是比赛以及任何一种机器学习模型的必须要经过的过程，而且极为重要，...

2020-01-07 23:56:17 321

原创 CSDN 写作小技巧（3）——学会在 CSDN 中插入超链接

输入地址——确定——可自己定义名称（可以使用预览模式查看是否成功）——最后发表文章即可Python数据分析之可视化——用 Seaborn 做数据可视化（0）总章...

2020-01-07 16:51:41 1991 7

原创深度之眼吴恩达机器学习课程学习记录——（1）——开营直播

课程目的通过近两个月的学习，掌握机器学习基础知识。学习方式学习公开课 + 完成作业 + 作业讲解视频 + 答疑- 带学讲师福利打卡返现对于能坚持到最后，按要求完成全勤打卡且排名前20的，保质保量完成学习的，我们全额返现！积分活动课程安排推荐资料...

2020-01-07 12:09:52 467

原创 Python 进阶之路（一）Python 从基础到进阶 —— 控制流（1）条件和循环

条件条件判断：关键词本身（if）+ 条件表达式 + 代码块问题是：哪些是True 哪些是 False？

2020-01-07 09:29:58 241

原创深度之眼Kaggle比赛实战项目记录—5—第一周【一周学习任务总结】

任务任务时长：1/5任务简介：温故而知新，详细总结回顾本阶段所学习内容，与同学分享自己在学习和作业中遇到的问题。详细说明：每第一阶段的学习任务都比较重，第一次学过之后特别容易忘，所以及时做一个要点回顾，会让学习效率大大的提升。如果复习时还有很多不会的，一定要和小伙伴交流或询问助教和老师，不要把问题留到下一阶段。打卡截止时间：1/5打卡内容：图片至少1张，一周总结反思点我打卡！提交...

2020-01-06 22:26:06 436

原创 CSDN 写作小技巧（2）—— 如何在 CSDN 博客的文章开篇创建目录？

很简单：在最开始输入”在最开始输入”@toc“即可，”目录“两个字可以自己随便改变！

2020-01-06 17:55:14 369

原创 CSDN 写作小技巧（1）—— 如何转载别人好的CSDN博客？

第一步：点开文章，找空白处右键鼠标，找到并点击”查看元素“第二步：在出现的 HTML 页面中的搜索栏中（圆圈处）输入”article_content“，回车进行搜索定位，并确认方框处内容。第三步：复制”整体 HTML“，粘贴到自己的 Markdown 写作区域（编辑中的左侧部分）即可...

2020-01-06 17:43:43 197

原创神经网络中的偏置有什么意义？

2020-01-05 23:41:26 2060

原创神经网络激活函数？——再从感知机到 logistic regression 和 SVM

激活函数将神经网络的输出非线性化的一种函数。激活函数是用来加入非线性因素的，解决线性模型所不能解决的问题。（所以激活函数都是非线性函数，比如最常用的 sigmoid、tanh 和 ReLU）理解为什么需要激活函数引入非线性性：单层感知机：最常用的神经网络组成单元，用它可以划出一条线, 把平面分割开那么很容易地我们就会想用多个感知机来进行组合, 获得更强的分类能力但是，其输出无论如何都...

2020-01-05 23:07:26 754

原创自然语言处理(NLP)之路——概念理解——从 Google AI 的 BERT 看自然语言处理(NLP)的预处理

2018 年 10 月 11 日，谷歌 AI 团队在 arXiv 提交了论文，发布了 BERT 模型。BERT（Bidirectional Encoder Representations from Transformers）的中文意思是：语言理解中深度双向转换模型的预训练模式。BERT 在机器阅读理解顶级水平测试 SQuAD 1.1 中表现出惊人的成绩。毋庸置疑，BERT 模型开启了 NLP 的...

2020-01-05 19:20:02 640

转载一文梳理NLP词的表示——从one-hot到 word2vec

DeepNLP的表示学习·词嵌入来龙去脉·深度学习（Deep Learning）·自然语言处理（NLP）·表示（Representation）原创作品，转载请注明出处：[ Mr.Scofield http://blog.cs...

2020-01-05 18:26:37 1363

T-REC-P.862(PESQ) 源码 + PDF文档

客观语音质量评估（PESQ）源码：pesqpar.h、pesqmod.c、pesqmain.c、pesqio.c、pesqdsp.c、pesq.h、dsp.h... 文档：P.862.pdf、P862E.doc

2020-10-20

初始版完整数据CK+表情识别数据集（Part3）

该资源为官网下载来的完整初始版数据集，不是网上已经被个人更改过的数据集！（由于超过1000M，分为三个部分来上传） CK+ 是表情识别领域最为常见的数据集之一！包括8种基本表情（包括中性的话）。数据库包括123个subjects, 593 个 image sequence，每个image sequence的最后一张 Frame 都有action units 的label，而在这593个image sequence中，有327个sequence 有 emotion的 label。这个数据库是人脸表情识别中比较流行的一个数据库，很多文章都会用到这个数据做测试

2020-10-16

初始版完整数据CK+表情识别数据集（Part2）

2020-10-16

初始版完整数据CK+表情识别数据集（Part1）

2020-10-16

人脸表情识别数据集 jaffe.zip

人脸表情识别数据集 JAFFE JAFFE数据集一共有213张图像．选取了10名日本女学生，每个人做出7种表情．7种表情包括： Angry，Disgust，Fear，Happy，Sad，Surprise，Neutral．（愤怒，厌恶，恐惧，高兴，悲伤，惊讶，中性）

2020-10-16

清华大学《人工智能》课件.zip

第一章: 神奇的人工智能（王东，4学时授课，2学时实验）[课堂(PDF)] [实验(PDF)] [源文件] 第二章: 认识你的脸（汤志远，4学时授课，2学时实验）[课堂(PDF)] [实验(PDF)] [源文件] 第三章: 倾听你的声音（汤志远，4学时授课，2学时实验）[课堂(PDF)] [实验(PDF)] [源文件] 第四章: 理解你的语言（李蓝天，4学时授课，2学时实验）[课堂(PDF)] [实验(PDF)] [源文件] 第五章: 模仿你的行为（李蓝天，4学时授课，2学时实验）[课堂(PDF)] [实验(PDF)] [源文件

2020-10-14

fer2013.csv

表情识别数据集：Fer2013，为CSV格式，可以用excel打开，但是比较缓慢，也可使用pandas读取，以及转化为图片格式

2020-05-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人