自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小狐狸

EE转机器学习(深度学习)欢迎一起交流学习~~

  • 博客(14)
  • 资源 (5)
  • 收藏
  • 关注

原创 决策树scikit-learn重要参数详解

这里写目录标题决策树与SKlearn工具包参数汇总参数详解不纯度计算方法参数:criterion**sklearn提供了两种选择:**基尼系数与信息熵比较重要参数: random_state & splitterrandom_statesplitter剪枝参数:1、max_depth2、min_samples_leaf3、min_samples_split4、max_features5、m...

2020-04-28 22:26:11 3927

原创 【数据挖掘算法实现】决策树sklearn实现

决策树算法实现决策树模型介绍(什么场景使用)优点缺点决策树思维导图决策树算法实现 python(参数控制)决策树模型介绍(什么场景使用)决策树 -有监督(有y)产生的模型具有可解释性。决策树不仅可以用来构建模型也可以用来筛选变量。(决策树用一个递归的过程将数据切分成越来越小的单元格中,单元格中数据逐步得到‘净化’,在这个过程中,决策树会选择出对有知道数据挖掘任务最重要的那些变量)决策树...

2020-04-27 21:51:37 307

原创 CDA Level 2: Part 3.3 决策树(分类树、回归树)

2020-04-27 19:54:31 306

原创 数据挖掘 数据集网站

数据集网站sklearn自带数据集 datasetsUCI机器学习数据集sklearn自带数据集 datasetssklearn不仅有函数还有数据集,在datasets包中,例如导入datasets中iris数据集:from sklearn.datasets import load_irisUCI机器学习数据集网址:UCI Machine Learning Repositoryhtt...

2020-04-27 19:35:43 237 1

原创 数据挖掘 模型的衡量标准与建模

模型的衡量标准一、模型的衡量标准1、generating a good model准确性Accurate稳定性stable推广性general2、Ease of Use 是否好用generate a fitmeasure accuracymake predictionsswitch algorithmshare results3、Feature selectionuncorelated predi...

2020-04-27 19:20:02 920 1

原创 pandas 细节总结

pandas 细节总结1、pandas option设置2、快速统计信息和数据类型 df.describe().T 、 df.info()3、多列排序 data.sort_values()4、去重复4.1、全部列去重复 data.drop_duplicates()4.2、某一列去重复 data.drop_duplicates(subset = '列标签')5、基于其他列创建一个新列M1:添加修改列...

2020-04-22 22:49:49 1021 1

原创 pycharts 数据分析与数据可视化

pycharts 数据可视化特性pycharts库安装调用快速画图进阶Echarts 是一个由百度开源的数据可视化。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。特性简洁的 API 设计,使用如丝滑般流畅,支持链式调用;囊括了 30+ 种常见图表,应有尽有;支持主流 Notebook 环境,Jupyter Note...

2020-04-19 17:23:37 1146

原创 python基础知识 查漏补缺

python基础知识 查漏补缺1、函数中的参数是形参,如果调用是不写关键字,默认按顺序把参数放进去。如果写了关键字,可以调换。函数中如果有return,才能赋值 a=func_()2、python 循环变量不需要加end,因为python代码前面的空格相当于循环体3、条件分支,条件最好互斥。否则,那个条件先满足,执行那个条件,后面条件不满足if condition1:print(‘1’)...

2020-04-19 16:48:26 386

原创 python 数据画图

python 数据画图1、matplotlib2、seaborn3、echarts前端1、matplotlibimport matplotlib.pyplot as pltmatplotlib学习:matplotlib官网链接:https://matplotlib.org/2、seabornimport seaborn as snsseaborn 学习:seanborn-galle...

2020-04-17 21:14:30 562

原创 Anaconda 常用使用技巧总结

Anaconda 常用使用技巧总结1、变量查询2、批量备注:Ctrl+/3、spyder打开.ipynk文件执行4、Prompt命令5、python安装新的第三方库1、变量查询whos #查看变量和变量信息who #查看变量2、批量备注:Ctrl+/3、spyder打开.ipynk文件执行step1-打开:Ipynk文件可以直接拖到spyder界面,右键convert to pyt...

2020-04-17 20:42:51 2552

原创 python安装新的第三方库 4种常见方式总结

python安装新的第三方库方法1:conda install pandas方法2:下载好安装包,安装 pip install xxx.zip方法3:python setup.py install方法4:pip install xxx.whl方法1:conda install pandas方法1是从anaconda云中安装,速度一言难尽。可以在prompt中下面语句,配置anaconda仓库...

2020-04-17 20:24:52 394

原创 【利用Python进行数据分析】13 - Python建模库介绍

第十三章 Python建模库介绍1、pandas与模型代码的接口2、用Patsy创建模型描述2.1、Patsy创建模型设计矩阵2.2、用Patsy公式进行数据转换2.3、分类数据和Patsy主要内容:pandas数据规整和模型拟合和评分介绍两个流行的建模工具,statsmodels和scikit-learn。1、pandas与模型代码的接口模型开发的通常工作流是使用pandas进行数据加...

2020-04-08 20:55:40 1069 1

原创 【利用Python进行数据分析】12 - pandas高级应用

第12章 pandas高级应用1、分类数据1.1、pandas处理重复值常见函数1.2、分类编码 series_str.take(values)1.3、pandas的分类类型1.4、用分类进行计算 (pd.Series(draws).groupby(bins).agg(['count', 'min', 'max']).reset_index())1.5、用分类提高性能1.6、分类方法1.7、为建模...

2020-04-07 20:34:22 304 1

原创 【利用Python进行数据分析】11 - 时间序列

这里写目录标题日期和时间数据类型及工具字符串和datetime的相互转换dateframe转字符串字符串转日期格式时间序列(time series)数据是一种重要的结构化数据形式,时间序列数据主要有以下几种:时间戳(timestamp),特定的时刻。固定时期(period),如2007年1月或2010年全年。时间间隔(interval),由起始和结束时间戳表示。时期(period)可以被...

2020-04-02 22:47:04 545 1

数据分析数据流.zip

数值数据分析流 框架 python code案例 数据分析流框架理解 1、需求 2、y量化 3、x选择 4、描述 4.1图形 4.2统计量 5、预分析(特征工程,流程化和模块化) 5.1、异常值 单变量异常值 多变量异常值 5.2、缺失值 单变量缺失值 多变量缺失值 5.3、特征筛选 单变量特征筛选 多变量特征筛选 5.4、共线性 scipy.optional 单变量 多变量 5.5、变换 单变量 多变量 5.6、编码 单变量编码 多变量编码 6、建模(大模型:机器学习) 小数据算法:8 statsmodel 小数据 大数据算法:20 sklearn 大数据 7、修正 7.1、残差 7.2、假设(清晰清楚) 8、模型评估 8.1、残差 8.2、业务 9、应用 9.1、主次归因 9.2、规则归因 9.3、内衍 9.4、外推 10、可视化 ——————————————— 原文链接:https://blog.csdn.net/u010591976/article/details/106367307

2020-06-02

stopwords.txt

为节省存储空间和提高搜索效率,搜索引擎在索引页面或处理搜索请求时会自动忽略某些字或词,这些字或词即被称为Stop Words(停用词)。通常意义上,Stop Words大致为如下两类: 这些词应用十分广泛,在Internet上随处可见,比如“Web”一词几乎在每个网站上均会出现,对这样的词搜索引擎无法保证能够给出真正相关的搜索结果,难以帮助缩小搜索范围,同时还会降低搜索的效率; 这类就更多了,包括了语气助词、副词、介词、连接词等,通常自身 并无明确的意义,只有将其放入一个完整的句子中才有一定作用,如常见的“的”、“在”之类。 举个例子来说,象“IT技术点评”,虽然其中的“IT”从我们的本意上是指“Information Technology”,事实上这种缩写也能够为大多数人接受,但对搜索引擎来说,此“IT”不过是“it”,即“它”的意思,这在英文中是一个极其常见 同时意思又相当含混的词,在大多数情况下将被忽略。我们在IT技术点评中保留“IT”更多地面向“人”而非搜索引擎,以求用户能明了IT技术点评网站涉及的内容限于信息技术,虽然从SEO的角度这未必是最佳的处理方式。 了解Stop Words,在网页内容中适当地减少Stop Words出现的频率,可以有效地帮助我们提高关键词密度,而在网页Title中避免出现Stop Words往往能够让我们优化的关键词更突出。

2020-02-04

Matlab从入门到精通

适合初学者使用,推荐

2016-12-10

ICEM CFD简明教程(流沙经典)

ICEM CFD简明教程,简单实用,流沙经典,适合入门,图文并茂

2015-10-09

MATLAB智能算法30个案例分析

《MATLAB智能算法30个案例分析》是作者多年从事算法研究的经验总结。书中所有案例均因国内各大MATLAB技术论坛网友的切身需求而精心设计,其中不少案例所涉及的内容和求解方法在国内现已出版的MATLAB书籍中鲜有介绍。《MATLAB智能算法30个案例分析》采用案例形式,以智能算法为主线,讲解了遗传算法、免疫算法、退火算法、粒子群算法、鱼群算法、蚁群算法和神经网络算法等最常用的智能算法的MATLAB实现。

2015-06-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除