自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(61)
  • 收藏
  • 关注

原创 数据降维、特征提取和特征选择的联系和区别

特征选择是指从n个特征中选择d(d<n)个出来,而其他的n-d个舍弃。特性选择有很多种方法,但是大多可以分为三类:①过滤:列入一些筛选特征的标准,如相关性/卡方分布。③嵌入:嵌入法使用内置了特征选择方法的算法。结论:特征提取(feature extraction)和特征选择(feature selection)两者的目标都是使得特征维度减少,但是方法不一样。是将原始高维特征空间里的点向低维空间映射,新的空间维度低于原始空间,所以维度减少。在这个过程中,特征发生了根本性改变,原来的特征消失了。

2023-03-31 15:04:40 840

原创 Hive窗口函数-lead/lag函数

Hive窗口函数-lead/lag函数

2023-02-28 15:20:29 1824 1

原创 ‘DataFrame‘ object has no attribute ‘sort‘报错

'DataFrame' object has no attribute 'sort'报错

2023-02-28 10:39:18 931

原创 pandas.errors.SpecificationError: nested renamer is not supported报错

pandas.errors.SpecificationError: nested renamer is not supported报错

2023-02-28 10:32:46 733

原创 【Python数据挖掘入门】2.2文本分析-中文分词(jieba库cut方法/自定义词典load_userdict/语料库分词)

jieba库/语料库分词

2023-02-27 16:58:32 1691

原创 【Python数据挖掘入门】2.1 文本分析-语料库文件路径及内容读取(codesc&pandas模块)

语料库文件路径及内容读取

2023-02-23 16:40:59 294

原创 【Python数据挖掘入门】2.1 文本分析-语料库文件读取(os.walk&os.path.join方法)

os模块

2023-02-23 15:39:07 747

原创 【CMD操作】CMD命令生成文件夹树状图

CMD

2023-02-23 14:40:28 1125

原创 【Python数据挖掘入门】一、数据挖掘概况

数据挖掘概况

2023-02-23 10:27:06 503

原创 Pycharm查看变量--变量框

变量框

2023-02-21 21:49:43 5698 1

原创 DBeaver连接MySQL报错:Unable to load authentication plugin ‘caching_sha2_password‘.

DBeaver连接MySQL报错:Unable to load authentication plugin 'caching_sha2_password'.

2023-01-06 10:23:26 1817

原创 Can‘t connect to MySQL server on ‘localhost:3306‘ (10061)解决办法

Can‘t connect to MySQL server on ‘localhost:3306‘ (10061)解决办法

2023-01-06 10:13:42 467

原创 MySQL‘’服务问题1053:没有响应控制功能‘’的解决办法

MySQL‘’服务问题1053:没有响应控制功能‘’的解决办法

2023-01-06 09:36:56 373

原创 大数据系统架构-Hadoop生态系统

Hadoop生态系统

2022-12-20 09:03:45 2177 1

原创 Python学习-9.2 程序界面-sys库介绍

sys库介绍

2022-12-19 16:50:22 492

原创 【CMD操作】如何使用CMD运行Python文件

使用CMD运行py文件/CMD命令行中文件路径有空格

2022-12-19 16:00:05 11311 1

原创 Python学习-9.1 程序界面-main函数的作用

main函数的作用

2022-12-19 14:57:08 359

原创 Python学习-8.2.3 库(PyQT5库的基础与实例-创建GUI应用)

Python学习-8.2.3 库(PyQT5库的基础与简单实例)

2022-12-09 15:59:48 543

原创 【数据架构】如何通俗易懂的介绍数据模型

如何通俗易懂的介绍数据模型

2022-12-08 17:31:51 592

原创 【数据管理】杂谈:数据权限所有权/跨领域的数据治理

数据权限所有权/跨领域的数据治理

2022-12-08 17:05:15 412

原创 Python学习-8.2.2 库(wordcloud库的基础与实例)

Python学习-8.2.2 库(wordcloud库的基础与实例)、词云绘制

2022-12-08 16:11:12 1228

原创 Python第三方库安装-源文件安装方式-imread库示例

Python第三方库安装-源文件安装方式-imread库示例

2022-12-08 15:21:23 2568

原创 Python学习-8.1.3 标准库(turtle库的基础与实例)

窗体函数/画笔状态函数/画笔运动函数

2022-12-07 15:18:43 749

原创 Python学习-8.1.2 标准库(random库的基础与实例)

产生随机数/产生随机元素

2022-12-07 15:17:27 145

原创 Python学习-8.1.1 标准库(time库的基础与实例)

时间处理函数/计时函数/时间格式化函数

2022-12-07 15:16:27 612

原创 Python学习-8.2.1 库(jieba库的基础与实例-中文分词库)

jieba库的基础与实例-中文分词库

2022-12-07 15:13:30 407

原创 Python学习-8.2 库(第三方库介绍与下载安装)

(第三方库介绍与下载安装)

2022-12-07 14:18:42 1248

原创 Python学习-8.1标准库(库的概念与标准库介绍)

Python库的概念与标准库介绍

2022-12-06 10:20:31 1129

原创 大数据系统架构-Hive和HBase

Hive/HBase

2022-12-05 17:30:06 299

原创 大数据系统架构-MPP数据库架构

MPP数据库架构

2022-12-05 09:36:23 1938

原创 大数据系统架构——Hadoop体系

Hadoop体系

2022-12-04 10:33:57 1243 1

原创 IaaS、PaaS、SaaS、DaaS的区别与联系

IaaS、PaaS、SaaS、DaaS的区别与联系

2022-12-01 21:54:39 577

原创 Pycharm快捷操作—Python(持续更新中)

快捷方式:查看类代码、缩进、格式调整、代码注释、增加函数说明、pass关键字

2022-12-01 17:32:11 432

原创 Python学习-7.面向对象学习

类的定义/子类/父类/类的属性/类的导入/四种import方法

2022-12-01 16:41:33 244

原创 Python学习-6.文件操作

python读写文件/二维列表/csv文件

2022-11-29 21:36:53 440

原创 Python学习-5.组合数据类型

组合数据类型:集合、列表、元组、字典

2022-11-29 10:41:34 4043

原创 Python学习-4.函数

函数

2022-11-28 16:05:06 230

原创 Python学习-3.程序的控制结构

程序的控制结构

2022-11-28 11:17:06 617

原创 Python学习-2.深入数字与字符串

Python学习-2.深入数字与字符串

2022-11-24 14:34:09 924

原创 Python学习-1.基础语法元素

Python学习-1.基础语法元素

2022-11-22 11:26:24 254

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除