自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 数据挖掘第八周周报

第八周周报本周主要工作是了解赛题,进行数据分析。下面是对数据的初步分析:base_info=pd.read_csv('train/base_info.csv')#企业的基本信息annual_report_info=pd.read_csv('train/annual_report_info.csv')#企业的年报基本信息tax_info=pd.read_csv('train/tax_info.csv')#企业的纳税信息change_info=pd.read_csv('train/tax_inf

2020-11-17 17:02:00 261

原创 2020-11-03

数据挖掘实训 第六周周报1. 决策树① 概念决策树是以树状结构表示数据分类的结果非叶子结点代表测试的条件,分支代表测试的结果。② 如何构建决策树构造决策树的关键步骤是分裂属性。所谓分裂属性就是在某个节点处按照某一特征属性的不同划分构造不同的分支,其目标是让各个分裂子集尽可能地“纯”。尽可能“纯”就是尽量让一个分裂子集中待分类项属于同一类别。分裂属性分为三种不同的情况:属性是离散值且不要求生成二叉决策树。此时用属性的每一个划分作为一个分支。 属性是离散值且要求生成二叉决.

2020-11-03 11:12:21 366

原创 2020-10-27

第五周周报第五周主要学习了数据挖掘之特征选择。目录1. 特征选择目的2. 常用的特征选择方法3. 思考与总结1. 特征选择目的减少特征数量、降维,使模型泛化能力更强,减少过拟合。 增强对特征和特征值之间的理解。2. 常用的特征选择方法 方法介绍:假设某特征店小二特征值只有0和1,并且在所有输入样本中,95%的实例的该特征取值是1,那就可以认为这个特征作用不大。如果100%都是1,那这个特征就没意义了。当特征值都是离散型变量的时候这种方法才能用,如果是连续型...

2020-10-27 10:39:08 243

原创 算法分析 | leetcode | 785. Is Graph Bipartite?

算法分析 | leetcode | 785. Is Graph Bipartite?一、问题描述Given an undirected graph, return true if and only if it is bipartite.Recall that a graph is bipartite if we can split it's set of nodes into two ...

2019-01-13 15:54:01 264

原创 算法分析 | 215. Kth Largest Element in an Array

算法分析 | 215. Kth Largest Element in an Array这道题我在去年已经做过,当时是直接排序然后ac。现在想用分治法来解决。一、问题描述:Find the kth largest element in an unsorted array. Note that it is the kth largest element in the sorted orde...

2019-01-13 15:25:40 146

原创 算法设计与分析leetcode作业第一周题解

divide-and-conquer第一题 Maximum Subarray(53题)题意:Given an integer array nums, find the contiguous subarray (containing at least one number) which has the largest sum and return its sum.Example:...

2018-09-09 20:12:17 270

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除