数据分析基本方法
丰。。
某top数据科学专业博士研究生,发表多篇论文,CCFA类2篇,sci2区一篇,目前担任sci2区文章审稿人,均为深度学习领域,第一作者,五次国际级获奖经历,国家级大创四项,多次省级校级获奖经历,负责多项科研项目。希望大佬们多多提携,小弟定投桃报李。
展开
-
数据分析基本方法-数据类型转换
def str_to_float(dataset,column): for row in dataset: row[column] = float(row[column].strip())def str_to_int(dataset,column): class_values = [row[column] for row in dataset] unique_value = set(class_values) look_up = dict() for i,value in .原创 2021-03-04 21:56:14 · 304 阅读 · 1 评论 -
数据分析基本方法——交叉验证的代码实现
def k_fold(data, folds): data_split = list() # 副本 data_copy = list(dataset) fold_size = int(len(data) / folds)#每折大小 for i in range(folds): fold = list() while len(fold) < fold_size:#不符合大小要求就继续 index = ran原创 2021-02-24 20:59:58 · 588 阅读 · 0 评论 -
数据分析基本方法-模型准确率得分(附代码)
# 7. how good is our algo ?def how_good_is_our_algo(dataset, algo, how_many_fold_do_you_want, *args): folds = k_fold_cross_validation(dataset, how_many_fold_do_you_want) scores = list() for fold in folds: training_data_set = list(fold原创 2021-02-23 11:10:11 · 694 阅读 · 0 评论 -
数据分析基本方法-计算模型准确率
def calculate_the_accuracy_of_our_model(actual_data, predicted_data): counter_of_correct_prediction = 0 for i in range(len(actual_data)): if actual_data[i] == predicted_data[i]: counter_of_correct_prediction += 1 return coun原创 2021-02-23 11:06:24 · 962 阅读 · 0 评论 -
数据分析基本方法-数据集切分方法
def k_fold_cross_validation(dataset, how_many_fold_do_you_want): splited_dataset = list() # 构建副本 copy_dataset = list(dataset) how_big_is_every_fold = int(len(dataset) / how_many_fold_do_you_want) for i in range(how_many_fold_do_you原创 2021-02-23 09:07:44 · 354 阅读 · 0 评论 -
数据分析基本方法-数据归一化处理(附代码)
数据的标准化(normalization)和归一化数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是数据的归一化处理,即将数据统一映射到[0,1]区间上。归一化的目标1 把数变为(0,1)之间的小数主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速,应该归到数字信号处理范畴之内。2 把有量纲原创 2021-02-21 21:45:17 · 2672 阅读 · 0 评论