- 博客(10)
- 资源 (1)
- 收藏
- 关注
转载 【机器学习】Sklearn-cluster聚类方法
Classes1各种聚类方法特性汇总:sklearn.cluster.KMeansfrom sklearn.cluster import KMeansKMeans(n_clusters=8,init='k-means++',n_init=10,max_iter=300,tol=0.0001,precompute_distances='auto',verbose=0,random_...
2019-07-31 19:40:15 22022
转载 【机器学习】在Python中使用XGBoost
本文原是xgboost的官方文档教程,但是鉴于其中部分内容叙述不清,部分内容也确实存在一定的问题,所以本人重写了该部分。数据请前往Github此处下载前置代码引用类库,添加需要的函数import numpy as npfrom sklearn.model_selection import train_test_splitimport xgboost as xgbimport pand...
2019-07-31 13:16:40 3729
转载 【机器学习】 处理不平衡数据的技巧总结!
概念类别数据不均衡是分类任务中一个典型的存在的问题。简而言之,即数据集中,每个类别下的样本数目相差很大。例如,在一个二分类问题中,共有100个样本(100行数据,每一行数据为一个样本的表征),其中80个样本属于class 1,其余的20个样本属于class 2,class 1:class2=80:20=4:1,这便属于类别不均衡。当然,类别不均衡问同样会发生在多分类任务中。它们的解决方法是一样...
2019-07-31 12:35:23 1106
原创 【cmd】合并多个文件与查看文件行数
cmd合并多个文件:输入“type *.txt >>f:\111.txt”,该命令将把当前目录下的所有txt文件的内容输出到f:\111.txt。type *.txt >>out.txtcmd统计文件行数:type 文件名 | find /v /c ""...
2019-07-30 21:10:05 1160
转载 【Python】JSON读取大量数据错误:JSONDecodeError: Extra data: line 2 column 1或者ValueError: Extra data: 类似错误处理
大量数据,里面有多行多列,出现类似标题报错raise JSONDecodeError(“Extra data”, s, end)json.decoder.JSONDecodeError: Extra data: line 2 column 1 (char 104)可以逐行读取,然后再处理成列表import json# 由于文件中有多行,直接读取会出现错误,因此一行一行读取fil...
2019-07-30 21:04:17 26914 4
转载 【机器学习】集成学习(Soft Voting Classifier)
一、Hard Voting 与 Soft Voting 的对比 1)使用方式voting = 'hard':表示最终决策方式为 Hard Voting Classifier; voting = 'soft':表示最终决策方式为 Soft Voting Classifier; 2)思想Hard Voting Classifier:根据少数服从多数来定最终结果; Soft Votin...
2019-07-29 20:53:13 3339
转载 【机器学习】分类器调参:什么是Grid Search 网格搜索?
将多种模型的结果通过投票的方式进行聚合。选择的模型的结果要有好有坏,这样聚合的结果最佳。PLAN1 Majority Class Labels (Majority/Hard Voting)事先准备三个模型,xgb和rf模型都已经通过cross_validation找出了较好的参数>>> from xgboost.sklearn import XGBClassifier...
2019-07-29 20:40:22 1700
转载 【它山之玉】研究生回复审稿意见的门道---科学网马臻
【笔记】还有的作者长篇大论地向审稿人解释,并把修改过的段落附上,但长篇解释和新增段落的内容几乎一样,这就没有必要了。逐条回复要务实、干脆利落,要不惊不乍,而不要让编辑觉得“问题很大”以至于作者需要用很大的篇幅来解释问题。如果初审时审稿人的定性评价很负面怎么办?那也得如实呈现。既然编辑决定让你修改论文,只要你认真修改,论文最终发表的可能性很大。对审稿人不要犟,而要有策略。审稿人总是认为...
2019-07-24 15:28:44 1200
原创 【随笔】7月休假:粤港澳大湾区旅程记录
六月底得知,姐姐七月初带小朋友来玩。我开始提前安排手里事务、和相关合作人员打招呼,为工作停止的一周做准备。七月的第一周尤其辛苦。每天有效工作时间是往常两倍:一到座位什么都不想,就是干活。这让我体会到,为什么有些人能把事业进程提速,拼命干是一个好办法。7月4日中午,讨论问题时,G打来电话,问为什么昨晚微信没回。答复曰:活着呢。心里偷笑他的担忧。没想到第二天,群里传来消息:湘雅医院副教授辛老师...
2019-07-10 11:14:55 6128 1
社交网络分析教程:使用 NodeXL 分析和绘制社交网络
2021-08-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人