自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小白兔的窝

心平气和,不起执念。

  • 博客(10)
  • 资源 (1)
  • 收藏
  • 关注

转载 【机器学习】Sklearn-cluster聚类方法

Classes1各种聚类方法特性汇总:sklearn.cluster.KMeansfrom sklearn.cluster import KMeansKMeans(n_clusters=8,init='k-means++',n_init=10,max_iter=300,tol=0.0001,precompute_distances='auto',verbose=0,random_...

2019-07-31 19:40:15 22022

转载 【机器学习】在Python中使用XGBoost

本文原是xgboost的官方文档教程,但是鉴于其中部分内容叙述不清,部分内容也确实存在一定的问题,所以本人重写了该部分。数据请前往Github此处下载前置代码引用类库,添加需要的函数import numpy as npfrom sklearn.model_selection import train_test_splitimport xgboost as xgbimport pand...

2019-07-31 13:16:40 3729

转载 【机器学习】 处理不平衡数据的技巧总结!

概念类别数据不均衡是分类任务中一个典型的存在的问题。简而言之,即数据集中,每个类别下的样本数目相差很大。例如,在一个二分类问题中,共有100个样本(100行数据,每一行数据为一个样本的表征),其中80个样本属于class 1,其余的20个样本属于class 2,class 1:class2=80:20=4:1,这便属于类别不均衡。当然,类别不均衡问同样会发生在多分类任务中。它们的解决方法是一样...

2019-07-31 12:35:23 1106

原创 【cmd】合并多个文件与查看文件行数

cmd合并多个文件:输入“type *.txt >>f:\111.txt”,该命令将把当前目录下的所有txt文件的内容输出到f:\111.txt。type *.txt >>out.txtcmd统计文件行数:type 文件名 | find /v /c ""...

2019-07-30 21:10:05 1160

转载 【Python】JSON读取大量数据错误:JSONDecodeError: Extra data: line 2 column 1或者ValueError: Extra data: 类似错误处理

大量数据,里面有多行多列,出现类似标题报错raise JSONDecodeError(“Extra data”, s, end)json.decoder.JSONDecodeError: Extra data: line 2 column 1 (char 104)可以逐行读取,然后再处理成列表import json# 由于文件中有多行,直接读取会出现错误,因此一行一行读取fil...

2019-07-30 21:04:17 26914 4

转载 【机器学习】集成学习(Soft Voting Classifier)

一、Hard Voting 与 Soft Voting 的对比 1)使用方式voting = 'hard':表示最终决策方式为 Hard Voting Classifier; voting = 'soft':表示最终决策方式为 Soft Voting Classifier; 2)思想Hard Voting Classifier:根据少数服从多数来定最终结果; Soft Votin...

2019-07-29 20:53:13 3339

转载 【机器学习】分类器调参:什么是Grid Search 网格搜索?

将多种模型的结果通过投票的方式进行聚合。选择的模型的结果要有好有坏,这样聚合的结果最佳。PLAN1 Majority Class Labels (Majority/Hard Voting)事先准备三个模型,xgb和rf模型都已经通过cross_validation找出了较好的参数>>> from xgboost.sklearn import XGBClassifier...

2019-07-29 20:40:22 1700

转载 【它山之玉】研究生回复审稿意见的门道---科学网马臻

【笔记】还有的作者长篇大论地向审稿人解释,并把修改过的段落附上,但长篇解释和新增段落的内容几乎一样,这就没有必要了。逐条回复要务实、干脆利落,要不惊不乍,而不要让编辑觉得“问题很大”以至于作者需要用很大的篇幅来解释问题。如果初审时审稿人的定性评价很负面怎么办?那也得如实呈现。既然编辑决定让你修改论文,只要你认真修改,论文最终发表的可能性很大。对审稿人不要犟,而要有策略。审稿人总是认为...

2019-07-24 15:28:44 1200

原创 【随笔】7月休假:粤港澳大湾区旅程记录

六月底得知,姐姐七月初带小朋友来玩。我开始提前安排手里事务、和相关合作人员打招呼,为工作停止的一周做准备。七月的第一周尤其辛苦。每天有效工作时间是往常两倍:一到座位什么都不想,就是干活。这让我体会到,为什么有些人能把事业进程提速,拼命干是一个好办法。7月4日中午,讨论问题时,G打来电话,问为什么昨晚微信没回。答复曰:活着呢。心里偷笑他的担忧。没想到第二天,群里传来消息:湘雅医院副教授辛老师...

2019-07-10 11:14:55 6128 1

原创 【复杂网络】SIS传染病模型在非均匀网络中的全局非零稳态证明

更多请查看《复杂网络基础理论》第四章-4.2.3

2019-07-02 23:19:41 1318

社交网络分析教程:使用 NodeXL 分析和绘制社交网络

Mapping Twitter Topic Networks-From Polarized Crowds to Community Clusters.pdf

2021-08-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除