![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据科学
a useful man
希望做一个有用的人。
展开
-
windows 正在查找bash.exe
问题描述今天安装DockerToolbox成功后,双击运行Docker Quickstart Terminal提示:wind...原创 2020-07-17 12:35:45 · 1331 阅读 · 0 评论 -
经济学初识
Awesome EconomicsA curated collection of links for economists. Part of the “Awesome X” series.The list is periodically updated with new links. Click “Watch” in the right top corner to follow.Your contributions are welcomed. Add links to “Links Sent by R原创 2020-07-15 22:52:33 · 358 阅读 · 0 评论 -
matlab_svm
>> cd E:\matlab\shen__long-Machine-Learning-with-MATLAB-master\Machine-Learning-with-MATLAB>> data = readtable('Datasets\Social_Network_Ads.csv');>> stand_age = (data.Age - mean(data.Age))/std(data.Age);>> data.Age = stand_age;原创 2020-07-06 21:29:33 · 136 阅读 · 0 评论 -
Geatpy教程
文章目录Geatpy教程序言简介特色Geatpy教程序言经过长期的不懈努力,新一代高性能实用型进化算法工具箱——Geatpy2正式问世了。在一批优秀硕士毕业生和访学博士离队后,Geatpy团队进行了全面重整,现团队由华南农业大学、暨南大学、华南理工大学等优秀硕士以及一批优秀校友、优秀本科生组成。团队始终秉持全心全意为人民服务的基本宗旨,旨在研发超高性能、通用性强、能够轻松应用到实际工程项目之...原创 2020-04-07 12:25:20 · 4343 阅读 · 3 评论 -
混合编码种群来进化的最大化目标的单目标优化问题
该案例展示了一个需要混合编码种群来进化的最大化目标的单目标优化问题。模型:max f = sin(2x1) - cos(x2) + 2x3^2 -3x4 + (x5-3)^2 + 7x6s.t.-1.5 <= x1,x2 <= 2.5,1 <= x3,x4,x5,x6 <= 7,且x3,x4,x5,x6为互不相等的整数。分析:该问题可以单纯用实整数编码'RI'...原创 2020-04-07 12:18:44 · 271 阅读 · 0 评论 -
用进化算法来优化SVM的参数C和Gamma——利用SCOOP库进行分布式加速计算
该案例展示了如何利用SCOOP库进行分布式加速计算Geatpy进化算法程序,本案例和soea_demo6类似,同样是用进化算法来优化SVM的参数C和Gamma,不同的是,本案例选用更庞大的数据集,使得每次训练SVM模型时耗时更高,从而更适合采用分布式加速计算。该数据集存放在同目录下的Data_User_Modeling_Dataset_Hamdi Tolga KAHRAMAN.xls中,有...原创 2020-04-07 11:39:57 · 1178 阅读 · 0 评论 -
利用进化算法进行仿k-means聚类(可称之为EA-KMeans算法)
该案例展示了如何利用进化算法进行仿k-means聚类(可称之为EA-KMeans算法)。本案例采用与k-means类似的聚类方法,采用展开的聚类中心点坐标作为染色体的编码,基本流程大致如下:1) 初始化种群染色体。2) 迭代进化(循环第3步至第6步),直到满足终止条件。3) 重组变异,然后根据得到的新染色体计算出对应的聚类中心点。4) 计算各数据点到聚类中心点的欧式距离。5) 把与各中...原创 2020-04-07 11:37:21 · 981 阅读 · 0 评论 -
一文理解CatBoost!
1. CatBoost简介CatBoost是俄罗斯的搜索巨头Yandex在2017年开源的机器学习库,是Boosting族算法的一种。CatBoost和XGBoost、LightGBM并称为GBDT的三大主流神器,都是在GBDT算法框架下的一种改进实现。XGBoost被广泛的应用于工业界,LightGBM有效的提升了GBDT的计算效率,而Yandex的CatBoost号称是比XGBoost和Lig...原创 2020-04-05 11:24:43 · 1295 阅读 · 1 评论 -
特殊命令
今天发现个非常实用的网站,在网址前加上一段神奇的命令,居然发现了新大陆。在你当前浏览的网站的网址最前面加上 wn.run/ (wn万能的缩写)后回车,看看有没有什么神奇的变化呢?是不是出现了一系列神奇的工具?正巧小直在浏览百度文库,在网址前添加wn.run/ 后,居然可以下载文库的文件。接着我又试了下几个常用的网站,看看究竟都有什么功能?淘宝网,京东等添加wn.run/以后商品页面直接显示商品的...原创 2020-04-04 21:02:39 · 1177 阅读 · 1 评论 -
pandas学习2
续pandas学习文章目录Working on Text DataIntroductionConcat, Split & JoinUnderstanding contains, find & indexCleaning PunchuationsCheck for string contents|检查字符串内容String Manipulation|字符串操作Working on ...原创 2020-04-03 14:48:28 · 878 阅读 · 0 评论 -
pandas学习
文章目录Objective : Pandas for Data WranglingIntroduction to Data Wrangling & PandasData WranglingPandas2. Series & DataFramesSeriesDataFrameObjective : Loading Data into DataFrames|目标:将数据加载到DataF...原创 2020-04-02 18:48:47 · 4929 阅读 · 0 评论 -
NumPy学习
文章目录InitializationAccess of NumPyCombine DataSplitting DataShape, DimensionUtility FunctionBroadcastingInitializationimport numpy as npa = np.zeros((3,3,3))aarray([[[0., 0., 0.], [0., 0...原创 2020-04-02 14:32:47 · 122 阅读 · 0 评论 -
使用scikit-learn进行预处理
文章目录PreProcessing using scikit-learn|Common importIntroduction to PreProcessing|预处理简介StandardScalerMinMaxScalerRobust Scaler|鲁棒的缩放器Normalizer归一化器Binarization|二进制化Encoding Categorical Values |编码分类值Enco...原创 2020-04-02 14:19:38 · 857 阅读 · 0 评论 -
pandas替换列值+1
import pandas df = pd.DataFrame({ 'Age':[33,44,22,44,55,22], 'Income':['Low','Low','High','Medium','Medium','High']})dfdf.Income=df.Income.map({'Low':1,'Medium':2,'High':3})df原创 2020-04-02 13:40:02 · 1257 阅读 · 0 评论 -
分类衡量指标手动实现
from sklearn import metricsConfusion Matrix - Shows details of classification inclusing TP,FP,TN,FNTrue Positive (TP), Actual class is 1 & prediction is also 1True Negative (TN), Actual cl...原创 2020-04-02 13:19:07 · 104 阅读 · 0 评论 -
Model Selection & Evaluation
Model Selection & EvaluationAgendaCross ValidationHyperparameter TuningModel EvaluationModel PersistanceValidation CurvesLearning Curves交叉验证超参数调整模型评估模型的持久性验证曲线学习曲线Cross Validatio...原创 2020-04-02 13:16:50 · 407 阅读 · 0 评论 -
将字典结果写入excel
原创 2020-04-02 12:02:48 · 2582 阅读 · 0 评论 -
Ensemble Methods——python
Ensemble MethodsAgendaIntroduction to Ensemble MethodsRandomForestAdaBoostGradientBoostingTreeVotingClassifierIntroduction to Ensemble Method集成方法简介Objective of ensemble methods is to combin...原创 2020-04-02 10:28:38 · 895 阅读 · 0 评论 -
Feature Selection Techniques
Table of Contents1 Feature Selection Techniques特征选择技术1.1 Agenda1.2 Introduction to Feature Selection特征选择简介1.3 VarianceThreshold1.4 Chi-Square fo...原创 2020-04-01 20:48:48 · 565 阅读 · 0 评论 -
python——聚类
目录Cluster Analysis聚类分析Introduction to Unsupervised Learning无监督学习简介ClusteringDistance or Similarity Function距离或相似度函数Clustering as an Optimization Problem聚类是一个优化问题Types of Clustering聚类的类型Partitioning Me...原创 2020-04-01 16:19:28 · 913 阅读 · 0 评论 -
python异常值检测
Anomaly Detection异常检测What are Outliers ?Statistical Methods for Univariate DataUsing Gaussian Mixture ModelsFitting an elliptic envelopeIsolation ForestLocal Outlier FactorUsing clustering met...原创 2020-04-01 12:56:55 · 5491 阅读 · 0 评论 -
Association Rules_python关联规则
Table of Contents1 关联规则1.0.1 Identify number of customers1.0.2 Identify customer doing most purchasing & amount1.0.3 Clean Data1.0.4 Finding...原创 2020-04-01 12:20:35 · 3961 阅读 · 0 评论