自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(49)
  • 收藏
  • 关注

原创 sklearn中回归评价的衡量指标及实习代码

scikit-learn中的各种衡量指标from sklearn.metrics import mean_squared_error #均方误差from sklearn.metrics import mean_absolute_error #平方绝对误差from sklearn.metrics import r2_score#R square#调用mean_squared_erro...

2019-11-19 09:30:15 1160

原创 boston房价数据集的下载以及回归预测代码。

波士顿房价数据集(Boston House Price Dataset)包含对房价的预测,以千美元计,给定的条件是 房屋及其相邻房屋的详细信息。该数据集是一个回归问题。每个类的观察值数量是均等的,共有 506 个观察,13 个输入变量和1个输 出变量。下载网址:https://pan.baidu.com/s/16ekJ7Lzrm-dH1ObNgeRNmA密码:kcar下载下来的数据集...

2019-11-14 09:55:34 7948

原创 python即将超越java成为最火的语言

Tiobe月度排行趋势中,Python获得了有史以来的最高评级。Python的6月Tiobe评级为8.53%,比去年同期上升2.77个百分点。目前排在Java和C之后,排名第三。而去年6月坐在这个位置上的是C++。Tiobe分析师指出,如果按照现在这个增速继续下去,很可能在3年后Python就会超越Java和C,成为最受欢迎的语言。TIOBE索引基于Web搜索跟踪编程语言的流行程度,使用一个公...

2019-06-13 14:10:57 772

原创 好玩常用的Linux命令集合!!

1. sl 命令你会看到一辆火车从屏幕右边开往左边……安装$ sudo apt-get install sl运行$ sl2. fortune 命令输出一句话,有笑话,名言什么的 (还有唐诗宋词sudo apt-get install fortune-zh)安装$sudo apt-get install fortune运行$fortune...

2019-05-21 10:44:23 567

原创 2019年哪些手机值得期待?

2019年哪些手机值得期待?1.ipone11苹果2019年要发布的三款新手机,预计在2019年9月份发布会上发布iphone11。此前,苹果刚刚解决棘手的5G芯片问题,而关于今年的新款iphone外观也是大家关注的重点。亮点1 提升信号表现 苹果改进iPhone 11天线设计目前的2018年款iPhone手机中,总共有六条天线,它们采用液晶聚合物(LCP)材质。而在20...

2019-05-16 10:05:11 558

原创 微软发布全新的编程语言Bosque

告别for循环!微软发全新开源编程语言Bosque 提起微软相信大家并不陌生,旗下Windows系统可以说世界上使用率最频繁的系统,使我们的生活和工作更加方便,近日,微软宣布,推出一种全新的开源编程语言,名为Bosque,开发者为Mark Barron。 据了解,全新的编程语言不需要“for”、“while”、“do while”循环,开发效率更高,对于熟悉TypeS...

2019-05-09 09:53:22 927

原创 NLP入门_自然语言处理_AI分支

NLP (Natural Language Processing) 是人工智能(AI)的一个子领域。 自然语言是人类智慧的结晶,自然语言处理是人工智能中最为困难的问题之一,而对自然语言处理的研究也是充满魅力和挑战的。 理论上,NLP是一种很吸引人的人机交互方式。早期的语言处理系统如SHRDLU,当它们处于一个有限的“积木世界”,运用有限的词汇表会话时,工作得相当好。这使...

2019-05-08 14:13:06 1160 1

原创 python使用chunk进行大文件的读写

有时候我们会拿到一些很大的文本文件,完整读入内存,读入的过程会很慢,甚至可能无法读入内存,或者可以读入内存,但是没法进行进一步的计算,这个时候如果我们不是要进行很复杂的运算,可以使用read_csv提供的chunksize或者iterator参数,来部分读入文件,处理完之后再通过to_csv的mode=’a’,将每部分结果逐步写入文件。python代码如下:reader = pd....

2019-04-08 10:36:35 6990

原创 WxPython实现无边框界面

wxPython是Python语言的一套优秀的GUI图形库。允许Python程序员很方便的创建完整的、功能键全的GUI用户界面。 wxPython是作为优秀的跨平台GUI库wxWidgets的Python封装和Python模块的方式提供给用户的。实现无边框界面代码如下:import wxclass Frame(wx.Frame): def __init__(s...

2019-03-07 10:20:47 3769 1

原创 WxPython实现按钮的监听和更改按钮背景颜色

wxPython是Python语言的一套优秀的GUI图形库。允许Python程序员很方便的创建完整的、功能键全的GUI用户界面。 wxPython是作为优秀的跨平台GUI库wxWidgets的Python封装和Python模块的方式提供给用户的。主要实现按钮的监听和按钮背景颜色python代码如下import wxclass Frame(wx.Frame): def __i...

2019-02-22 11:36:12 4409

原创 The wx.App object must be created first!报错解决方案。

在执行wxpython时,若使用IDLE可能会遇到The wx.App object must be created first!的错误。解决方法输入命令 del app

2018-12-20 19:15:15 4530

原创 python利用wx实现界面按钮和按钮监听和字体改变。

 wxPython是Python语言的一套优秀的GUI图形库。允许Python程序员很方便的创建完整的、功能键全的GUI用户界面。 wxPython是作为优秀的跨平台GUI库wxWidgets的Python封装和Python模块的方式提供给用户的。只要介绍了如何利用wxPython实现吗按钮和对按钮的监听,并且改变了按钮的字体和颜色。python代码如下:#-*- coding:ut...

2018-12-20 19:07:05 3820

原创 python代码实现TSNE降维数据可视化

 TSNE降维      降维就是用2维或3维表示多维数据(彼此具有相关性的多个特征数据)的技术,利用降维算法,可以显式地表现数据。(t-SNE)t分布随机邻域嵌入 是一种用于探索高维数据的非线性降维算法。它将多维数据映射到适合于人类观察的两个或多个维度。 python代码km.py#k_mean算法import pandas as pdimport csvimport...

2018-11-30 12:35:16 17345 2

原创 如何解决ERR_CONNECTION_RESET网络错误

解决·ERR_CONNECTION_RESET网络问题第一步 点击开始查找cmd,并点击cmd.exe 。第二步 打开的界面中输入ipconfig /flushdns,然后回车即可。

2018-11-15 09:16:49 132321 21

原创 笔记本电脑设置自动关机以及取消自动关机

笔记本电脑设置自动关机以及取消自动关机(1)定时关机例如希望在晚上9点关机,在开始->运行中输入 at 21:00 Shutdown -s ,系统会提前30秒出现提示,然后到时间后自动关机。 (2)倒计时关机如果你需要倒计时关机,可以在开始->运行中输入 Shutdown.exe -s -t 7200 ,其中“7200”替换成你希望的倒计时时间,单位为秒,比如希望...

2018-11-12 20:41:10 4012

原创 中英文计算机核心期刊目录

中文核心期刊中文核心期刊是北京大学图书馆联合众多学术界权威专家鉴定,受到了学术界的广泛认同。1.计算机学报                                          2.软件学报3.计算机研究与发展                               4.中国图象图形学报5.系统仿真学报                                 ...

2018-11-09 16:23:22 2035

原创 获取随机森林RF模型的重要特征

获取随机森林RF模型的重要特征模型训练之后,想要得到比较重要的特征,可以通过python的sklearn包来实现。python实现代码如下所示: RandomForestClassifier.py# -*- coding: utf-8 -*-import IOUtil as iouimport numpy as npimport pandas as pdfrom sk...

2018-11-07 08:51:56 3123

原创 获取逻辑回归LogisticRegression模型的重要特征

 获取逻辑回归LogisticRegression模型的重要特征 模型训练之后,想要得到比较重要的特征,可以通过python的sklearn包来实现。python实现代码如下所示: LogisticRegression.py# -*- coding: utf-8 -*-import IOUtil as iouimport numpy as npimport pandas...

2018-11-06 10:09:46 10989 1

原创 获取线性支持向量机LinearSVC模型的重要特征

获取线性支持向量机LinearSVC模型的重要特征模型训练之后,想要得到比较重要的特征,可以通过python的sklearn包来实现。python实现代码如下所示: LinearSVC.py# -*- coding: utf-8 -*-import IOUtil as iouimport numpy as npimport pandas as pdfrom sklea...

2018-11-06 10:00:25 3468

原创 获取梯度提升树GDBT模型的重要特征

获取梯度提升树GDBT模型的重要特征 模型训练之后,想要得到比较重要的特征,可以通过python的sklearn包来实现。python实现代码如下所示: GradientBoostingClassifier.py# -*- coding: utf-8 -*-import IOUtil as iouimport numpy as npimport pandas as pd...

2018-11-06 09:51:12 1581

原创 获取决策树DT模型的重要特征

获取决策树DT模型的重要特征模型训练之后,想要得到比较重要的特征,可以通过python的sklearn包来实现。python实现代码如下所示: DecisionTreeClassifier.py# -*- coding: utf-8 -*-import IOUtil as iouimport numpy as npimport pandas as pdfrom skl...

2018-11-06 09:44:25 1711

原创 获取AdaBoost模型的重要特征

获取AdaBoost模型的重要特征模型训练之后,想要得到比较重要的特征,可以通过python的sklearn包来实现。python实现代码如下所示: AdaBoostClassifier.py# -*- coding: utf-8 -*-import IOUtil as iouimport numpy as npimport pandas as pdfrom skle...

2018-11-06 09:35:35 4252 1

原创 python2与python3实现读取网页刷访问量

python2中调用import urllib2读取网页python2实现代码 #-*- coding:utf-8 -*-import urllib2def down1(url): return urllib2.urlopen(url).read()#读取全部网页url = "https://www.baidu.com"print down1(url)注意:py...

2018-11-01 08:25:44 1917 1

原创 全国计算语言学学术会议(CCL)历年举办地点

全国计算语言学学术会议(CCL)     作为国内最大的自然语言处理领域的社团组织——中国中文信息学会(CIPS)的旗舰会议,全国计算语言学学术会议从1991年开始每两年举办一次,从2013年开始每年举办一次,经过20余年的发展历程,已形成了十分广泛的学术影响,成为国内自然语言处理领域权威性最高、口碑最好、规模最大(2017年注册参会人次超过1000)的学术会议。CCL着重于中国境内各类语言的...

2018-10-30 15:33:38 1936

原创 python实现多层感知机(MLP)

MLP(多层神经网络)    MLP是感知器的推广,克服了感知器不能对线性不可分数据进行识别的弱点。神经网络流程分为前向过程和反向过程,反向过程一般用于训练。每个神经元上面都有对于一个输入的权值,以及一个偏置,还有一个激活函数。所以一个前向过程的流程就是input输入,然后经过一层神经元运算,得到输出,然后第一层的输出作为第二层的输入,运算,得到第二层的输出…直到到输出层运算,然后得到结果...

2018-10-26 14:06:24 18101 4

原创 Windows和Linux下相互拷贝数据乱码的解决方法

通常的,Linux默认的中文编码是 UTF-8 , 而Windows一直都是GBK ,所以相互拷贝之后,数值数据或汉字会出现乱码的问题。一、Windows文件拷贝到Linux下:dos2unix -n old_test.txt new_test.txt 二、Linux文件拷贝到Windows下:unix2dos -n old_test.txt new_test.txt...

2018-10-17 21:24:37 3117

原创 t-SNE降维原理及python实现代码

t-SNE(Stochastic Neighbor Embedding  t分布随机邻域嵌入) PCA的局限性PCA是一种线性算法,它不能解释特征之间的复杂多项式关系。而t-SNE是基于在邻域图上随机游走的概率分布来找到数据内的结构。线性降维算法的一个主要问题是不相似的数据点放置在较低维度表示为相距甚远。但为了在低维度用非线性流形表示高维数据,相似数据点必须表示为非常靠近,这不是线...

2018-10-09 21:24:29 17284 4

原创 python实现KPCA降维

核PCA(KPCA)KPCA是一种非线性主元分析方法,用于降维。主要思想:通过某种事先选择的非线性映射函数Ф将输入矢量X映射到一个高维线性特征空间F之中,然后在空间F中使用PCA方法计算主元成分,核主成分分析最主要是非线性映射函数Ф的选取。Python实现代码# coding=utf-8 from sklearn.decomposition import KernelPCAfr...

2018-10-08 14:53:01 10944 6

原创 python实现PCA降维

概述本文主要介绍一种降维方法,PCA(Principal Component Analysis,主成分分析)。降维致力于解决三类问题。1. 降维可以缓解维度灾难问题;2. 降维可以在压缩数据的同时让信息损失最小化;3. 理解几百个维度的数据结构很困难,两三个维度的数据通过可视化更容易理解。PCA简介在理解特征提取与处理时,涉及高维特征向量的问题往往容易陷入维度灾难。随着数据...

2018-10-08 14:47:22 29212 4

原创 人工智能、大数据、云计算三者的关系

大数据、云计算、人工智能三者间的关系 大数据大数据,或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。大数据的核心在于为客户挖掘数据中蕴藏的价值,而不是软硬件的堆砌。云计算云计算是基于互联网的相关服务的增加、使用和交付模式,这种模式提供可用的、便捷的、按需的网络访问, 进入可配置的计算资源共享池。云是网络、互联网的...

2018-09-26 13:47:00 2975

转载 Spark三种集群部署的区别

Spark最主要资源管理方式按排名为Hadoop Yarn, Apache Standalone 和Mesos。在单机使用时,Spark还可以采用最基本的local模式。目前Apache Spark支持三种分布式部署方式,分别是standalone、spark on mesos和 spark on YARN,其中,第一种类似于MapReduce 1.0所采用的模式,内部实现了容错性和资源管理,...

2018-09-17 11:06:48 1225

转载 机器学习算法优缺点整理

决策树一、  决策树优点1、决策树易于理解和解释,可以可视化分析,容易提取出规则。2、可以同时处理标称型和数值型数据。3、测试数据集时,运行速度比较快。4、决策树可以很好的扩展到大型数据库中,同时它的大小独立于数据库大小。二、决策树缺点1、对缺失数据处理比较困难。2、容易出现过拟合问题。3、忽略数据集中属性的相互关联。4、ID3算法计算信息增益时结果偏向数值...

2018-09-11 08:38:49 1315

转载 Linux常用命令

1、mkdir命令用来创建目录,如果在目录名的前面没有加任何路径名,则在当前目录下创建dirname指定的目录,如果给出了一个已经存在的路径,将会在该目录下创建一个指定的目录,在创建目录时,应保证新建的目录与它所在的目录下的文件没有重名mkdir (选项)(参数)选项:    -Z:设置安全上下文,当使用SELinux时有效;    -m<目标属性>或--mode<目...

2018-09-05 14:25:43 869

原创 python制作彩色字符画

 利用python制作彩色的字符画 #-*- coding:utf-8 -*-import osfrom PIL import Image, ImageFont, ImageDrawimport argparse#命令行输入参数处理#parser = argparse.ArgumentParser()#parser.add_argument('file')#parser.a...

2018-09-05 14:16:07 3686

原创 计算机国内核心期刊投稿周期及内容提要

1.计算机工程与应用(平均审稿时间:2个月)刊登内容提要: 热点与综述,理论与研发,大数据与云计算,网络、通信与安全,模式识别与人工智能,图形图像处理,工程与应用,其他热门栏目。 2.计算机应用研究(平均审稿时间:1.31个月)刊登内容提要:计算机学科新理论、计算机基础理论、算法理论研究、算法设计与分析、系统软件与软件工程技术、模式识别与人工智能、体系结构、先进计算、并行处理、数据...

2018-09-05 13:58:21 8628

原创 windows7副本不是正版解决方法

通过命令进行激活1.按到图片中的路径找到cmd.exe,以管理员身份运行; 2.在命令提示符输入“ SLMGR -REARM ”,按回车键,如下图所示: 3.我们看到桌面弹出命令成功地完成对话框,代表已经激活,重启系统就完成了,如下图所示: 重启之后就可以正常使用啦...

2018-08-03 14:38:34 1967

原创 KDD CUP 2009年数据集介绍及链接

2009年KDD CUP介绍--KDD Cup 2009:客户关系预测       客户关系管理 (CRM) 是现代营销策略的关键要素。"知识杯 2009" 提供了在法国电信公司橙色的大型营销数据库中工作的机会,以预测客户切换提供商 (流失) 的倾向, 购买新产品或服务 (欲望), 或购买建议的升级或附加组件, 以他们使销售更有利可图 (出售)。                  在 ...

2018-08-02 14:56:41 3215

转载 使用sklearn实现数据预处理 —— 归一化/标准化/正则化

一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std  计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式: 使用sklearn.preprocessing.scale()函数,可以直接将给定数据进行标准化。  ...

2018-08-02 14:29:03 1236

转载 Python sklearn 实现过采样和欠采样

Imblearn package study 准备知识 1 Compressed Sparse RowsCSR 压缩稀疏的行 过采样Over-sampling 1 实用性的例子 11 朴素随机过采样 12 从随机过采样到SMOTE与ADASYN 13 SMOTE的变体 14 数学公式 下采样Under-sampling 1 原型生成prototype...

2018-07-25 13:49:14 53578 4

原创 centos7网卡配置

centos7的网卡配置外网ip 10.7.23.19 、内网ip  10.2.7.128为例1.配置外网vi /etc/sysconfig/network-scripts/ifcfg-eno1TYPE=EthernetPROXY_METHOD=noneBROWSER_ONLY=noBOOTPROTO=noneDEFROUTE=yesIPV4_FAILURE_FATAL=...

2018-07-24 08:26:19 1471

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除