代码
文章平均质量分 59
rogeroyer
要么庸俗,要么孤独。
展开
-
并查集应用
并查集应用原创 2022-07-30 10:57:16 · 209 阅读 · 0 评论 -
10种机器学习算法(附Python代码)
sklearn python APILinearRegressionfrom sklearn.linear_model import LinearRegression # 线性回归 #module = LinearRegression()module.fit(x, y)module.score(x, y)module.predict(test)Lo转载 2018-01-15 11:20:34 · 25730 阅读 · 1 评论 -
python将Unix时间戳转换成时间
将时间戳转换成时间在时间戳转换成时间中,首先需要将时间戳转换成localtime,再转换成时间的具体格式:利用localtime()函数将时间戳转化成localtime的格式利用strftime()函数重新格式化时间#coding:UTF-8import timetimestamp = 1462451334#转换成localtimetime_local = time.localtime(t转载 2018-03-02 21:38:13 · 19232 阅读 · 0 评论 -
Python 函数参数魔法
函数参数在 Python 中,定义函数和调用函数都很简单,但如何定义函数参数和传递函数参数,则涉及到一些套路了。总的来说,Python 的函数参数主要分为以下几种:必选参数默认参数可变参数关键字参数 必选参数必选参数可以说是最常见的了,顾名思义,必选参数就是在调用函数的时候要传入数量一致的参数,比如:>>> def add(x, y): # x, y 是必选参数...转载 2018-03-04 10:27:39 · 454 阅读 · 0 评论 -
python实现Kmeans聚类
参数设置 Parameters:n_clusters : int, optional, default: 8The number of clusters to form as well as the number of centroids to generate.init : {‘k-means++’, ‘random’ or an ndarray}Method fo...原创 2018-03-05 15:42:17 · 2294 阅读 · 0 评论 -
python 数据相关性可视化
话不多说直接上代码import matplotlib.pyplot as pltimport seaborn as snsdata = test_feature.corr() #test_feature => pandas.DataFrame#sns.heatmap(data)plt.show()效果图顺带分享一篇机器学习实践相案例...转载 2018-03-24 16:16:29 · 8879 阅读 · 1 评论 -
提取排序特征(python实现)
Series.rank()obj = pd.Series([7, -5, 7, 4, 2, 0, 4])print(type(obj.rank()))print(obj.rank())print (obj.rank(method = 'first',ascending=False))print (obj.rank(method = 'max',ascending=False))print原创 2018-04-07 17:48:21 · 1700 阅读 · 0 评论 -
求两个pandas.Series的交/并集
名称 功能 intersection 交集 union 并集代码演示>>> import pandas as pd>>> s1 = pd.Series([4,5,6,20,42])>>> s2 = pd.Series([1,2,3,5,42])# 求交集 #>>> pd.Series(list(set(s1).intersection(set(s2))))0 42原创 2018-04-01 16:28:43 · 15076 阅读 · 1 评论 -
pandas常用数据预处理方法
数据样式python代码df = pd.read_csv('../dataset/ai_risk_train/train_auth_info.csv', low_memory=False)# print(df)'''查看数据的基本信息'''print(df.info())'''整个数据的整体的分布'''print(df.describe())'''查看数据集的空值,或者说是缺失值'''pri原创 2018-04-10 12:52:55 · 1887 阅读 · 0 评论 -
python实现one-hot编码
''' one-hot编码 '''from sklearn.preprocessing import OneHotEncoder from sklearn.preprocessing import LabelEncoderfrom sklearn.preprocessing import LabelBinarizerfrom sklearn.preprocessing import Mul...原创 2018-04-16 23:33:37 · 7480 阅读 · 2 评论 -
特征选择 python实践
下面介绍两种之前竞赛使用到的特征选择方案方案一流程图 以上方法使用方差、卡方检验、决策树模型输出特征重要性方法综合起来进行特征选择,该方案在马上AI全球挑战赛中发挥了比较大的作用。该链接是我们的解决方案,开源是一种精神,仅供大家共同学习交流。python代码实现#coding=utf-8import numpy as npimport pandas as...原创 2018-06-15 10:03:07 · 4021 阅读 · 17 评论 -
CentOS 开机优化程序
优化内容先对系统进行判断,如果是Cent OS 64位,就继续运行。先将系统的安装源设置为网易的(网易的安装源算是国内比较稳定的)将系统同时打开的文件个数增大关闭selinux禁用GSSAPI来认证,也禁用DNS反向解析,加快SSH登陆速度优化一些内核参数调整删除字符的按键为backspace(某些系统默认是delete)打开vim的语法高亮关闭没用的服务关闭IPv6 实现过程原创 2017-12-31 00:48:44 · 1825 阅读 · 0 评论 -
遗传算法解TSP问题 python实现
实验内容与步骤TSP 问题是一个经典的 NP 问题,很难得到最优解,利用遗传算法,可以比较快的找到近似最优。本实验采用 TSPLIB 的数据,利用遗传算法进行求解。染色体设计染色体设计是遗传算法的关键之一,在本实验中,采用基于路径的方法进行设计,即一条完整合法的路径为一个染色体。如 12345678 或 51834762 (以 8 个城市为例)。交叉编码方式设计在本实验中采用部分交叉编码方式,编码原创 2017-12-23 12:12:05 · 9005 阅读 · 0 评论 -
Zookeeper 配置
Zookeeper集群配置原创 2017-09-25 19:32:07 · 272 阅读 · 0 评论 -
Sqoop配置安装
我安装使用的版本是sqoop-1.4.3.bin__hadoop-1.0.0.tar.gz,打算安装在/usr/local目录下。首先就是解压缩,重命名为sqoop,然后在文件/etc/profile中设置环境变量SQOOP_HOME。把mysql的jdbc驱动mysql-connector-java-5.1.10.jar复制到sqoop项目的lib目录下。mysql-connector-java原创 2017-09-25 19:43:55 · 410 阅读 · 0 评论 -
HBase 安装配置
配置步骤修改环境变量export HBASE_HOME=/usr/local/hbaseexport PATH=$PATH:$HBASE_HOME/bin:修改HBase的配置文件#HBASE_HOME/conf/hbase-env.sh export JAVA_HOME=usr/local/jdk/export HBASE_MANAGES_ZK=true //HBase是否管理它自己原创 2017-09-25 20:00:10 · 432 阅读 · 0 评论 -
Spark example WordCount
scala IDE:IDEAScala code:package com.spark.appimport org.apache.spark.{SparkContext, SparkConf}/** * Created by Administrator on 2016/7/24 0024. */object WordCount { def main(args: Ar转载 2017-09-01 22:45:52 · 1627 阅读 · 0 评论 -
Python实现排序算法
快速排序def quick_sort(lists, left, right): if left >= right: return lists key = lists[left] low = left high = right while left < right: while left < right and lists[rig原创 2017-09-29 12:08:14 · 425 阅读 · 0 评论 -
CentOS7安装g++
操作系统CentOS7步骤在终端输入命令:yum install gcc gcc-c++验证是否安装成功输入命令:g++结果如下:原创 2017-09-21 17:35:43 · 15541 阅读 · 0 评论 -
windows下安装xgboost
所需软件anaconda3gitxgboost‑0.6‑cp36‑cp36m‑win32.whl安装步骤第一步:安装anaconda3,内置python版本3.5及以上第二步:添加环境变量Path: ..\Anaconda3; ..\Anaconda3\Scripts; 说明:.. 是anaconda3的安装路径第三步:进入命令行 Ctrl+R, 输入cmdpip ins原创 2017-10-16 22:17:53 · 331 阅读 · 0 评论 -
pandas.to_datetime
函数功能将字符串形式的日期转化为日期格式eg:20160102 -> 2016-01-02函数介绍 代码示例#label_data是用pandas读取csv文件#label_data['date_received']=pd.to_datetime(train_data['date_received'])#weekday表示本周的第几天0-6#label_data['week'] =原创 2017-10-26 16:39:47 · 2659 阅读 · 0 评论 -
调用MLlib库实现Kmeans聚类
调用MLlib库实现Kmeans聚类使用工具 - IDE:IntelliJ IDEA - scala解释器:scala-2.12.3 - Java jdk:jdk1.8.0_66 - spark lib:spark-assembly-1.4.1-hadoop2.6.0Steps获取数据集 wget http://labfile.oss.aliyuncs.com/courses/736/t原创 2017-09-05 21:11:21 · 951 阅读 · 0 评论 -
Ubuntu服务器部署静态网页
服务器我所使用的服务器是安装在虚拟机里面的Ubuntu14.04.5,虚拟机软件是甲骨文的VirtualBox,网络设置为桥接网卡,这样就只能供我主机所在的局域网直接使用ip访问。所需组件 httpd-2.4.27.tar.bz2 apr-1.4.2.tar.gz apr-util-1.3.9.tar.gz pcre-8.10.zip安装步骤所有命令都是在root权限下执行原创 2017-09-18 11:30:39 · 4512 阅读 · 0 评论 -
MySQL新建用户、授权操作
启动MySQL服务 第一步:打开 控制面板 第二步:打开 管理工具 第三步:双击 服务 第四步:找到 MySQL 第五步:右键点击 MySQL -> 启动此服务进入命令行界面方式一MySQL 5.5 Command Line Client 直接输入root密码即可登录方式二Windows命令行 键盘输入Ctrl+R,然后再输入cmd。新建用户mysql -u r原创 2017-09-22 18:49:03 · 317 阅读 · 0 评论