排序:
默认
按更新时间
按访问量

阿里天池大赛[人工智能辅助糖尿病遗传风险预测]赛后总结

题目以及数据介绍 人工智能辅助糖尿病遗传风险预测 初始思想 1.从头开始,先看一下初始数据以及数据的简单分析吧 训练数据,最后一列是血糖: A榜测试数据 第九个特征与标签的关系分布 第三十八个 各个特征计数(有点糊) 各个特征(标签)的标准差 热力图...

2018-03-06 20:11:13

阅读数:362

评论数:3

去除读文件的换行

用strip() 不用split()>>> a = ' 123' >>> a.strip() '123' >>> a='\t\tabc' 'abc' >>> a = 'sdff\r\n' >>> a...

2017-12-06 21:51:49

阅读数:95

评论数:0

基于sklearn的序列处理 : LabelEncoder 与 OneHotEncoder

LabelEncoder直接上代码# coding:utf-8from sklearn import preprocessinglabel_encode = preprocessing.LabelEncoder() # 建立模型 label_encode.fit([[-1], [13], [45...

2017-12-02 21:11:46

阅读数:382

评论数:0

Antenna Placement poj3020(二分图最大匹配/最小路径覆盖)

Antenna Placement Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 9279   Accepted: 4584 Description The Global Aerial Resear...

2017-12-02 17:52:56

阅读数:59

评论数:0

Asteroids poj3041 (二分图最大匹配 / 二分图中最小点覆盖问题)

Asteroids Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 21522   Accepted: 11697 Description Bessie wants to navigate her ...

2017-12-02 17:52:40

阅读数:69

评论数:0

Period poj1961(kmp 进阶 next数组使用)

Period Time Limit: 3000MS   Memory Limit: 30000K Total Submissions: 17279   Accepted: 8328 Description For each prefix of a given string S...

2017-12-02 17:51:29

阅读数:35

评论数:0

阿里天池大赛[商场中精确定位用户所在店铺]赛后总结

题目以及数据介绍 商场中精确定位用户所在店铺 主要就是根据各种信息确定某个user到底是在那个shop中 具体的csv文件 AB榜测试集合: user训练数据: mall shop对照表: 初始思想 1.首先 拿过来一看 就是进行特征分析, 这么...

2017-11-28 19:31:49

阅读数:1272

评论数:1

Ubuntu16.04+丽台K620+CUDA8.0+cuDNN6.0搭建Tensorflow-GPU

基本步骤驱动更新 看你的电脑是否支持CUDA 一般英伟达的新卡都支持 需要更新电脑的显卡驱动(貌似CUDA内含有驱动) 系统设置->软件和更新->附加驱动 选择一个nvidia驱动应用更新(u16.04使用375未见循环登录情况)下载1.下载cuda官网下载 https://dev...

2017-11-01 10:55:52

阅读数:552

评论数:0

python 中赋值 copy() 与 ' = ' 号以及比较符'=='号 与 'is'

关于比较符号’==’号 与 ‘is’这里主要是为下文铺垫 == 比较操作符:用来比较两个对象是否相等,value做为判断因素 is 同一性运算符:比较判断两个对象是否相同,id做为判断因素关于copy()与 =主要是今天在写数组的时候发现了 这个问题 想到了 python中的数组赋值以及对...

2017-10-19 21:52:32

阅读数:224

评论数:0

PAT - 1107. Social Clusters (30) 并查集

1107.Social Clusters (30)When register on a social network, you are always asked to specify your hobbies in order to find some potential friends with...

2017-09-16 11:27:05

阅读数:125

评论数:1

关于sklearn.svm.SVC与.NuSVC的区别以及参数介绍

0. 区别SVC与NuSVC是类似的方法,但是接受稍微不同的参数集合并具有不同的数学公式 ,并且NuSVC可以使用参数来控制支持向量的个数 , 以下代码默认的是多分类1. SVC # coding:utf-8from sklearn import svm from numpy import *X ...

2017-08-24 22:05:06

阅读数:1488

评论数:0

关于数据降维函数sklearn-PCA的使用

1. PCA介绍PCA是主成分分析,用来降维,用少量的变量去解释大部分变量,使得变量维度减少,从而减少计算量。2. 调用方法 以及 参数的简单介绍 # 先看看PCA构造函数中的默认参数 ''' def __init__(self, n_components=None, copy=True, whi...

2017-08-23 22:03:33

阅读数:403

评论数:0

利用Apriori算法进行关联分析

1. Apriori算法Apriori算法是一种挖掘关联规则的频繁项集算法,这些关系有两种形式 : 频繁项集和关联规则。 举个例子就知道了:著名的”尿布与啤酒”。 这就是通过关联分析来获取到的结果。2. 名词解释前后文中存在的名词都放在这里了 1. 频繁项集 : 在事件集合中出现频繁的项目...

2017-08-19 15:45:29

阅读数:451

评论数:0

AdaBoost元算法数据集

# 训练集 ''' 2.000000 1.000000 38.500000 66.000000 28.000000 3.000000 3.000000 0.000000 2.000000 5.000000 4.000000 4.00000...

2017-08-17 16:45:06

阅读数:248

评论数:0

利用AdaBoost元算法提高分类性能

1. 元算法介绍 做重要决定时,大家可能会考虑多个权威的意见而不是一个人的意见,机器学习中也是如此,这就是元算法的背后思想。元算法是对其他算法组合的一种方式。 优点:泛化错误低,易编码,可以用在大部分分类器上,无参数调整问题 缺点:对离群点敏感 2. AdaBoost思想 以及 涉及公式2.1 简...

2017-08-17 16:43:25

阅读数:491

评论数:0

神经网络NN简单理解以及算法

1.什么是神经网络1.1 背景 : 以人脑中的神经网络为启发,历史上出现过很多不同版本 最著名的算法是1980年的 backpropagation 1.2 多层向前神经网络(Multilayer Feed-Forward Neural Network) Backpropagation被使用在多层...

2017-08-15 16:07:42

阅读数:1124

评论数:4

简单Trie树

#include #include #include using namespace std; const int maxn=500010; int num; int indegree[maxn]; int root[maxn]; char sx[12],sy[12]; typedef...

2017-08-12 15:05:34

阅读数:189

评论数:0

Power Strings poj2406 (kmp 进阶 next数组使用)

Power Strings Time Limit: 3000MS   Memory Limit: 65536K Total Submissions: 46647   Accepted: 19516 Description Given two strings a and b w...

2017-08-12 15:04:58

阅读数:218

评论数:0

支持向量机(SVM)理解以及在sklearn库中的简单应用

1. 什么是支持向量机 英文Support Vector Machines,简写SVM . 主要是基于支持向量来命名的,什么是支持向量后面会讲到…….最简单的SVM是用来二分类的,在深度学习崛起之前被誉为最好的现成分类器,”现成”指的是数据处理好,SVM可以直接拿来使用 … 2. 名词解释2.1...

2017-08-12 12:12:43

阅读数:1785

评论数:4

支持向量机-数据集

# 训练集 ''' 1.000000 0.067732 3.176513 1.000000 0.427810 3.816464 1.000000 0.995731 4.550095 1.000000 0.738336 4.256571 1.000000 0.981083 4.560815 1.00...

2017-08-12 09:08:14

阅读数:434

评论数:0

树回归问题

1. 树回归基于之前的线性回归,树回归归根结底也是回归,但不同的是,树回归可以更好的处理多特征的非线性回归问题,其基本思想就是切分数据集,切分至易拟合的数据集后进行线性回归建模。(复杂数据的局部建模)1.1回归树 节点为数值型/标称型 模型树 节点为线性模型2.优缺点优点: 可以对复杂的非线...

2017-08-10 16:03:01

阅读数:342

评论数:0

回归算法之岭回归

1. 岭回归 首先,说一下岭回归名字的由来,w^=(XTX+λI)−1⋅XTy\hat{w} = (X^TX + \lambda I)^{-1}·X^Ty,其中,I 是单位矩阵(对角线全是1,像”山岭“),λ\lambda 是岭系数(顾名思义…改变其数值可以改变单位矩阵对角线的值) 其次,岭回...

2017-08-06 20:04:15

阅读数:722

评论数:0

线性回归以及局部加权回归

0回归的含义 1线性回归 1-1 数学公式 1-2 误差以及公式最小二乘法 1-3 伪代码 1-4 代码 见下文2-4 1-5 图像以及结果 1-6 优缺点与改进 2 局部加权回归 2-1 数学公式 图像 以及 思想 2-2 伪代码 2-3 代码 包含本文所有代码 2-4 图像...

2017-08-02 18:20:56

阅读数:1459

评论数:0

朴素贝叶斯算法

1.朴素贝叶斯算法优缺点 优点:在数据较少的情况下依然有效,可以处理多类别问题 缺点:对输入数据的准备方式敏感 适用数据类型:标称型数据 2.算法思想:     比如我们想判断一个邮件是不是垃圾邮件,那么我们知道的是这个邮件中的词的分布,那么我们还要知道:垃圾邮件中某些词的出现是多少,就可以利用贝...

2017-07-31 22:08:06

阅读数:392

评论数:0

Check the difficulty of problems (概率DP)poj2151

Check the difficulty of problems Time Limit: 2000MS   Memory Limit: 65536K Total Submissions: 7104   Accepted: 3078 Description Organizing...

2017-07-31 17:16:58

阅读数:252

评论数:0

层次聚类算法

-*- coding:utf-8 * import numpy def getMax(x, y): if x > y: return x else: return y def getMin(x, y): if x >...

2017-07-30 23:01:53

阅读数:287

评论数:0

logistics回归--梯度上升算法以及改进--用于二分类

1.sigmoid函数应用 logistics回归是用来分类的,并且属于监督学习,分类也是仅限于二分类,就是结果非0即1 (这种函数通常称作跃阶函数) 这个时候就出现问题了 01之间的分界点怎么处理? 引入sigmoid函数 图像见下图 2.算法中的数学思想举个引例:求 函数y = -x^2+3x...

2017-07-30 22:15:32

阅读数:602

评论数:0

Kmeans以及优化的二分Kmeans

利用kmeans算法进行非监督分类1.聚类与kmeans 引例:2004美国普选布什51.52% 克里48.48% 实际上,如果加以妥善引导,那么一有小部分人就会转换立场,那么如何找到这一小部分人以及如何在有限预算采取措施吸引他们呢?答案就是聚类(<<机器学习实战>>第十章...

2017-07-27 21:52:37

阅读数:308

评论数:0

python-手写knn(k Nearest Neighbor) k近邻算法

先上代码 !!! # -*- coding:utf-8 -*- import csv import random import math import operator # 文件名 分割比例 训练集 测试集 def loadDate(fileName, split, trainSet=[]...

2017-06-19 22:22:15

阅读数:398

评论数:0

python中文件基本操作

是不是处理数据的时候有点忘记打开模式了呢? 先上最全打开模式~~~ 不同模式打开文件的完全列表: r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。 r+ 打开一个文件用于读写。文...

2017-06-19 15:45:05

阅读数:315

评论数:0

基于python的sklearn库的决策树算法基本实现

不能再咸鱼了不能再被嘲笑了所以周末做各种总结下周新计划开始!!!立完flag正文开始基于python的sklearn库的决策树算法基本实现关于不同年龄等几个特征的人进行是否购买电脑的预测 导入的训练文件见Github先贴代码 ~_~# -*- coding:utf-8 -*-"&quo...

2017-06-18 18:40:19

阅读数:435

评论数:0

采用感知哈希算法基于python-PIL的图像去重

所谓感知哈希算法 它不是很严格的哈希算法 而是相对的hash 本篇介绍的感知哈希算法为:dhash dHash:差异值哈希,基于渐变的hash算法,精确度较高,且速度也比较快(本文没有转换,见代码注释)前提用到了PIL库 事先准备好库(具体google) 以及汉明距离(传送门)正文来了先...

2017-06-17 20:38:12

阅读数:1943

评论数:1

Python---set常用方法

啊哈哈好几天没更新了 这几天 天天看视频 是时候总结一下了啊先来第一篇python中的set常用算法贴一下 python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), differen...

2017-05-30 13:17:59

阅读数:509

评论数:0

时间日期格式转换 sdutoj2246(Date类简单使用)

时间日期格式转换 Time Limit: 1000MS Memory Limit: 65536KB Problem Description 对于日期的常用格式,在中国常采用格式的是“年年年年/月月/日日”或写为英语缩略表示的”yyyy/mm/dd”,此次编程竞赛的启动日期“2010/1...

2017-04-22 21:03:18

阅读数:513

评论数:0

判定Java源文件名称 sdutoj3870 (java文件名判断)

判定Java源文件名称 Time Limit: 1000MS Memory Limit: 65536KB Problem Description 输入若干行字符串,判断每行字符串是否可以作为Java的源文件名称。其中: Java源文件的命名规则:合法的 Java标识符+“.java”...

2017-04-22 20:12:25

阅读数:313

评论数:0

集合相等问题 sdut1791 (set简单用法)

集合相等问题 Time Limit: 1000MS Memory Limit: 65536KB Problem Description 给定2 个集合S和T,试设计一个判定S和T是否相等的蒙特卡罗算法。 设计一个拉斯维加斯算法,对于给定的集合S和T,判定其是否相等。 Input 输入数据的第...

2017-04-22 19:59:32

阅读数:306

评论数:0

L2-001. 紧急救援 (Dijkstra最短路径变形)

L2-001. 紧急救援 作为一个城市的应急救援队伍的负责人,你有一张特殊的全国地图。在地图上显示有多个分散的城市和一些连接城市的快速道路。每个城市的救援队数量和每一条连接两个城市的快速道路长度都标在地图上。当其他城市有紧急求助电话给你的时候,你的任务是带领你的救援队尽快赶往事发地,同时...

2017-04-07 21:51:15

阅读数:256

评论数:0

L2-007. 家庭房产 (并查集的简易应用)

L2-007. 家庭房产 时间限制 400 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 陈越 给定每个人的家庭成员和其自己名下的房产,请你统计出每个家庭的人口数、人均房产面积及房产套数。 输入...

2017-04-06 15:41:21

阅读数:377

评论数:0

5-15 球队“食物链” (30分) -- L3-015. 球队“食物链” (2017天梯初赛 剪枝dfs)

5-15 球队“食物链”   (30分) 某国的足球联赛中有NNN支参赛球队,编号从1至NNN。联赛采用主客场双循环赛制,参赛球队两两之间在双方主场各赛一场。 联赛战罢,结果已经尘埃落定。此时,联赛主席突发奇想,希望从中找出一条包含所有球队的“食物链”,来说明联赛的精彩程度。“食物链”为一...

2017-03-31 21:49:08

阅读数:1799

评论数:0

L2-008. 最长对称子串 (最长公共子串简单应用)

L2-008. 最长对称子串 时间限制 100 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 陈越 对给定的字符串,本题要求你输出最长对称子串的长度。例如...

2017-03-17 11:35:21

阅读数:482

评论数:0

L2-010. 排座位 (并查集简单应用)

L2-010. 排座位 时间限制 150 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 陈越 布置宴席最微妙的事情,就是给前来参宴的各位宾客安排座位。无论...

2017-03-17 10:43:32

阅读数:326

评论数:0

L2-005. 集合相似度 (set的使用)

L2-005. 集合相似度 时间限制 400 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 陈越 给定两个整数集合,它们的相似度定义为:Nc/Nt*100...

2017-03-16 17:25:36

阅读数:231

评论数:0

L2-004. 这是二叉搜索树吗? (搜索二叉树的性质)

L2-004. 这是二叉搜索树吗? 时间限制 400 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 陈越 一棵二叉搜索树可被递归地定义为具有下列性质的二叉...

2017-03-16 16:34:37

阅读数:413

评论数:0

L2-002. 链表去重 (模拟+空间换时间)

L2-002. 链表去重 时间限制 300 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 陈越 给定一个带整数键值的单链表L,本题要求你编写程序,删除那些...

2017-03-16 14:26:44

阅读数:237

评论数:0

L2-012. 关于堆的判断 (堆操作)

L2-012. 关于堆的判断 时间限制 400 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 陈越 将一系列给定数字顺序插入一个初始为空的小顶堆H[]。随后判断一系列相关命题是否为真。命题分下列几种: “...

2017-03-15 12:53:46

阅读数:414

评论数:0

L3-010. 是否完全二叉搜索树 (对完全二叉树/层次遍历的理解)

L3-010. 是否完全二叉搜索树 时间限制 400 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 陈越 将一系列给定数字顺序插入一个初始为空的二叉搜索树(定义为左子树键值大,右子树键值小),你需要判断最后...

2017-03-14 17:13:31

阅读数:380

评论数:0

L2-013. 红色警报 (并查集其他利用)

L2-013. 红色警报 时间限制 400 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 陈越 战争中保持各个城市间的连通性非常重要。本题要求你编写一个报警程序,当失去一个城市导致国家被分裂为多个无法连通...

2017-03-13 21:43:30

阅读数:450

评论数:0

sdutoj 3062 蝴蝶效应 (记忆化搜索/递推)

蝴蝶效应Time Limit: 1000MSMemory Limit: 65536KBProblem Description蝴蝶效应是气象学家洛伦兹1963年提出来的。其大意为:一只南美洲亚马孙河流域热带雨林中的蝴蝶,偶尔扇动几下翅膀,可能在两周后引起美国德克萨斯引起一场龙卷风。其原因在于:蝴蝶翅...

2017-03-05 10:44:05

阅读数:488

评论数:0

java常用类

package com.cucpay.tradeportal.util; import java.io.UnsupportedEncodingException; import java.lang.reflect.Field; import java.net.URLDecoder; import...

2017-03-03 10:56:48

阅读数:229

评论数:0

E - Euclidean TSP UVALive - 6954 (三分)

Uva https://icpcarchive.ecs.baylor.edu/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&problem=4966 Vjudge https://vjudge.ne...

2017-02-23 21:37:37

阅读数:277

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭