博客专栏  >  综合   >  剑指数据科学

剑指数据科学

数据科学一个需要多领域知识的学科,所以我们将从零开始,解析数据科学.从数学公式,到kaggle大赛实例,一步步了解数据科学的每一部分.

关注
1 已关注
16篇博文
  • Python自定义:粒子群优化算法

    #!usr/bin/env python #-*- coding:utf-8 _*- """ @author:fonttian @file: 粒子群优化算法.py @time: 2017/10/15...

    昨天 20:58
    144
  • 实战_2017中国数学建模大赛_B题_第二题

    简介原问题是给出一个定价策略,证明其相较于原来定价策略的优点.那么首先我们第一题第二问得到了一个 价格-完成率 函数,此时我们需要的是给出一个新的定价函数,并利用遗传算法得到最佳参数.思路 编码–>我...

    昨天 20:37
    224
  • Deap: python中的遗传算法工具箱

    Overview 程序概览官方文档:http://deap.readthedocs.io/en/master/index.html 1. Types : 选择你要解决的问题类型,确定要求解的问题个数...

    昨天 19:35
    217
  • Deap: 粒子群优化算法

    Source Code#!usr/bin/env python #-*- coding:utf-8 _*- """ @author:fonttian @file: Particle Swarm Op...

    昨天 19:41
    207
  • Deap : 遗传算法算法解决 背包问题

    特殊自定义评价函数同前def evalKnapsack(individual): weight = 0.0 value = 0.0 for item in individual...

    昨天 20:02
    208
  • sklearn中的Pipline(流水线学习器)

    简介管道机制实现了对全部步骤的流式化封装和管理(streaming workflows with pipelines)。管道机制(也有人翻译为流水线学习器?这样翻译可能更有利于后面内容的理解)在机器学...

    3天前 14:37
    234
  • 数据科学-通过数据探索了解我们的特征

    简介对于数据科学而言,我们要做的第一件事情,必然是了解我们的数据.而在数据探索期间,pandas和matplotlib 则是我们进行数据探索的利器.本文主要分为三个部分,第一部分是利用pandas进行...

    2017-10-10 07:41
    58
  • Python类库三两事 - 一次解决

    Python类库安装常见问题 没有类库 下载更新缓慢 类库太多,一次下载很慢 多版本运行问题 常见问题解决方案 关于类库找不到问: 类库找不到怎么办? 答: 下载whl文件,安装.链接点这里问:wh...

    2017-08-01 22:39
    478
  • Python中的argparse模块

    简介argparse是python用于解析命令行参数和选项的标准模块,用于代替已经过时的optparse模块。argparse模块的作用是用于解析命令行参数. 如果你想详细的了解它的功能.建议阅读这...

    2017-08-05 20:44
    242
  • Pandas matplotlib 无法显示中文

    Pandas 无法显示中文问题 解决方案Pandas在绘图时,会显示中文为方块,主要原因有二: matplotlib 字体问题 seaborn 字体问题 只需要在文件开始动态设置字体配置就可以了,但是...

    2017-07-13 00:40
    19713
  • 98%的人没解出的德国面试逻辑题

    之前在某网站上看过一个号称“98%的人没解出的德国软件工程师面试逻辑题”,虽然不知道是真是假,但是今天姑且论论。“一桶16斤的水,还有一个8斤的空水桶,和一个3斤的空水桶,问如何平均而精确地分给4个人...

    2016-03-05 09:01
    1423
  • 98%的人没解出的德国面试逻辑题(离散数学篇)!?

    之前一直想把二发表,但是因为某些事情一直没有发表。现在就写一下,到底怎么解和原来的那个逻辑题(其实是离散数学中的图)同一类型的题目。   上一篇的原文”题目如下:“一桶16斤的水,还有一个8斤的空水桶...

    2016-04-13 00:10
    2154
  • 朴素贝叶斯法分类器的Python3 实现

    本篇文章是我在读了李航的后手写的算法实现之一 原理请参考统计学习方法第四章朴素贝叶斯法-李航代码, NaiveBayesMethod 的内部计算方式现在为数值计算, 符号计算的代码已经注释,...

    2017-04-26 23:54
    1448
  • OpenCV的k - means聚类 -对图片进行颜色量化

    OpenCV的k - means聚类 目标 学习使用cv2.kmeans()数据聚类函数OpenCV 理解参数 输入参数 样品:它应该的np.float32数据类型,每个特性应...

    2017-05-16 20:08
    1314
  • 朴素贝叶斯分类器(Navie Bayesian Classifier)中的几个要点(一)

    关键字: 拉普拉斯修正(Laplacian correction) 懒惰学习(lazy leanring) 对数似然(log-likelihood) 拉普拉斯修正(Laplacian correcti...

    2017-05-18 13:20
    1467
  • 数据标准化的方法与意义

    含义数据标准化和归一化存在区别 数据归一化是数据标准化的一种典型做法,即将数据统一映射到[0,1]区间上. 数据的标准化是指将数据按照比例缩放,使之落入一个特定的区间.意义 求解需要 比如在SV...

    2017-07-01 16:28
    1517
img博客搬家
img撰写博客
img专家申请
img意见反馈
img返回顶部