
Data Science
文章平均质量分 71
Moon_treee
为什么要审核啊!还要好久的那种。
展开
-
【10月31日】机器学习实战(二)决策树:隐形眼镜数据集
决策树的优点:计算的复杂度不高,输出的结果易于理解,对中间值的确实不敏感,可以处理不相关的特征数据决策树的缺点:可能会产生过度匹配的问题。其本质的思想是通过寻找区分度最好的特征(属性),用于支持分类规则的制定。那么哪些特征是区分度好的,哪些特征是区分度坏的呢?换句话说,如何衡量数据集中特征(属性)对实例的区分程度呢?依据香农的信息论,引入信息熵的思想作为对特征区分程度的度量。当然,原创 2017-10-31 20:50:03 · 6590 阅读 · 0 评论 -
【10月23日】机器学习实战(一)KNN算法:手写识别系统
k-近邻算法怕是最简单的机器学习的分类算法了。简单的说,k-近邻算法采用测量不同特征值之间的距离方法进行分类。源码+实验数据地址:https://github.com/MoonTreee/machine_learning其优点:精度高、对异常值不敏感、无数据输入假定;缺点:计算复杂度高、空间复杂度高;and 需要大量的标注数据适用数据范围:数值型和标称型。本文基于k-近邻算原创 2017-10-24 09:30:41 · 561 阅读 · 0 评论 -
【11月12日】NumPy基础:数组和矢量计算
Numpy是高性能科学计算和数据分析的基础包,一直活跃在各种以python为基础的数据分析策略中。根据《Python for dataanalysis》一书的介绍,其部分功能如下:ndarrary,具有矢量算术运算和复杂广播能力(本书将boardcasting定义为不同形状的数组之间算术运算的执行方式)的快速且节省空间的多维数组。用于读写磁盘数据数据的工具以及用于操作内存映射文件的工具。原创 2017-11-12 21:21:15 · 557 阅读 · 0 评论 -
【12月20日】LeetCode刷题日志(四):Min Cost Climbing Stairs
题目描述 On a staircase, the i-th step has some non-negative cost cost[i] assigned (0 indexed). Once you pay the cost, you can either climb one or two steps. You need to find minimum cost to reach the t原创 2017-12-20 16:36:27 · 323 阅读 · 0 评论 -
【12月22日】LeetCode刷题日志(六):132 Pattern
题目描述 Given a sequence of n integers a1, a2, …, an, a 132 pattern is a subsequence ai, aj, ak such that i < j < k and ai < ak < aj. Design an algorithm that takes a list of n numbers as input and chec原创 2017-12-25 21:14:25 · 282 阅读 · 0 评论 -
【12月19日】LeetCode刷题日志(二):Hamming Distance
package com.njust.med.totalhammingdistance;/** * The Hamming distance between two integers is the number of positions at which the * corresponding bits are different. * Now your job is to find th原创 2017-12-19 10:51:43 · 307 阅读 · 0 评论 -
【12月19日】LeetCode刷题日志(三):Best Time to Buy and Sell Stock with Transaction Fee
题目描述: Your are given an array of integers prices, for which the i-th element is the price of a given stock on day i; and a non-negative integer fee representing a transaction fee. You may complete a原创 2017-12-19 15:22:39 · 276 阅读 · 0 评论