自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小强博客

担当+责任+勇气+成熟

  • 博客(13)
  • 资源 (2)
  • 收藏
  • 关注

原创 唐宇迪​​机器学习实战——交易数据异常检测

import pandas as pdimport matplotlib.pyplot as pltimport numpy as np%matplotlib inlinedata = pd.read_csv("creditcard.csv")data.head()# 数据有31列:Time、V1-V28、Amount和Class,注意到最后一列Class,这是我们的label值,...

2018-09-25 20:54:49 1061 3

原创 在有序表(12,24,36,48,60,72,84)中二分查找关键字72时所需进行的关键字比较次数是多少?

正确的二分查找应该是一次折半后,high=middle-1 或者 low=middle+1;所以第一次查找时 high=12,low=0; middle= (0+12)/2 =6,即53;第二次查找时 high=12 low =6+1; middle = (7+12)/2 = 9,即78 第三次查找时 high=12 low =9+1; middle = (10+12)/2 = 1...

2018-09-25 15:38:56 11921

原创 OneHotEncoder独热编码和LabelEncoder标签编码

OneHotEncoder独热编码学习sklearn和kagggle时遇到的问题,什么是独热编码?为什么要用独热编码?什么情况下可以用独热编码?以及和其他几种编码方式的区别。     首先了解机器学习中的特征类别:连续型特征和离散型特征。      拿到获取的原始特征,必须对每一特征分别进行归一化,比如,特征A的取值范围是[-1000,1000],特征B的取值范围是[-1,1].如果使用log...

2018-09-22 14:51:20 13454 2

原创 python的round函数使用

碰到的问题: 对float进行精确两位显示出来。 解决的方法:round(3.32342,2)  #3.32  .round函数概念:英文:圆,四舍五入是python内置函数,它在哪都能用,对数字取四舍五入。round(number[, ndigits])round 对传入的数据进行四舍五入,如果ngigits不传,默认是0(就是说保留整数部分).ngigits<0 的时候是...

2018-09-22 10:16:18 13056

原创 唐宇迪​​机器学习实战——梯度下降求解逻辑回归(理论基础+源代码实现)

问题的提出符号问题,这里的lg就是指log2,你的理解是正确的!在计算机科学中有些符号的使用跟我们在数学中使用的有区别。比如有时候log用来表示自然对数(以e为底数)。希望对你有帮助!首先计算机科学里的lgn就是数学上的log2(n)现要实现一个简单的线性回归:我们将建立一个逻辑回归模型来预测一个学生是否被大学录取。假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人...

2018-09-21 22:45:36 2304 2

原创 CSDN保存或发表文章时出现:输入有误,请重新提交 的一种解决思路

首先,我想到的是F12,在Network那里看看为啥。emmmm,看到了输入了非法字符。但是,什么玩意是非法字符呢?没说。。。不过有能力的可以去看看处理这玩意的js代码。然后,我挨个删除文章的最后一部分,保存,看看是哪里出错了。最后发现是标题中含有了字符“ <  ” 和  “  > ”  删除后立马见效...

2018-09-21 10:15:23 147

原创 运行map()后,报:map object at 0x02629E50解决方法与原因分析​​​​​​​

参考运行map()后,报:<map object at 0x02629E50>解决方法如下python 3例子:l = range(1,21)def op(x): r = 1 for i in range(1,x + 1): r *= i return rlist1 = list((map(op,l)))list12 出错原因...

2018-09-21 10:13:38 10056

原创 Python中最常见括号()、[]、{}的区别

Python中最常见括号的区别:在Python语言中最常见的括号有三种,分别是:小括号()、中括号[]、花括号{};其作用也不相同,分别用来代表不同的Python基本内置数据类型。Python中的小括号():代表tuple元祖数据类型,元祖是一种不可变序列。创建方法很简单,大多数时候都是小括号括起来的。Python中的中括号[]:代表list列表数据类型,列表是一种可变序列...

2018-09-21 09:25:09 67998 1

原创 预处理数据的方法总结(使用sklearn-preprocessing)

预处理数预处理数据的方法总结(使用sklearn-preprocessing)当我们拿到一批原始的数据首先要明确有多少特征,哪些是连续的,哪些是类别的。 检查有没有缺失值,对确实的特征选择恰当方式进行弥补,使数据完整。 对连续的数值型特征进行标准化,使得均值为0,方差为1。 对类别型的特征进行one-hot编码。 将需要转换成类别型数据的连续型数据进行二值化。 为防止过拟合或...

2018-09-20 21:07:14 102120 6

原创 numpy 辨异 —— numpy.ravel() vs numpy.flatten()

numpy 辨异 (五)—— numpy.ravel() vs numpy.flatten()官网解释numpy.ravelnumpy的ravel() 和 flatten()函数简介首先声明两者所要实现的功能是一致的(将多维数组降位一维)。这点从两个单词的意也可以看出来,ravel(散开,解开),flatten(变平)。两者的区别在于返回拷贝(copy)还是返回视图(view),n...

2018-09-20 11:19:43 235

原创 关于pycharm中无法识别导入自己写的模块的解决办法

最近,同级或者不同级目录下,导入某个模块,显示不存在,可明明存在,百度找了好多没找到,试了import syssys.path.append('/path/to/test') // 这里可以用os.path类方法自动获得绝对路径这方法还不行解决办法:先看看有没有导入常见库 pycharm不会将当前文件目录自动加入自己的sourse_path。右键make_direct...

2018-09-20 09:11:14 24957 7

原创 为什么梯度反方向是函数值下降最快的方向?

面试遇到的问题:刚接触梯度下降这个概念的时候,是在学习机器学习算法的时候,很多训练算法用的就是梯度下降,然后资料和老师们也说朝着梯度的反方向变动,函数值下降最快,但是究其原因的时候,很多人都表达不清楚。所以我整理出自己的理解,从方向导数这个角度把这个结论证明出来,让我们知其然也知其所以然~参考在梯度下降法中,为什么梯度的负方向是函数下降最快的方向?为什么梯度反方向是函数值下降最快的方向?进行整...

2018-09-18 15:17:35 9799 4

原创 leetcode----字母二十六进制与十进制数之间的转化

 字母二十六进制与十进制数之间的转化#include <iostream>#include <string>using namespace std;class Solution {public: //二十六进制转成十进制 int titleToNumber(string s) { int n = s.size(); int res = 0; ...

2018-09-05 20:14:43 1008

吴恩达机器学习作业以及作业课件

machine-learning-ex1 到machine-learning-ex8 里面作业部分已经完成并且有相应的注释

2018-08-17

STL学校演讲比赛介绍

1)某市举行一场演讲比赛( speech_contest ),共有24个人参加。比赛共三轮,前两轮为淘汰赛,第三轮为决赛。 2)比赛方式:分组比赛,每组6个人;选手每次要随机分组,进行比赛; 第一轮分为4个小组,每组6个人。比如100-105为一组,106-111为第二组,依次类推, 每人分别按照抽签(draw)顺序演讲。当小组演讲完后,淘汰组内排名最后的三个选手,然后继续下一个小组的比赛。 第二轮分为2个小组,每组6人。比赛完毕,淘汰组内排名最后的三个选手,然后继续下一个小组的比赛。 第三轮只剩下6个人,本轮为决赛,选出前三名。 4)比赛评分:10个评委打分,去除最低、最高分,求平均分 每个选手演讲完由10个评委分别打分。该选手的最终得分是去掉一个最高分和一个最低分,求得剩下的8个成绩的平均分。 选手的名次按得分降序排列,若得分一样,按参赛号升序排名。 用STL编程,求解这个问题 1) 请打印出所有选手的名字与参赛号,并以参赛号的升序排列。 2) 打印每一轮比赛后,小组比赛成绩和小组晋级名单 3) 打印决赛前三名,选手名称、成绩。

2018-03-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除