自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小屋

Talk is cheap,show me the code

  • 博客(18)
  • 资源 (2)
  • 问答 (1)
  • 收藏
  • 关注

原创 【机器学习】pyspark中RDD的若干操作

pyspark中RDD的若干操作

2017-11-28 10:49:03 12974 2

原创 【机器学习】pandas中Series和DataFrame

一,Series 1,Series的定义 Series类似于一个字典,可以通过index参数定义其“key”值。Series使用pandas.Series来定义。 如下所示:s = pd.Series([7, "Beijing", 2.17, -12345, "Happy"], index=["A", "B", "C", "D", "E"])print(s)结果为:A 7

2017-11-27 17:24:34 2049

原创 【机器学习】使用Hadoop Streaming来用Python代码完成MapReduce

介绍了,Hadoop Streaming原理 ,map-reduce的重点,最后通过Hadoop Streaming来处理经典的词频统计的问题,并给出了map和reduce阶段的代码。

2017-11-27 14:10:15 1143

原创 【C++】char* 与char []定义的区别

char* 与char []定义的区别

2017-11-23 14:26:48 5955

原创 【C++】数组指针和指针数组

数组指针指针数组

2017-11-23 12:19:15 297

原创 【C++】动态规划方法以及Maximum Length of Repeated Subarray

一,动态规划 动态规划的本质是递归,动态规划在递归的基础上通过空间来换取时间,来解决问题。它是通过:原问题(N)—>子问题(N-1)—>原问题(N),这样的方式将大的问题分解成一个个小的问题来求解,通过解决一个个小的问题最终将大问题解决了。 二,寻找两个数组中相同最长连续子数组问题

2017-11-22 20:09:23 209

原创 【C++】判断是不是2、3、4的幂数

判断是不是2的幂数。若n是2的幂数的话,那么n的二进制中含有1的只有1位;.判断是不是3的幂数判断是不是4的幂数//判断n是不是4的幂数

2017-11-20 22:11:10 1265

原创 算法的评价标准:ROC,假阳性,mape

1,ROC曲线去医院做检查化验单或报告单会出现(+)跟(-),其分别表型阳性和阴性。比如你去检查是不是得了某种病,阳性(+)就说明得了,阴性(-)就说明没事。 科研人员在设计这种检验方法的时候希望知道,如果这个人确实得了病,那么这个方法能检查出来的概率是多少呢(真阳率)?如果这个人没有得病,那么这个方法误诊其有病的概率是多少呢(假阳率)? 如下表所示: 金标准就是实际中的病人阳性和阴性的情

2017-11-19 15:39:50 6805

原创 【面经】本周面经流水账

本周的各种面试,公司有大有小,面试时间有多又少,面试难度有易有繁,思想深度有浅有深,面试官有水有神。

2017-11-18 15:49:47 467

原创 【C++】数组中后前差值最大的值

LeetCode 121Best Time to Buy and Sell Stock 题意:Say you have an array for which the ith element is the price of a given stock on day i. buy one and sell one share of the stock

2017-11-13 10:51:18 1370

原创 【机器学习算法】LR以及正则项

LR算法以及L1、L2正则项小议logistic回归基于线性分类WT,使用sigmoid函数将线性函数映射到(0,1)空间中去。于是有假设H@(x),表示的是x发生的几率。若结果值大于0.5则表示是正样本否则是负样本。

2017-11-10 20:19:09 6405

原创 【C++】数组中连续子数组的最大和

题意:Find the contiguous subarray within an array (containing at least one number) which has the largest sum. For example, given the array [-2,1,-3,4,-1,2,1,-5,4], the contiguous subarray [4,-1,2,1] 计算数组中连续子数组

2017-11-10 15:24:16 2106

原创 【C++】动态规划:最长递增子序列和建桥问题

问题描述: 求一个一维数组的最长递增子序列,时间复杂度尽可能小。 例如:数组 1, -1,2,-3,4,-5,6,-7它的最长递增子序列是 1,2,4,6,最后返回4.

2017-11-09 14:02:41 920

原创 【C++】数数:用数字来数数Count and Say

Count and Say题目:The count-and-say sequence is the sequence of integers with the first five terms as following:1. 1;2. 11 ; 3. 21 4. 12115. 1112211

2017-11-05 17:01:11 1342

原创 【C++】去除数组中的某数且不使用额外空间

题目:Given an array and a value, remove all instances of that value in place and return the new length. Do not allocate extra space for another array【C++】去除数组中的某数且不使用额外空间

2017-11-04 11:18:33 1485

原创 【python】生成笛卡尔积(交叉表)DataFrame和numpy

有文件A:,B:,希望通过A,B生成C: 就是笛卡尔积操作。 一,当数据在numpy数组中,数据为:A=['a','b','c','d']B=['1','2','3','4']其实方法一的思想很简单粗暴:A,B元素存储在list中,将A中每个元素复制len(B)次,然后将之与B进行行合并;得到的结果再与result列合并。最后输出result

2017-11-03 17:39:15 17264 2

原创 【python】统计文件中的字符串数目

统计文件中的字符一个txt文件中已知数据格式为:C4D/suC4D/max/AE统计每个字段出现的次数,比如C4D、maya

2017-11-02 14:10:43 12167

原创 【C++】反转单链表(面试的时候屡次被问到)

问题:已知一个单链表,将这个单链表反转过来,并返回反转之后的单链表。 思想:使用头插法的思想,将原本单链表中的数据反转,即每次插入数据的时候,不是将数据放到链表的末尾而是放到链表的头部。

2017-11-01 21:58:29 600

pandas执行失败,报错no module named -bz2

python3.7 pandas执行失败,报"no module named '_bz2'"的错误。将资源下载下来,然后放到python3.7相应的目录python3/lib/python3.7/lib-dynload下。再给资源可执行权限:chmod 755 _bz2.cpython-37m-x86_64-linux-gnu.so.退出再进即可。

2021-08-12

动态规划,建桥问题代码

就是要在一条河的南北两边的各个城市之间造若干座桥.桥两边的城市分别是a(1)...a(n)和b(1)...b(n).这里的要求a(i)只可以和b(i)之间造桥,同时两座桥之间不能交叉.希望可以得到一个尽量多座桥的方案.

2017-11-09

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除