自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 收藏
  • 关注

原创 阿里 7.27笔试题。

题目大概是这样。有个藏宝架有n层,每层的宝物数量不一,每个宝物都有其价值,现在要求拿出m个宝物,并且需要遵守规则:每次只能拿选定层的两端的宝物要拿出的m个宝物的总价值是各种方案里最大的输入:n是层数,m是挑选的次数。n<=100,m<=10000n m下面每行代表每层,且第一个数是这层宝物的数量k,后面的则是k个宝物的价值 k<=100.4 1 2 4 55 1 2 4 5 5样例:2 32 3 24 1 4 1 5输出:5+3+2=10其实这个样例不好,如果

2020-07-28 14:34:40 1322

原创 C++,STL容器

// STL容器.cpp //#include <iostream>#include<vector>#include<deque>#include<queue>#include<map>#include <stack>#include<unordered_map>#include<set>#include<unordered_set>#include<forward_list

2020-06-29 22:56:15 199

原创 mysql,力扣,

https://leetcode-cn.com/problemset/database/?difficulty=%E5%9B%B0%E9%9A%BEwith sc as ( select player_id, sum(score) score from ( select first_player player_id,sum(first_score) score from Matches group by first_player union all s

2020-06-22 11:33:08 259

原创 mysql,力扣,会员要没了,记下题目

会员只剩一天了,快点将觉得挺好的的题目保存一波select date_format(trans_date, '%Y-%m') month, country, sum(state = 'approved') approved_count, sum(if(state = 'approved', amount, 0)) approved_amount, sum(state = 'chargeback') chargeback_count, sum(if(st

2020-06-22 11:21:51 2032

原创 力扣,990. 等式方程的可满足性,并查集

等式方程的可满足性https://leetcode-cn.com/problems/satisfiability-of-equality-equations/标准的并查集模板,将常用的parent数组形式换成字典形式。####如果我们将所有等式两端,用并查集合并一波,那么只需要查找下,不等式的两端有没有在一个等式的集合里出现过就行了。####整个代码由,find_root,union_xy,find_xy组成,find_root查找每个点的的根,union_xy是合并操作,find_xy用于在.

2020-06-20 21:57:39 193

原创 力扣,698. 划分为k个相等的子集,递归+回溯,暴力出奇迹

划分为k个相等的子集https://leetcode-cn.com/problems/partition-to-k-equal-sum-subsets/这题怎么说呢,看到那个len(nums)<16没,这就是叫我们使劲穷举的意思!!!!递归+回溯想法就是首先就是和不够k整除的,直接返回False,其次利用数组中求子集和为target的想法,整个代码也是它的模板的扩充。就按例题来分析,假设k=4,每组的值为5,我们从数组中找出一组数为5的,然后从原始的数组中去掉这组数,在找一组和为5的.

2020-06-19 23:53:31 430

原创 力扣,516. 最长回文子序列,动态规划+记忆化回溯

力扣,516. 最长回文子序列https://leetcode-cn.com/problems/longest-palindromic-subsequence/先说下记忆化回溯这个想法比较简单,对于i,j之间最长的回文子序列我们记做f(i,j),显然是有if s[i]==s[j] ,f(i,j)=f(i+1,j-1)+2,else f(i,j)= max(f(i+1,j),f(i,j-1))所以如果按照思路直接写递归的话很简单。####那么问题来了,这样如果不加@lru_cache(None

2020-06-19 22:03:06 418 1

原创 力扣305,岛屿数量,并查集。

岛屿数量 IIhttps://leetcode-cn.com/problems/number-of-islands-ii/主要的想法是用并查集,改一下并查集的代码就好了。假设每个相邻的两个格子之间有条边。整体的代码感觉还能再优化些。####首先将建个m*n长的数组parent,表示每个格子,m*n长的数组rankx用于路径压缩。####寻根的函数若parent[i] = i那么就代表这个i位置就是一个根节点。find_root函数寻找一个节点的根节点。ans ,res= [],0 ####a.

2020-06-19 13:51:05 406

原创 mysql力扣,1485. Group Sold Products By The Date

Group Sold Products By The Datehttps://leetcode-cn.com/problems/group-sold-products-by-the-dateActivities table:±-----------------±----------------+| sell_date | product |±----------------±------------------+| 2020-05-30 | Headphone |.

2020-06-18 16:05:50 205

原创 力扣刷题,1028. 从先序遍历还原二叉树。递归+回溯

从先序遍历还原二叉树https://leetcode-cn.com/problems/recover-a-tree-from-preorder-traversal/想法挺简单的,先把S处理成pre,和flag两个数组,pre是先序遍历,flag是pre里每个节点的深度。然后就是一个dfs,将pre和flag两个数组传进去,类似于中序后续确定一棵树的算法,从右找到第一level+1的下标记为j,然后从1到j就是左子树,(如果i,j不相等),如果相等就是全部都是左子树,然后就分成了左右两个子树,继续.

2020-06-18 15:20:13 187

原创 mysql 力扣,1107. 每日新用户统计

每日新用户统计https://leetcode-cn.com/problems/new-users-daily-count/####第一种方法,将‘login’的过滤出来,组内排序,将结果即为sc####然后将排名为1的找出来并将日期在90天之外的过滤出去,然后分组统计。with sc as (select *,row_number() over(partition by user_id order by activity_date)'rankx' from Traffi.

2020-06-17 20:14:58 325

原创 mysql 力扣,618. 学生地理信息报告

学生地理信息报告https://leetcode-cn.com/problems/students-report-by-geography/# 先把学生组内排序,命名为sc,然后按照排名分组,每组按条件取值,#这个方法特别巧妙,一开始没想到。哎,还是太菜。with sc as ( select *, row_number() over(partition by continent order by name)rankx from student)select max(if.

2020-06-17 00:41:47 309

原创 mysql 力扣,569.员工薪水中位数

569.员工薪水中位数https://leetcode-cn.com/problems/median-employee-salary/参考答案# 先组内排序,命名为sc,这里用了库函数,也可以自己写#这题的中位数是偶数个就是中间两个,奇数个就是中间一个,(题目要求)#然后看where子句,三个分别是每个公司和如果是奇数个就拿中间一个,偶数个就拿个数除以2的,偶数个就拿个数除以2加1的#然后根据公司和组内排名就把中无数拿出来了。with sc as (select *,row_nu

2020-06-16 23:15:18 430

原创 mysql 力扣,180,连续出现的数字

180,连续出现的数字https://leetcode-cn.com/problems/consecutive-numbers/####三表连接####这个没什么好说的,就有个问题,题目没有说明id是连续的,唯一的。虽然题目默认是这样。select distinct a.Num as "ConsecutiveNums" from Logs a join Logs b join Logs c on a.num = b.num and a.num = c.num and a.id = b.id

2020-06-16 18:00:45 208

原创 mysql 力扣,5452. Sales by Day of the Week

Sales by Day of the Weekhttps://leetcode-cn.com/problems/sales-by-day-of-the-week/翻译过来的意思就是说统计每个item_category每个星期的销量,结果如下所示:####这题感觉不难,就是一个计算日期为星期的函数####dayname可以直接将日期换成星期select item_category category, sum(if(dayname(b.order_date)='Monday'.

2020-06-16 17:12:32 313

原创 mysql 力扣,1369. 获取最近第二次的活动

获取最近第二次的活动https://leetcode-cn.com/problems/get-the-second-most-recent-activity/####提供两种方法,一:####首先将只有一个人的拿出来,命名为sc这个肯定是答案的一部分。####其次就组内排序,做降序,取出排名为2的,####使用mysql的over()函数,或者自己两表合并来做组内排序,这里两种都给了出来,####命名为two,####讲下自己写组内排序,就是两表按照username来合并,然后按照某一.

2020-06-11 18:01:26 298

原创 mysql 力扣,1384. 按年度列出销售总额

按年度列出销售总额https://leetcode-cn.com/problems/total-sales-amount-by-year/with sc as ( select product_id,'2018' report_year ,sum(datediff( if(datediff('2018-12-31',period_end)>0,period_end,'2018-12-31') , if (datediff('2018-01-01',period_st.

2020-06-10 22:32:24 523

原创 mysql 力扣,185. 部门工资前三高的所有员工

部门工资前三高的所有员工https://leetcode-cn.com/problems/department-top-three-salaries/###这题想法挺简单的,###1,先组内排序叫做rankx,这里提供了两种组内排序,一个是mysql8.0之后提供的rank() over()函数,一种试不用系统的高级函数。###2,将部门名字连接到员工表,过滤rk<=3,并排序。###注意的是这里的前三的排名是指,1,2,2,3,4这种。前三可以是3个以上的人数。所以使用了dense.

2020-06-10 20:00:54 279

原创 mysql 力扣,1412. 查找成绩处于中游的的学生

查找成绩处于中游的的学生https://leetcode-cn.com/problems/find-the-quiet-students-in-all-exams/##1,首先将每门的最高分和最低分查出来,叫做max_min##2,将所有考的每门的最高和最低分查出来,叫做max_min_id##3,然后将student表和exam表内联。##4,过滤的条件是,学生的id没在刚刚查出来的表max_min_id里##5,最后排序。with max_min as ( select e.

2020-06-10 19:20:40 294

原创 mysql 力扣,1225. 报告系统状态的连续日期

力扣 1225https://leetcode-cn.com/problems/report-contiguous-dates/先给出整体的代码;# Write your MySQL query statement belowwith fx as (select fail_date datex ,'failed' flag from Failed where fail_date between '2019-01-01' and '2019-12-31'),sx as (sele

2020-06-09 12:11:21 392

原创 mysql 力扣,1336 每次访问的交易次数

来源:力扣(LeetCode)链接:https://leetcode-cn.com/problems/number-of-transactions-per-visit题目如下:对于 transactions_count = 0, visits 中 (1, “2020-01-01”), (2, “2020-01-02”), (12, “2020-01-01”) 和 (19, “2020-01-03”) 没有进行交易,所以 visits_count = 4 。对于 transactions_cou

2020-06-09 01:57:32 705

原创 刷题python,力扣198,213,337三个打家劫舍问题。动态规划

首先先给出题目的地址。https://leetcode-cn.com/problems/house-robber-iii/添加链接描述首先是简单版的打家劫舍,这是题是一维dp,考虑状态方程,dp[i]是到i为止,获取最大的收益,那么dp[i]就等于他这次没偷,第i-1次的最大收益和这次偷了的收益加上第i-2次的最大收益,即dp[i]=max(dp[i-1],dp[i-2]+nums[i]),...

2020-04-24 12:31:56 227

原创 最大连续子段和,最大连续m段和。动态规划。

首先是最大连续子段和的问题,题目描述:求一个数组arr=[-2,1,-3,4,-1,2,1,-5,4],的最大连续的子段的和。题解:使用动态规划,定义辅助数组dpc记录以当前元素结尾的最大连续的子段和。即dpc[i]表示的是在arr列表中以arr[i]结尾的最大连续的子段和。那么显然dpc[i]有两种情况,一个是arr[i]加在了arr[i-1]之后,那么此时最大的连续子段和dpc[i] = ...

2020-04-13 15:30:52 1036

原创 有依赖的背包问题(华为机试-购物单)。动态规划

今天刷到一道有依赖的背包问题,是牛客的华为机试题,记录下解法。题目如下:王强今天很开心,公司发给N元的年终奖。王强决定把年终奖用于购物,他把想买的物品分为两类:主件与附件,附件是从属于某个主件的,下表就是一些主件与附件的例子:主件 附件电脑 打印机,扫描仪书柜 图书书桌 台灯,文具工作椅 无如果要买归类为附件的物品,必须先买该附件所属的主件。每个主件可以有 0 个、 1 个或 2 个...

2020-04-01 13:29:43 945

原创 常见的排序算法总结

常见的排序算法总结1.冒泡排序就像冒泡一样,从头对比相邻的两个,大的(或者小的)就交换到后面,一直到序列有序。时间复杂度最坏,平均O(n^2),最好的时候是初始序列有序,第一趟后就不在发生交换,停止排序时间复杂度O(n)。空间复杂度为O(1)。a = [11,2,41,7,22,80,67,1,0.1,88]def bubble_sorted(a): flag = True ...

2020-03-30 10:23:36 93

原创 matplotlib绘制

matplotlib绘制好久没有更新博客了,最近沉迷于画图,刚好写个博客来记录下,先给个漂亮的气泡图。这个是使用matplotlib的散点图画出来的。具体的代码很简单,如下所示:import matplotlib.pyplot as pltimport numpy as npimport pandas as pdimport warnings import randomimpor...

2019-11-05 21:34:57 591

原创 单层感知机

最近打算学习下深度学习,先从感知机看起,感觉感知机这个算法不是特别的难,但是从学习感知机算法我学习到了很多的东西,最主要就是代码的整洁性,以前也遇到过些的很漂亮的代码,一直没怎么注意,反正我自己写代码都是实现就可以了,能用一个函数解决的,绝对不多用,就导致我写的代码基本上就是过两天我也看不懂了。我决定最近要把以前学习的机器学习的算法也按照这样的格式整理出来。加深下自己的印象顺便提提升下自己的写代码...

2019-04-19 22:02:41 686

转载 GDBT,XGBOOST和LIGHTGBM

转载于:http://www.360doc.com/content/18/0101/17/40769523_718161675.shtml仅用于学习本文主要简要的比较了常用的boosting算法的一些区别,从AdaBoost到LightGBM,包括AdaBoost,GBDT,XGBoost,LightGBM四个模型的简单介绍,一步一步从原理到优化对比。AdaBoost原理原始的AdaBoost...

2019-04-16 09:46:18 208

转载 LaTeX 各种命令,符号

转载下来用于学习。转自:https://blog.csdn.net/anxiaoxi45/article/details/39449445 函数、符号及特殊字符声调语法效果语法效果语法效果\bar{x}\acute{\eta}\check{\alpha}\grave{\eta...

2019-04-14 15:59:44 8360

原创 线性回归算法源码分析

线性回归就是用一条直线去拟合所有的数据点,使得这些数据点拟合出来的误差最小。一般使用平方误差最小来作为标准去寻找线性回归的系数ws。用平方误差来作为标准是严格的数学证明的。大概证明的思路是这样的,假设y=f(x)+c,其中f(x)是线性回归函数,c通过线性回归获得的结果与真实值y之间的误差,我们假设c服从于(0,v)的正态分布,我们可以使用极大似然估计出取得最佳的系数w时,必然是取最小的平方误差...

2019-04-14 15:52:20 1264 1

原创 knn手写数字识别

import numpy as npimport osfrom numpy import *def knn(k,testdata,traindata,labels): traindatasize=traindata.shape[0]####获取行数 dif=tile(testdata,(traindatasize,1))-traindata####将行数扩展和训练集一样,并...

2019-04-10 22:37:59 4093

原创 朴素的贝叶斯

import numpy as npyimport os#P(B|A)=P(A|B)*P(B)/P(A)#####P(类别|特征)=P(特征|类别)P(类别)/P(特征)‘’‘假设数据集是这样,最后一列是特征(labels),前面两列是数据(dataset)’‘’| 天气 | 心情 | 是否打球 ?| | 1 | 1 | 1 | | 0 | 1 ...

2019-04-09 10:41:09 1907

原创 数据挖掘招聘关键字分析

想以后从事数据挖掘行业,但是想看看这个行业对于工作能力有什么样的要求,一般招聘的时候都需要什么有什么样的基础能力,所以就打算先爬取智联上关于数据挖掘的岗位的招聘要求及其职责,然后根据结巴分词,提取关键字,看看哪些词汇出现的频率比较高,这样就知道数据挖掘这个行业一般对于从业有什么样的要求的。当然提取出来的关键字肯定是有一些无用的信息,这个需要我们去进一步的甄别。首先是爬取智联招聘的数据挖掘岗位的招...

2019-04-03 13:38:44 6802 2

原创 一个简单的ip池的搭建

在爬虫的时候总是会遇到跑的太频繁而导致ip被封号的问题,所以就想着做一个简单的ip池去规避这种反爬取的手段,当然我写的ip池功能稍微简单一点,但是也能满足在爬取时遇到的封禁ip的问题。整个流程就是先用get_ip()函数从网上爬取免费的代理ip地址,当然对于这些代理的ip的能使用率是比较低的,我们用redis数据库的zset对其进行存储,zset有序集合比一般的集合多了一个分数的字段,我们可以在存...

2019-03-25 14:33:17 19281 2

原创 adaboost代码详细分析

在学习adaboost时遇到的一些问题,和对源代码功能的一些记录,程序来源于菊安酱的机器学习的ppt,虽然作者也对其做了很详细的注解但是由于本人水平的限制很多地方没有看懂,所以就又加了一些注解,可以增加自己的记忆。import numpy as npimport pandas as pd #获得特征矩阵和标签矩阵 def get_Mat(path): dataSet = pd.r...

2019-03-24 16:07:55 5887 3

原创 wechat实现微信聊天机器人

首先要在图灵机器人的网站注册个账号获得一个图灵账号每个账号可以创建几个机器人,然后可以获得key和userid填入下面,运行这个程序就可以测试你的图灵机器人了。接着我们可以用wechat这个网页版的微信库来接收和发送微信消息,实现微信的自动回复。关于图灵机器人的注册在百度上直接搜索图灵机器人进入官网注册一个就好了。####此函数用于测试图灵的机器人是否注册成功,是否可以使用。import r...

2019-03-23 02:50:43 12762 3

原创 matplotlib学习

记录下最近学习的matplotlib。import matplotlib.pyplot as pltimport numpy as np plt.rcParams['font.sans-serif']=['SimHei']##中文黑体def f(t): return np.exp(-t)*np.cos(2*np.pi*t)t1=np.arange(0.0,5.0,0.1)t2=...

2019-03-15 22:05:44 4072

原创 scrapy爬取猫眼电影及详情页

本来是在学习matplotlib画图的,发现自己没有数据去画图光看命令效果好像不是特别大,就想着去猫眼爬点电影来画图。然后就想着刚好练习下以前学过的scrapy,然后悲剧就开始了。整个spider的代码如下。# -*- coding: utf-8 -*-import scrapyimport reclass MaoSpider(scrapy.Spider): name = 'mao'...

2019-03-15 10:50:47 5765

原创 爬取安居客住房信息

本来这两天是打算继续学习数据挖掘的,但是在偶然的机会下突然想去爬取下安居客的房源信息,写的程序代码比较乱,基本没有什么健壮性,函数各个功能也没有分开。感觉对于爬虫来说数据处理是一大重要的问题,本来我已经把大的方向写好了,但是总是报一些细节的错误,就是在哪里各种的调试,花费了好长时间。最后的爬取的结果如下面的图所示。主要是最后两行的数据稍微的困难一点,其他的数据基本都很直接的提取出来了。下面就直接...

2019-03-10 02:43:35 4469

原创 第一篇博客

这是我写的第一篇博客。从以前学爬虫的时候开始就打算写博客记录自己每天的情况,但是一直因为各种理由。知道最近学习数据挖掘才决定记录下自己的学习过程。希望以后可以坚持写博客这个习惯吧。你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器...

2019-03-08 20:10:54 101

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除