自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 数据研发/分析/开发面试题目汇总

题目1:醉汉坐座位飞机乘客有对应的1号到100号的座位,这些乘客会按号码顺序登机并应当对号入座,如果他们发现对应号座位被别人坐了,就会在剩下空的座位随便挑一个坐。现在假设1号乘客疯了(其他人没疯),他会在100个座位中随便选一个座位坐下,问:第100人正确坐到自己坐位的概率是多少?(也可推广到n名乘客n个座位的情况)这里我们可以用递归的思想去计算。首先假设第一位乘客成功坐到了一号位,那么剩下的乘客都会坐在自己的位置上,于是乎100号乘客坐到自己位置的概率即为 1100\frac {1}{100}10

2021-09-07 15:44:28 557

原创 【SQL】DQL50题

SET sql_mode=(SELECT REPLACE(@@sql_mode,'ONLY_FULL_GROUP_BY',''));DROP TABLE major,stuinfo;create table Student(SId varchar(10),Sname varchar(10),Sage datetime,Ssex varchar(10));insert into Student values('01' , '赵雷' , '1990-01-01' , '男');insert into S

2020-09-21 15:06:48 173

原创 【python爬虫入门】私募排排网“最大回撤”数据爬取

年更选手来了~想要在私募排排网爬数据,首先你要有一个账号。然后我们可以随便点进一个基金产品看到它的回撤曲线,无法复制粘贴…打开源代码,也没有。进入开发者工具…在哪藏着也找不到!!!?不要着急不是有公式嘛?不就是从高点跌倒低点的最大值吗?我们只要知道基金成立以来每日净值或者收益率不就行了(说的好像很容易的样子:))感谢fundNavTrend救我狗命,就你了!首先看看这个url是个啥?是个post啊,那连接的条件是什么呢?只要知道这些就可以了!def get_max_retrea

2020-09-19 20:35:48 2345 1

原创 【R语言】序列数据可视化:2007~2016国家(地区)重要性排序

国家(地区)重要性计算方法:网络科学重要节点挖掘(国际贸易网络)(想要排序数据的可以私信~)library(RColorBrewer)library(ggplot2)getPalette = colorRampPalette(brewer.pal(11, "Spectral"))p_rank_g<-ggplot(data=new_rank_g,aes(x=year,y=ranking,color=factor(name),fill=factor(name)))+theme_bw()+them

2020-08-31 11:09:03 357

原创 【R语言】洛伦兹曲线和基尼系数计算

数据框“global_df”的形式为:load("global_df.Rdata")load("bs_df.Rdata")library(ggplot2)library(gridExtra)p_g<-ggplot(data=global_df)+theme_bw()+theme( panel.grid =element_blank(), title = element_text(size=11,fa

2020-08-31 10:50:59 4709 1

原创 #pulse secure#的安装rollback和1205连接报错的处理

要用学校的服务器跑数据才决定要下校内网VPN的客户端。没想到会发生各种各样的问题。。。。本人是win8系统,安装pulse secure一直roll back,尝试了网上的各种办法,改maxfilternum,卸载杀毒软件,添加管理员权限各种方法均失败,后来经过摸索,发现了解决办法。查看本地服务—启用Device Install Service和Device Setup Manager这两个服务,再次安装成功!关于1205报错 无法设置虚拟适配器的处理:这个一般情况下就是安装的问题了,我的报错原

2020-08-10 18:18:16 8410 2

原创 【matplotlib】解决子图排列+子图嵌套的问题

子图嵌套的问题大家通常都会用fig.add_axes在一个fig对象上进行操作。但如果我们有多个子图,但只想在一个子图上再嵌套一个子图呢?我查了很多地方都没有找到解决方法。于是求助于matplotlib gallery,果然有参考的例子,只需要调用inset_axes的操作就可以在ax对象上操作了。下面给大家做一个参考:import matplotlib.pyplot as pltfrom mpl_toolkits.axes_grid1.inset_locator import inset_axes

2020-08-02 10:39:50 2129

原创 【SQL入门】对于事务隔离级别的认识

首先对于SQL8的操作:select @@transaction_isolation;#查看隔离级别set transaction isolation level read COMMITTED;#设置事务级别隔离级别脏读不可重复读幻读备注read commited√√√read uncommited×√√在oracle中默认repeatable read××√在mysql中默认,在8.0版本貌似也不支持幻读serializable

2020-07-21 11:32:21 74

原创 mysql安装中出现找不到VCRUNTIME_1.dll解决办法

在安装mysql中会遇到上图提示的缺失只需要在以下地址下载,https://cn.dll-files.com/vcruntime140_1.dll.html然后把.dll文件放在mysqld.exe同一目录下即可。

2020-06-28 12:38:52 2483 3

原创 python小白爬虫2:爬取一条微博的评论

目标:爬取蔡徐坤的微博评论以坤坤在2019.10.31发布的微博作为例子,截止到2019.11.9,23:30一共有596809条评论。微博pc端链接 由于pc的源代码令人费解,我们利用移动端进行爬取。微博移动端链接微博移动端更加的简洁源码是不是也清晰很多呢?首先,我们需要找到url链接的user-agent和cookie:首先你需要有一个微博账号,利用chrome的开发者工具...

2019-11-10 00:15:21 1834

原创 python小白入门爬虫1:豆瓣电影Top250

目标:爬取电影名、导演名、主演名、年份、国家、类型等中英文信息11.4更新~Debug总结:1.因为是在介绍页进行提取,因此会发生导演名称缺省的问题,还有一些法文或者印度语之类的情况,不能被正则表达式匹配到…2.中文导演名的正则表达式r’[\u4e00-\u9fa5]+·*[\u4e00-\u9fa5]*’3、英文会出现/xa00这种情况,不能被写入文件修改:中文部分的修改:进入介绍...

2019-11-04 15:06:22 689

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除