自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 杂乱的笔记

面板数据,是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的 样本数据,在经济、金融等领域应用广泛。相比于同质面板数据模型要求回归系数不变的严 格假设,异质面板数据模型更适合实际应用场景,其回归系数往往因个体异质性和时间变化 而改变。一方面,一些面板数据集包含来自不同背景的个体[15],例如不同的工作经验、地 理位置、劳动能力等,这导致了个体异质性;另一方面,一些面板数据集反映出回归系数随 时间变化的行为,例如民主化过程中的历史事件[16]、技术进步、经济转型等。

2023-03-15 22:36:52 122

翻译 Hive表随机抽样

Hive表随机抽样

2022-08-09 11:37:38 731

原创 机器学习模型评估

模型评估

2022-07-02 22:54:53 383

原创 Pycharm配置Copilot一直waiting for github authentication

pycharm版本:2022.1.3社区版copilot插件版本:1.1.27.1708安装插件后,login时一直waiting for github authentication。看了一些issue有的回退版本,有的通过fq然后代理pycharm链接试了下都不行。。最终按照这个方案解决了。...

2022-06-26 15:38:08 910 2

翻译 论文阅读-可控NLG

GSum: A General Framework for Guided Neural AbstractiveSummarizationAbstractabstractive summarization模型灵活,可以生成连贯的摘要,但是有时unfaithful并且很难去控制。尽管之前的工作尝试提供不同类型的guidance来控制输出并增加faithfulness,目前仍不清楚这些策略之间如何互相对比。本文我们提出了一个通用可扩展的摘要框架:GSum,它可以采用不同类型的外部guidance作为输入,我们

2022-05-23 16:55:05 382

原创 keras的Sequential model实现

尽管有了functional api实现,sequential model在某些场景仍然是很方便的~

2022-04-03 14:18:33 2620

原创 使用Functional Api构造简洁的keras模型

新手友好的keras functional api,快速实现深度学习领域的idea!

2022-04-02 23:42:00 563

原创 简洁优美的深度学习包-bert4keras

简洁优美的bert4keras

2022-04-01 23:48:55 5720

原创 TF2-Tips:自定义model.fit

在TF2中自定义train_step,仿照此思路可以实现simcse

2022-04-01 16:59:29 2722

原创 Dice Reroll

QuestionYou can roll a 6-sided dice up to 2 times. After the first roll, if you get a number x, you can decide to either to get x dollars or to choose to continue rolling. But once you decide to continue, you forgo the number you just rolled. If you get t

2022-03-06 20:18:04 135

原创 《C++ Primer》第一章的 Sales_item.h

在第一章敲到 #include "Sales_item.h"时,编译出现错误,原因是Sales_item类不是标准库自带的,需要自己写好再使用头文件(#include "Sales_item.h)访问,作者已经写好了这个类,名为Sales_item.h,如下:#ifndef SALESITEM_H#define SALESITEM_H#include <iostream>#include <string>class Sales_item{public: Sa

2020-05-27 21:14:51 1837 2

原创 C++程序统计连续输入的数字个数

《C++ Primer》第15页,我的第一个有点逻辑的C++代码:#include <iostream>int main(){ // a是正在统计的数,读入的新值存入b int a = 0, b = 0; // 读入第一个数,确保有数据可处理 if (std::cin >> a) { int cnt = 1; while (std::cin >> b) { .

2020-05-27 00:09:08 2075 2

转载 win10下vscode配置C++环境

安装MinGW-w64vscode配置并编译和调试

2020-05-25 21:00:36 230

原创 PostgreSQL如何筛选连续3日登录用户

原始数据uid:用户编号day:登录日期(已去重)具体思路使用窗口函数按照uid分组对day进行排序如果连续登录,则day - rank 应该相同对day-rank进行group by,若count>=3即可说明该用户连续3日登录。SQL实现...

2020-05-25 00:17:58 824

原创 Leetcode中的Nth Highest Salary

问题描述找出第N大的数,例如:IdSalary11002100320042005300查询结果NNth Salary1300220031004NULL解决方案1.使用limit函数先按照从大到小的顺序筛选出distinct后的N个Salary,然后取其中的最小Salary即可,SQL如下:CREATE FUNCTION getNthHighestSalary(N INT) RETUR

2020-05-24 18:54:21 176

原创 Win10用vscode打开anaconda环境中的python出错

环境变量配置首先需要将anaconda的路径配置进环境变量中,我是用户变量和系统变量都配置了。我的anaconda安装在D:\Anaconda,于是环境变量加入:D:\Anaconda D:\Anaconda\Scripts D:\Anaconda\Library\bin这三个。不支持powershell环境变量配置完成后,vscode运行hello.py文件报了下面的错误:Warning:This Python interpreter is in a conda environment, but

2020-05-23 20:24:48 1156

原创 Rstudio安装后打开时崩溃

Rstudio需要配合R一起使用,可以把它当作是R的一个外壳。所以R和Rstudio都是要安装的!注意:它们安装路径的父目录一定要相同,不然Rstudio找不到R,打开时会是一片空白。另外,计算机的用户名需要是英文,不然打开Rstudio时会崩溃。...

2020-05-17 14:27:39 3481

原创 WIN10系统安装PostgreSQL并用R语言连接

PostgreSQL的安装和连接

2020-05-17 14:21:24 521

原创 Centos下简单操纵mysql

配置好了Wordpress后,在终端操纵mysql却出了点问题...

2020-04-05 13:38:53 112

原创 Python filter函数的几个例子

函数的语法关于filter函数的语法介绍可参照:菜鸟教程filter函数例子首先看一下菜鸟教程的例子# 筛选奇数def is_odd(n): return n % 2 == 1 #filter返回的是一个迭代器tmplist = filter(is_odd, [1, 2, 3, 4, 5, 6, 7, 8, 9, 10])newlist = list(tmplist)pr...

2020-03-31 22:43:41 475

原创 @property装饰器详解

@property装饰器,看了好几个教程都不太理解,知道发现了知乎的这篇好文python @property的介绍与使用,终于懂了!!下面结合github上的一个例子,解释一下这个装饰器:class Person(object): def __init__(self, name, age): # 初始化 self._name = name #属性前加上下划线是不...

2020-03-28 13:04:49 216

原创 Python面向对象编程初级

结合代码理解一下:class Student(object): # 定义一个类:包含方法(函数)和属性(数值) def __init__(self, name, age): # 初始化,name,age是参数 self.name = name #给self的name和age属性附上值 self.age = age #在把对象实例化之后,self换成实...

2020-03-28 12:22:08 85

原创 R将matrix导出为csv

希望将矩阵的行名和列名都导出,并在第一行和第一列的交叉处加上一个名称‘output’。代码如下:#创建矩阵rownames = c("B1", "B2", "B3")colnames = c("A1", "A2")m <- matrix(c(2,3,5,6,3,4), nrow = 3, byrow = TRUE, dimnames = list(rownames, colname...

2020-03-25 00:44:58 5412

原创 ubuntu下安装jupyter notebook并远程访问

安装环境在阿里云买了个服务器,操作系统是ubuntu,本文会实现在服务器上安装jupyter notebook并在windows访问。安装jupytersudo apt-get update sudo apt-get upgrade sudo apt-get install python3-pip3 sudo pip3 install jupyter生成配置文件jupyter...

2020-01-10 14:37:30 238

原创 windows下安装jupyter并配置R kernel

下载集成软件直接下载anaconda,它包含了python和一些比较重要的包,安装包大概四百多M。启动jupyter在计算机开始界面打开anaconda powershell,输入jupyter notebook即可。安装插件jupyter notebook有一些很好的插件可以选择,在anaconda powershell输入以下命令:conda install -c conda-fo...

2020-01-09 22:22:53 224

原创 R语言ggplot2包学习笔记

逐步记载学习ggplot的过程,以供自查

2020-01-01 13:49:06 1188

原创 R输出文件代码

逐渐记录一些R傻瓜式输出文件的代码,以供自查

2020-01-01 13:45:45 557

原创 10分钟R极简包超详细教程

写一个自用的R包,节省工作时间

2019-07-23 09:47:38 595

原创 R表达式的四种结构

灵活运用四种结构,让代码看起来更简洁工整

2019-07-22 19:50:56 1267

翻译 ggplot2绘制箱线图

利用R中的ggplot2包生成优雅的箱线图,必备技能get!

2019-07-09 23:31:46 11305 6

翻译 R:Reduce函数

在写R程序时,for循环是很丑陋的,在需要累积迭代的情况下,掌握apply往往不够用,这时Reduce便派上了用场

2019-07-09 15:53:42 15773

翻译 Athena SQL优化(持续更新)

优化join在连接两张表时,大表在左,小表在右When you join two tables, specify the larger table on the left side of join and the smaller table on the right side of the join. Presto distributes the table on the right to ...

2019-06-24 18:09:06 689

原创 AWS Athena中的unnest用法

将[[a,0,1],[b,0,2]]转化为按列显示

2019-06-24 11:20:12 677

翻译 AWS Athena 数据库解析json格式字段

提出问题在Athena数据库中遇到入下json格式的字段:{"name": "Susan Smith","org": "engineering","projects": [ {"name":"project1", "completed":false}, {"name":"project2", "completed":true} ]}希望解析该字段,...

2019-05-24 15:13:37 1214

原创 PostgreSQL处理jsonb中的arrays of array 类型

PostgreSQL处理jsonb中的arrays of array 类型一、提出问题在postgre数据库,遇到了数组内嵌套数组的jsonb存储格式,如下:SELECT *FROM public.keyword_trend查询结果:其中,history一栏[[“2014-05-11”,70],[“2014-05-18”,69]…]中,每个数组包含两项,分别为日期和得分,我们希望查询...

2019-05-13 17:17:43 3692 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除