- 博客(36)
- 收藏
- 关注
原创 Transformer相关原理
一些概念1.seq2seq模型seq2seq模型是由编码器(Encoder)和解码器(Decoder)组成的。其中,编码器会处理输入序列中的每个元素,把这些信息转换为一个向量(称为上下文(context))。当处理完整个输入序列后,编码器把上下文(context)发送给解码器,解码器开始逐项生成输出序列中的元素。在编写seq2seq模型的时候设置上下文向量的长度。这个长度是基于编码器 RNN 的隐藏层神经元的数量。如何把每个单词都转化为一个向量呢?我们使用一类称为 "word embeddi.
2021-08-19 01:48:45 522
原创 合约编写实战实例
解析: 上面实现一个简单的加密货币,币在这里可以无中生有,但只有创建合约的人才能做到,且任何人都可以给他人转币,无需注册名和密码。address类型是一个160位的值,不允许任何算数操作,这种类型适合存储合约地址或外部人员。mappings可看作是一个哈希表,它会执行虚拟初始化,以使得所有可能存在的键都映射到一个字节表示为全零的值。event Sent(address from, address to, uint amount);声明了一个所谓的事件,它在send函数最后一行被发出。用户界面可以
2021-03-31 00:25:45 427
原创 TASK 03打卡
一、以太坊客户端1.1、什么是以太坊客户端以太坊客户端是一个软件应用程序,它实现以太坊规范并通过p2p网络与其他以太坊客户端进行通信。如果不同的以太坊客户端符合参考规范和标准化通信协议,则可以进行相互操作。 以太坊是一个开源项目,由“黄皮书”正式规范定义。除了各种以太坊改进提案之外,此正式规范还定义了以太坊客户端的标准行为。 因为以太坊有明确的正式规范,以太网客户端有了许多独立开发的软件实现,它们之间又可以彼此交互。1.2、基于以太坊规范的网络存在各种基于以太坊规范的网络,这些网络基本符合
2021-03-24 00:58:27 104
原创 TASK 02 solidity 在线编辑器
1、 简介1.1 Solidity是什么Solidity 是一门面向合约的、为实现智能合约而创建的高级编程语言。这门语言受到了 C++,Python 和 Javascript 语言的影响,设计的目的是能在以太坊虚拟机(EVM)上运行。 Solidity 是静态类型语言,支持继承、库和复杂的用户定义类型等特性。 内含的类型除了常见编程语言中的标准类型,还包括address等以太坊独有的类型,Solidity 源码文件通常以 .sol 作为扩展名 目前尝试 Solidity 编程的推荐方式是使用.
2021-03-21 01:43:11 626
原创 综合练习
1.创建Employee 表,包含所有员工信息,每个员工有其对应的 Id, salary 和 department Id。CREATE TABLE employee( employee_id CHAR(4) NOT NULL, emplyee_name VARCHAR(100) NOT NULL, salary INTEGER NOT NULL, department_id CHAR(4) NOT NULL, PRIMARY KEY (employee_id));IN...
2020-12-28 22:56:31 143
原创 SQL窗口函数
1. 窗口函数概念及基本的使用方法窗口函数也称为OLAP函数。OLAP 是OnLine AnalyticalProcessing 的简称,意思是对数据库数据进行实时分析处理。为了便于理解,称之为窗口函数。常规的SELECT语句都是对整张表进行查询,而窗口函数可以让我们有选择的去某一部分数据进行汇总、计算和排序。窗口函数的通用形式:<窗口函数> OVER ([PARTITION BY <列名>] ORDER BY <排序
2020-12-25 23:57:23 129
原创 matplotlib绘图样式与颜色设置
一、matplotlib的绘图样式(style)在matplotlib中,要想设置绘制样式,最简单的方法是在绘制元素时单独设置样式。如果想保持整体风格的统一而不用对每张图一张张修改,matplotlib库还提供了四种批量修改全局样式的方式。1.matplotlib预先定义样式matplotlib贴提供了许多内置的样式供用户使用,使用方法很简单,只需在python脚本的最开始输入想使用style的名称即可调用,尝试调用不同内置样式。2.用户自定义stylesheet在任意路径下创建一个后缀
2020-12-24 23:39:12 2208
原创 SQL集合运算
1.表的加减法(1)定义集合在数学领域表示“各种各样的事物的总和”,在数据库领域表示记录的集合.。具体来说,表、视图和查询的执行结果都是记录的集合,其中的元素为表或者查询结果中的每一行。在标准 SQL 中,分别对检索结果使用UNION,INTERSECT,EXCEPT来将检索结果进行并,交和差运算,像UNION,INTERSECT,EXCEPT这种用来进行集合运算的运算符称为集合运算符。(2)UNIONUNION 等集合运算符通常都会除去重复的记录,(3)OR使用...
2020-12-22 23:54:10 295 2
原创 matplotlib.pyplot文本插入
一、Figure和Axes上的文本Matplotlib具有广泛的文本支持,包括对数学表达式的支持、对栅格和矢量输出的TrueType支持、具有任意旋转的换行分隔文本以及Unicode支持。下面的命令是介绍了通过pyplot API和objected-oriented API分别创建文本的方式。1.textpyplot API:matplotlib.pyplot.text(x, y, s, fontdict=None, **kwargs)OO API:Axes.text(self, x, y
2020-12-22 23:33:13 770
原创 matplotlib.pyplot绘制子图
import matplotlib.pyplot as plt当只画1个图时,使用plt(比如plt.line(…))绘制,隐式地创建了一个图形实例和图形对象内部的坐标轴。在一个图形上画多个子图时,可以显式地调用plt .subplot()来获得Figure对象和Axes对象,以便对它们执行更多的操作。一、子图1. 使用plt.subplots绘制均匀状态下的子图返回元素分别是画布和子图构成的列表,第一个数字为行,第二个为列figsize参数可以指定整个画布的大小share...
2020-12-22 23:21:23 1096
原创 数据可视化-子图
一、子图1. 使用plt.subplots绘制均匀状态下的子图返回元素分别是画布和子图构成的列表,第一个数字为行,第二个为列figsize参数可以指定整个画布的大小 sharex和sharey分别表示是否共享横轴和纵轴刻度 tight_layout函数可以调整子图的相对大小使字符不会重叠2. 使用GridSpec绘制非均匀子图所谓非均匀包含两层含义,第一是指图的比例大小不同但没有跨行或跨列,第二是指图为跨列或跨行状态利用add_gridspec可以指定相对宽度...
2020-12-20 23:50:26 494
原创 视图与子查询
1. 定义视图是一个虚拟的表,不同于直接操作数据表,视图是依据SELECT语句来创建的(会在下面具体介绍),所以操作视图时会根据创建视图的SELECT语句生成一张虚拟表,然后在这张虚拟表上做SQL操作。视图与表的区别—“是否保存了实际的数据”。所以视图并不是数据库真实存储的数据表,它可以看作是一个窗口,通过这个窗口我们可以看到数据库表中真实存在的数据。所以我们要区别视图和数据表的本质,即视图是基于真实表的一张虚拟的表,其数据来源均建立在真实表的基础上。图片来源:《sql基础教程第2版》2..
2020-12-20 22:30:00 1339 1
原创 pandas基础
准备工作: 安装三个包:xlrd,xlwt,openpyxl,其中xlrd版本不得高于2.0.0一、文件的读取和写入1. 文件读取pandas可以读取的文件格式有很多,这里主要介绍读取csv,excel,txt文件。常用的公共参数,header=None表示第一行不作为列名,index_col表示把某一列或几列作为索引,索引的内容将会在第三章进行详述,usecols表示读取列的集合,默认读取所有的列,parse_dates表示需要转化为时间的列,nrows...
2020-12-19 23:56:56 159 2
原创 艺术画笔见乾坤
一、概述1. matplotlib的三层apimatplotlib的原理或者说基础逻辑是,用Artist对象在画布(canvas)上绘制(Render)图形。就和人作画的步骤类似:准备一块画布或画纸 准备好颜料、画笔等制图工具 作画所以matplotlib有三个层次的API:matplotlib.backend_bases.FigureCanvas代表了绘图区,所有的图像都是在绘图区完成的matplotlib.backend_bases.Renderer代表了渲染器,可以近似理解..
2020-12-18 23:58:37 138 1
原创 SQL基础查询与排序
1.SELECT语句基础基本SELECT语句包含了SELECT和FROM两个子句(clause),SELECT子句中列举了希望从表中查询出的列的名称,FROM子句则指定了选取出数据的表的名称。WHERE子句来指定查询数据的条件。相关法则包括,星号(*)代表全部列的意思。 SQL中可以随意使用换行符,不影响语句执行(但不可插入空行)。 设定汉语别名时需要使用双引号(")括起来。 在SELECT语句中使用DISTINCT可以删除重复行。 注释是SQL语句中用来标识说明或者注意事项的部分。分为
2020-12-17 22:26:30 287
原创 Pandas预备知识01
知识框架:一、Python基础 二、Numpy基础 1. np数组的构造 2. np数组的变形与合并 3. np数组的切片与索引 4. 常用函数 5. 广播机制 6. 向量与矩阵的计算
2020-12-16 23:58:32 93
原创 SQL基本书写规则
1.DBMS的种类DBMS 主要通过数据的保存格式(数据库的种类)来进行分类,现阶段主要有以下 5 种类型. 层次数据库(Hierarchical Database,HDB) 关系数据库(Relational Database,RDB) 如上是5种具有代表性的RDBMS,其特点是由行和列组成的二维表来管理数据,这种类型的 DBMS 称为关系数据库管理系统(Relational Database Management System,RDBMS)。 Oracle Database:甲
2020-12-15 23:51:34 318
原创 Matplotlib 简介与基本概念
简介:Matplotlib是一个Python 2D绘图库,是python中公认的数据可视化工具,pandas和seaborn的绘图接口其实也是基于matplotlib所作的高级封装。Matplotlib的图像是画在figure上,每一个figure又包含了一个或多个axes(一个可以指定坐标系的子区域)。最简单的创建figure以及axes的方式是通过pyplot.subplots命令,创建axes以后,可以使用Axes.plot绘制最简易的折线图。此处的axes是matplotlib中的专有名词,图形中组
2020-12-14 23:45:26 1885 2
原创 [Datamining][FinancialRiskControl] Task04: 建模与调参
逻辑回归模型: 理解逻辑回归模型; 逻辑回归模型的应用; 逻辑回归的优缺点; 树模型: 理解树模型; 树模型的应用; 树模型的优缺点; 集成模型 基于bagging思想的集成模型 随机森林模型 基于boosting思想的集成模型 XGBoost模型 LightGBM模型 CatBoost模型 模型对比与性能评估: 回归模型/树模型/集成模型; 模型评估方法; 模型评价结果; 模型调参:..
2020-09-24 22:52:00 137
原创 [Datamining][FinancialRiskControl] Task02:数据分析
赛题:零基础入门数据挖掘 - 零基础入门金融风控之贷款违约目的: 1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模. 2.了解变量间的相互关系、变量与预测值之间的存在关系。 3.为特征工程做准备 2.1 学习目标学习如何对数据集整体概况进行分析,包括数据集的基本情况(缺失值,异常值) 学习了解变量间的相互关系、变量与预测值之间的存在关系 完成相应学习打卡任务2.2 内容介绍数据总
2020-09-18 23:56:56 1098
原创 [Datamining][FinancialRiskControl] Task01:赛题理解
竞赛采用AUC作为评价指标。AUC(Area Under Curve)被定义为 ROC曲线 下与坐标轴围成的面积。分类算法常见的评估指标如下:1、混淆矩阵(Confuse Matrix)(1)若一个实例是正类,并且被预测为正类,即为真正类TP(True Positive ) (2)若一个实例是正类,但是被预测为负类,即为假负类FN(False Negative ) (3)若一个实例是负类,但是被预测为正类,即为假正类FP(False Positive ) (4)若一个实例是负类,并且被预测
2020-09-15 23:41:33 180
原创 Task09; 文件与文件系统.md
1. 文件与文件系统打开文件open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True)Open file and return a stream. Raise OSError upon failure. file: 必需,文件路径(相对或者绝对路径)。 mode: 可选,文件打开模式 buffering: 设置缓冲 encoding: 一般使用utf8 .
2020-08-09 00:22:21 77
原创 Task08:模块与datetime模块
模块把这些定义存放在文件中,为一些脚本或者交互式的解释器实例使用,这个文件被称为模块(Module)。模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。这也是使用 Python 标准库的方法。容器 -> 数据的封装 函数 -> 语句的封装 类 -> 方法和属性的封装 模块 -> 程序文件命名空间命名空间因为对象的不同,也有所区别,可以分为如下几种:内置命名空间(Built-in Namespa
2020-08-07 23:44:56 91
原创 Task07:类、对象与魔法方法(3天)
类与对象1. 对象 = 属性 + 方法对象是类的实例。换句话说,类主要定义对象的结构,然后我们以类为模板创建对象。类不但包含方法定义,而且还包含所有实例共享的数据。封装:信息隐蔽技术 继承:子类自动共享父类之间数据和方法的机制多态:不同对象对同一方法响应不同的行动2. self 是什么?Python 的self相当于 C++ 的this指针。类的方法与普通的函数只有一个特别的区别 —— 它们必须有一个额外的第一个参数名称(对应于该实例,即该对象本身),按照惯例它的名称是...
2020-08-05 23:15:21 127
原创 Task06:函数与Lambda表达式
1. 函数还记得 Python 里面“万物皆对象”么?Python 把函数也当成对象,可以从另一个函数中返回出来而去构建高阶函数,比如:参数是函数 返回值是函数函数的定义函数以def关键词开头,后接函数名和圆括号()。 函数执行的代码以冒号起始,并且缩进。 return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。2. 函数参数Python 的函数具有非常灵活多样的参数形态,既可以实现简单的调用,又可以传入非常复杂的参数。从简到繁的
2020-08-02 22:36:20 88
原创 Task 5: 字典、集合和序列
字典1. 可变类型与不可变类型序列是以连续的整数为索引,与此不同的是,字典以"关键字"为索引,关键字可以是任意不可变类型,通常用字符串或数值。 字典是 Python 唯一的一个 映射类型,字符串、元组、列表属于序列类型。那么如何快速判断一个数据类型X是不是可变类型的呢?两种方法:麻烦方法:用id(X)函数,对 X 进行某种操作,比较操作前后的id,如果不一样,则X不可变,如果一样,则X可变。 便捷方法:用hash(X),只要不报错,证明X可被哈希,即不可变,反过来不...
2020-07-31 23:37:00 141
原创 Task04列表、元组和字符串
https://github.com/datawhalechina/team-learning-program/tree/master/Python-Language1.列表简单数据类型整型<class 'int'> 浮点型<class 'float'> 布尔型<class 'bool'>容器数据类型列表<class 'list'> 元组<class 'tuple'> 字典<class 'dict'>..
2020-07-28 23:49:05 75
原创 Task 03 异常处理
https://github.com/datawhalechina/team-learning-program/tree/master/Python-Language异常就是运行期检测到的错误。计算机语言针对可能出现的错误定义了异常类型,某种错误引发对应的异常时,异常处理程序将被启动,从而恢复程序的正常运行。1. Python 标准异常总结BaseException:所有异常的基类 Exception:常规异常的基类 StandardError:所有的内建标准异常的基类 Arith...
2020-07-25 23:52:52 70
原创 Task 3: 基于机器学习的文本分类
https://github.com/datawhalechina/team-learning-nlp/blob/master/NewsTextClassification/Task3%20%E5%9F%BA%E4%BA%8E%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E7%9A%84%E6%96%87%E6%9C%AC%E5%88%86%E7%B1%BB.md1.文本表示方法 Part1文本表示成计算机能够运算的数字或向量的方法一般称为词嵌入(Word Emb...
2020-07-25 23:41:16 157
原创 Task2: 条件语句 循环语句
`学习链接: https://github.com/datawhalechina/team-learning-program/tree/master/Python-Language1.条件语句(1)If 语句if 语句的expr_true_suite代码块只有当条件表达式expression结果为真时才执行,否则将继续执行紧跟在该代码块后面的语句。 单个 if 语句中的expression条件表达式可以通过布尔操作符and,or和not实现多重条件判断。(2) if -...
2020-07-24 00:55:53 135
原创 Task1: 变量、运算符与数据类型
课程地址:https://github.com/datawhalechina/team-learning-program/blob/master/Python-Language/01.%20%E5%8F%98%E9%87%8F%E3%80%81%E8%BF%90%E7%AE%97%E7%AC%A6%E4%B8%8E%E6%95%B0%E6%8D%AE%E7%B1%BB%E5%9E%8B.md1. 注释:(1)单行:#表示注释,作用于整行。(2)多行:''' '''或者""" """表示区...
2020-07-22 23:28:50 113
原创 Task01 赛题理解
赛题名称:零基础入门NLP之新闻文本分类 赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。 赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类, 典型的字符识别问题。相关资料整理记录:1.Datawhale 零基础入门数据挖掘-Baseline :https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.24.1cd8593aw4bbL5&.
2020-07-21 22:17:54 82
原创 Task03&04&05 : 要点记录
Task 03: 欠拟合现象:模型无法达到一个较低的误差 过拟合现象:训练误差较低但是泛化误差依然较高,二者相差较大 Task 04:卷积神经网络基础介绍卷积神经网络的基础概念,主要是卷积层和池化层,并解释填充、步幅、输入通道和输出通道的含义。二维卷积层介绍的是最常见的二维卷积层,常用于处理图像数据。...
2020-02-20 12:25:46 71
原创 Task01&Task02: 线性回归;Softmax与分类模型、多层感知机;文本预处理;语言模型;循环神经网络基础
1.线性回归的基本要素:模型、数据集、损失函数2.优化函数优化函数的有以下两个步骤:(i)初始化模型参数,一般来说使用随机初始化; (ii)我们在数据上迭代多次,通过在负梯度方向移动参数来更新每个参数。3.矢量计算向量相加的两种方法。向量相加的一种方法是,将这两个向量按元素逐一做标量加法。 向量相加的另一种方法是,将这两个向量直接做矢量加法4. softmax和...
2020-02-14 21:56:40 164
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人