待学习:
python, one-hot,
步骤:
- 安装python+pytorch环境
- 数据转换成数学向量模式(把数据存成tensor, 可以自动求导)
- 编程求解模型参数
- 在学习过程中观察每一轮梯度下降验证集、测试集的F1-measure
概念:
查准率:正确预测数/模型预测总数
查全率:正确预测数/实体总数
F1-measure: 2查全率查重率/(查全率+查重率)
词的维度一般在500左右,需要试一试
很多细节是需要注意的(例如会出现多出的字符)
另:
- 寄存器:计算机的存储层次之中,寄存器(register)最快,内存其次,最慢的是硬盘。
距离不同:以3GHz的CPU为例,电流每秒钟可以振荡30亿次,每次耗时大约为0.33纳秒。光在1纳秒的时间内,可以前进30厘米。也就是说,在CPU的一个时钟周期内,光可以前进10厘米。因此,如果内存距离CPU超过5厘米,就不可能在一个时钟周期内完成数据的读取,这还没有考虑硬件的限制和电流实际上达不到光速。相比之下,寄存器在CPU内部,当然读起来会快一点。
硬件设计不同:苹果公司新推出的iPhone 5s,CPU是A7,寄存器有6000多位(31个64位寄存器,加上32个128位寄存器)。而iPhone 5s的内存是1GB,约为80亿位(bit)。这意味着,高性能、高成本、高耗电的设计可以用在寄存器上,反正只有6000多位,而不能用在内存上。因为每个位的成本和能耗只要增加一点点,就会被放大80亿倍。寄存器的晶体管一直有电,而内存的晶体管只有用到的才有电,没用到的就没电,这样有利于省电。
工作方式不同:寄存器的工作方式很简单,只有两步:(1)找到相关的位,(2)读取这些位。