- 博客(5)
- 收藏
- 关注
原创 Python 二阶马尔可夫实现简易文本内容生成
一、我们可以利用马尔可夫的原理来生成文本:即我们在日常说话的时候,每一个字总是与上下文存在关联性的,譬如在正常语法中,“我”字的后面可能是“们”也可能是“是”,绝对不可能是“我”“你”等等。因而我们可以根据提供的训练集语法文本数据来生成新的文本,根据前两个字来生成第三字,从而实现文本生成二、在实现上,我们分两个部分:1.将训练集数据做处理,记录每两个字对应第三个字的概率;2.通过1部分进行...
2019-10-30 17:56:00 1162
原创 Python 数据处理
一、文件读写:open() :打开文件,第一个参数是打开文件的名称,第二个参数是读取的文件类型。 根据我们的读写需求的不同,第二参数主要分为: ’r':read,读 'w':write,写close():关闭文件write():写入文件w.write('%s\t%s\n'%(a,b)) ...
2018-07-17 10:52:49 377
原创 以太坊开发:以太坊钱包的使用和部署合约(二)
接上一篇,当我们在geth后台配置好了之后,就可以打开以太坊钱包了。在这里,如果我们跳过(一)的内容,直接打开以太坊钱包也无不可,只不过我们步骤一的目的在于搭建一个私有链。在以太坊中,合约的运算是由区块链的发掘和运算进行驱动的,若我们不搭建属于自己的私有链的话,首先就需要跟全网的区块链进行同步,而目前由于以太坊的运营已有几年,因而这个同步需要我们下载比较庞大的区块链文件,并且运算也是需要耗费真正的...
2018-05-03 23:05:02 2596
原创 python 函数使用(一)(input,open,close,def,split)
input:用于输入,同理也有row_input()。二者的区别在于前者会转为Int类型(若为字符串,则输出会带有引号),后者会转为str open: 用于打开一个文件 语法:open(name,mode,buffering) name是文件的名称,mode为打开的模式,buffering为寄存的类型(0为不寄存,1为寄存行,大于1的整数为寄存区的缓冲大小,负数为系统...
2018-04-13 14:50:35 602
原创 Hive 函数使用(一)(datediff,row_number,partition)
datediff: 返回天数的差值 示例:datediff(a,b) 返回b-a的天数row_number():对排序内容添加编号,多与over(partition by)等函数联用over (partition by a):进行分组,常与聚合函数sum()、count()、avg()等结合使用,实现聚合分组 示例: function over (paritition by a) ...
2018-04-12 15:56:23 1785
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人