代码18

glove.840B.300d.txt是词典文件,包含词及词对应的词向量,需要检查是否每一个词的词向量都是100维的。

向量每一维都是空格隔开的,词与向量也是空格隔开。

文件格式如下:

 

f=open('/home/xbwang/newtextsimilarity/data/glove/glove.840B.300d.txt','r')
count = 0
print ' '.join(['0.0'] * 100)
for line in f:
    count += 1
    frags = line.strip().split(' ')[1:]
    print count, len(frags)
    assert len(frags) == 100                            用assert判断是不是每行都是100个向量,如果是,就正常执行下一行代码,如果不是,不会执行下面几行的代码,循环也结束,同时报错         
    for i in frags:
        try:                                     这里的try语句是为了保证向量元素都是数字,可以为整数也可以是float,但如果是字符串就会报错                                    
            float(i)
        except Exception:
            print count, i

 

假设第五行的向量为99维,运行此代码检查的结果为下图:

 

 

assert:

1、assert语句用来声明某个条件是真的。
2、如果你非常确信某个你使用的列表中至少有一个元素,而你想要检验这一点,并且在它非真的时候引发一个错误,那么 assert语句是应用在这种情形下的理想语句。
3、当assert语句失败的时候,会引发一 AssertionError
4、 如果断言成功(如果为真)那么不执行任何操作;如果断言不成功,那么会触发AssertionError。

 

 

assert一般的用法是:

assert condition

用来让程序测试这个condition,如果condition为false,那么raise一个AssertionError出来。逻辑上等同于:

if not condition:
    raise AssertionError()

assert的异常参数,其实就是在断言表达式后添加字符串信息,用来解释断言并更好的知道是哪里出了问题。格式如下:
assert expression [, arguments]
assert 表达式 [, 参数]

未添加异常参数:
>>> assert 1==0 Traceback (most recent call last): File "<stdin>", line 1, in <module> AssertionError 添加异常参数: >>> assert 1==0,'1 is not equal to 0' Traceback (most recent call last): File "<stdin>", line 1, in <module> AssertionError: 1 is not equal to 0

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值