文本匹配学习,更新中

pandas

数据中有一列为Body ID 代表,这个dataFrame对应id的文本。下面的代码,解决的是如何把Body ID对应列的id替换成文本。

import numpy as np,pandas as pd

df_val = pd.read_csv('validation_data_cx.csv',encoding = 'utf-8')

df_val.head(3)

df_val.to_csv('validataon_data_cx.csv',encoding = 'utf-8')

def mergedata(df):       
    df_train2 = df.sort_values(["Body ID"],ascending=True)

    del df['Body ID']
    del df['Stance']

    df_merge = df.merge(df_train2, left_on='ID', right_on='Body ID', how='inner')

    del df_merge['ID_x']
    return df_merge

merge_val = mergedata(df_val)


merge_val.to_csv('val_merge.csv',encoding = 'utf-8',index = None)

### 按照ID_y重排dataframe
df_testM = merge_val.sort_values(["ID_y"],ascending=True)

文档:merge函数

list–>dataframe

keras

keras处理不平衡数据分类

sample_weight

唉,coding能力太渣渣了。网上大多是class_weight的例子。对于one_hot输出的不适用。费了老大的劲找到一个sample_weight的例子。好好珍惜
sample_weight例子

问题本身

kaggle比赛
例子2

代码错误

TypeError: Value passed to parameter 'shape' has DataType float32 not in list of allowed values: int32, int64

leaks_dense = Dense(num_dense/2, activation=act)(leaks_input)

原本以为是需要指定这一层的数据类型,改了好几遍都不对。
正确的改法 num_dense//2
参考地址

In Python 2.X:

>>> 10/3
3
>>> # to get a floating point number from integer division:
>>> 10.0/3
3.3333333333333335
>>> float(10)/3
3.3333333333333335
In Python 3:

>>> 10/3
3.3333333333333335
>>> 10//3
3

错误2

label处的错误

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值