构造正负样本:drug特征和atc特征和类标签

最新推荐文章于 2024-07-15 15:09:35 发布

jp_zhou256

最新推荐文章于 2024-07-15 15:09:35 发布

阅读量765

点赞数

分类专栏：机器学习 weka Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jp_zhou256/article/details/84855848

版权

pos_sample_df是一个drug和ATC编码之间是否有associations的邻接矩阵，我需要根据这个矩阵来实现正负样本的构造。即：邻接矩阵中drug和ATC有边则用来构造正样本，无边用来构造负样本。其中有2000种drug，3000个ATC，drug和ATC的特征均为500x1,邻接矩阵中的1为正样本标签，0为负样本标签。拼接后的一个样本为1001x1的列向量。

import numpy as np
import pandas as pd
import os

data_dir='C:/Users/Administrator/Desktop/temp1113/zhou/data/'
save_dir='C:/Users/Administrator/Desktop/temp1113/zhou/result/'


def concat_lab_vec(lab_df,vec_df,pos_sample_df):
    from numpy import hstack,vstack,array
    print('lab_df:',lab_df.shape)
    print('vec_df:',vec_df.shape)
    #如何拼接?vec_df的第i列与lab_df第j列,按照pos_sample_df中前两列沿着竖直方向拼接
    Total_pinjie=[]
    vect_columns=vec_df.columns.tolist()
    lab_columns=lab_df.columns.tolist()
    pos_columns=pos_sample.columns.tolist()
    for i in range(len(pos_sample)):
        if pos_sample[pos_columns[2]][i]==1:
            drug_index=pos_sample[pos_columns[0]][i]-1 #因为P

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

jp_zhou256 CSDN认证博客专家 CSDN认证企业博客

码龄6年

48: 原创

7万+: 周排名

148万+: 总排名

33万+: 访问

: 等级

2485: 积分

93: 粉丝

165: 获赞

37: 评论

937: 收藏

私信

关注

热门文章

分类专栏

算法导论 3篇
java 2篇
matlab 7篇
华为杯数学建模 5篇
matlabGUI及程序打包 1篇
Python 23篇
SQL 3篇
机器学习 24篇
NLP 8篇
weka 5篇
meka 2篇
echarts 1篇
Gephi 1篇

最新评论

matlab图像缩放下的分辨率加强
yyh_666: 这个能保证缩小后的图像分辨率不变吗？
10折交叉验证深入理解
努力思考: 10折交叉验证是对训练集做的，而将数据安一定比例划分为训练集和验证集有多种划分方法。所以进行10次10折交叉验证。最终训练验证了100次。我这样理解对吗。请务必不吝赐教
sklearn多标签分类算法练习
x534w756f: 请问博主这个包里的算法可以求出yred，根据yred与ytrue可以算出hamming loss ，但多标签不是还有one error ,coverage这些评价指标，这些该咋求啊？
Python3脚本实现csv文件和arff文件的相互转换
水击五千里: 我看有的arff格式文件里面有@attribute class {normal，bold} 这个大括号里的内容怎么弄啊，是直接在datetype里输入“{normal，bold}”吗
恐怖袭击等级预测量化与ARMIA时间序列建模的例子
m0_69132079: 大佬，那个表格数据在哪弄

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。