- 博客(8)
- 收藏
- 关注
原创 十一月组队学习Numpy大作业
导入鸢尾属植物数据集,保持文本不变。【知识点:输入和输出】如何导入存在数字和文本的数据集?import numpy as npoutfile = r'.\iris.data'iris_data = np.loadtxt(outfile, dtype=object, delimiter=',', skiprows=1)print(iris_data[0:10])# [['4.9' '3.0' '1.4' '0.2' 'Iris-setosa']# ['4.7' '3.2' '1.3' .
2020-12-01 22:30:12 128
原创 推荐系统Task3:多路召回
这次的学习任务有点多,代码多,加上十月份没有参加组队学习,导致没有学完,只写到YoutubeDNN部分,但还是记录一下自己的学习进度吧。多路召回所谓的“多路召回”策略,就是指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混合在一起供后续排序模型使用,可以明显的看出,“多路召回策略”是在“计算速度”和“召回率”之间进行权衡的结果。其中,各种简单策略保证候选集的快速召回,从不同角度设计的策略保证召回率接近理想的状态,不至于损伤排序效果。如下图是多路召回的一个示意图,在多路召回中,每个策略
2020-11-30 22:23:17 186
原创 十一月组队学习:Numpy线性代数
线性代数Numpy 定义了 matrix 类型,使用该 matrix 类型创建的是矩阵对象,它们的加减乘除运算缺省采用矩阵方式计算,因此用法和Matlab十分类似。但是由于 NumPy 中同时存在 ndarray 和 matrix 对象,因此用户很容易将两者弄混。这有违 Python 的“显式优于隐式”的原则,因此官方并不推荐在程序中使用 matrix。在这里,我们仍然用 ndarray 来介绍。矩阵和向量积矩阵的定义、矩阵的加法、矩阵的数乘、矩阵的转置与二维数组完全一致,不再进行说明,但矩阵的乘法有
2020-11-29 18:42:05 104
原创 十一月推荐系统Task2:数据分析
时间紧,有关思考都在注释里了!#导包#%matplotlib inlineimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns#这行会报错! plt.rc('font', family='Simhei',size= 13)# 为matplotlib添加中文库,否则画图时x轴y轴标签中的中文会变成方框!!plt.rcParams['font.sans-serif']=
2020-11-27 23:32:40 77
原创 十一月组队学习:numpy统计相关
numpy中关于统计的各种函数今天的内容比较简单:以下x均为数组(一维或以上)整体内容:1.最大值:np.max(x,axis=None)2.最小值:np.min(x,axis=None)3.极差:np.ptp(x,axi=Nones)4.分位数:np.percentile(x,分位数,axis=None),分位数可以是一个列表,如[0,25,75]5.中位数:np.median(x,axis=None) 与 np.percentile(x,50,axis)等价6.均值:np.mean(x,
2020-11-26 16:43:40 211 1
原创 十一月组队学习-推荐系统Task1:Baseline
组队学习:推荐系统Task1:Baseline第一次阅读这么多代码,感触就是,首先要看懂整体代码的逻辑,否则陷进去又不知道它们在做什么!Baseline的整体逻辑其实很简单:1.定义了一个节省内存的函数,但之后没用过了def reduce_mem(df)2.定义了一个从训练集从部分采样的函数,用作debug调试,但之后没用过了def get_all_click_sample(data_path, sample_nums=10000):3.定义了一个获取点击数据的函数(内部分为线上和线下):
2020-11-25 23:39:07 222 2
原创 11月组队学习task2:Numpy随机抽样
时间紧,随便写一点了!np.random.binomial(n, p, size)np.random.poisson(lam, size)x = np.random.hypergeometric(ngood=7, nbad=13, nsample=12, size=size)连续型随机变量:均匀分布。有三个函数:#numpy.random.uniform(low=0.0, high=1.0, size=None)在[low,high)范围内,创建大小为size的均匀分布的随机数#numpy.ra
2020-11-25 23:34:00 148
原创 Numpy组队学习1-输入和输出
Numpy组队学习1-输入和输出一、npy和npz格式文件的保存及加载:np.save(),np.load()和np.savez()函数二、文本文件(txt,csv)的保存和加载:np.savetxt(),np.loadtxt(),np.genfromtxt()三、文本格式选项:np.set_printoptions()的使用一、npy和npz格式文件的保存及加载:np.save(),np.load()和np.savez()函数1.保存文件:np.save():Save an array to a bi
2020-11-23 19:03:52 321 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人