大数据算法
NEU_LightBulb
人工智障,深度学渣
展开
-
【Java数据结构】树
【Java数据结构】树Java中的树一、树基础结构1.树定义1.1.一些花里胡哨的名词1.2.存储方式2.二叉树2.1.性质2.2.遍历方式二、树的进阶与Java1.完全二叉树1.1.定义1.2.性质1.3.优先级队列中的堆排序2.二叉查找树与平衡二叉树(小陀螺)2.1.定义3.红黑树3.1.定义3.2.性质3.3.HashMap,TreeMap中的红黑树4.B-Tree4.1.定义4.2.性质5.B+Tree(还有B*Tree不讲了)5.1.定义5.2.性质5.3.数据库中的索引5.4. HBase中的L原创 2020-06-15 15:31:25 · 446 阅读 · 0 评论 -
【天池笔记】——IJCAI-18 阿里妈妈搜索广告转化预测
题目表述本次比赛以阿里电商广告为研究对象,提供了淘宝平台的海量真实交易数据,参赛选手通过人工智能技术构建预测模型预估用户的购买意向,即给定广告点击相关的用户(user)、广告商品(ad)、检索词(query)、上下文内容(context)、商店(shop)等信息的条件下预测广告产生购买行为的概率(pCVR),形式化定义为:pCVR=P(conversion=1 | query, user, ad,...原创 2018-03-16 00:51:03 · 1935 阅读 · 2 评论 -
【天池笔记】——IJCAI-18 数据初步清洗
空值检查 Name Shape inTarget 0 Inital Data (478138, 27) (9021, 27) 1 instance_id is -1: (0, 27) (0, 27) 2 item_id is -1: (0, 27) (0, 2...原创 2018-06-14 17:56:02 · 671 阅读 · 0 评论 -
【数据挖掘学习笔记】——拉格朗日法填充缺失值
不多说,上码# col“填充列向量”、nv“空值值,默认-1”、k“拉格朗日区间,默认3”def fillNanWithLagr(col,nv=-1,k=3): # 获取空值位置 tar = map(int,col[col==nv].index.tolist()) for idx in tar: # 获取拉格朗日区间 # 这里去除了空值位置...原创 2018-04-08 18:45:33 · 1924 阅读 · 0 评论 -
【天池笔记】——IJCAI-18 部分数据可视化
训练集用户属性分布 广告商品属性分布 商店属性分布 测试集用户属性分布 广告商品属性分布 店铺属性分布原创 2018-06-14 17:55:50 · 593 阅读 · 0 评论 -
【机器学习-周志华】——学习笔记(1.1 to 2.2)
自己学习的心得,持续更新,欢迎大家评论区交流第一章:第一节:一本书的标准开头第二节:1.基本术语:数据集 :机器学习过程所使用的,具有目标属性(标记)值的数据样本:数据集每一条(行)数据称之为样本。特征:数据集每一个(列)属性称之为特征。样本空间:所有特征的集合。又称“输入空间”。维数:一条样本拥有的特征个数。标记:机器学习的目标特征。标记空间:每一...原创 2019-03-01 16:00:53 · 263 阅读 · 0 评论 -
【机器学习-周志华】——学习笔记(2.3)
上一篇第二章:第三节:1. 查准率P:指查出来的有几个对的2. 查全率R:指对的有几个被查出来3. 特别的,对于二分类问题,将预测的正误与真实的正误交叉构成“混淆矩阵”,分为真正TP、假正FP、真反TN、假反FN 4. 很明显P-R是互斥的,做P-R曲线如下图,且与 P=R 的交点称为平衡点(BEP),平衡点对应的(P,R)值越高或P-R曲线围得面积越大,就越好。...原创 2019-03-01 16:01:22 · 222 阅读 · 0 评论 -
Python实现F1 、AUC计算
# -*- coding: utf-8 -*- ## author NEU_LightBulb-----ZhangJimport numpy as npimport pandas as pdclass Score(): def __init__(self,pre_score,rel_label,threshold,beta): self.tn = 0 ...原创 2019-03-01 16:05:43 · 3920 阅读 · 5 评论