学习日记
文章平均质量分 56
#Super Pig
这个作者很懒,什么都没留下…
展开
-
字节视频算法岗日常实习面经
个人背景:之前的研究方向是基础的因果推断,毫无视频算法基础,只了解经典机器学习算法,这次实习是直系学姐内推的。自己也很想在算法上有所提升,所以斗胆试了试。一面流程总述先是让我讲讲因果这一块的发展然后问了我梯度下降的原理,并且简单实现了一下接着让我实现挑一个自己了解的机器学习算法实现一下最后,问我是否了解图像的平移、旋转、放缩,让我实现了一下图片放缩总的来说,就是考察了三道代码,接着分别阐述每一部分的细节梯度下降面试官问我梯度下降是怎么实现的,我就以感知机为力,推导了一下梯度下降的过.原创 2022-04-15 20:18:45 · 2092 阅读 · 0 评论 -
机器学习模型:数据探索 特征工程 建模
背景:本文用于记录机器学习建模的整体思路,包括数据探索思路、可视化、特征工程等步骤ref:https://www.kaggle.com/erikbruin/house-prices-lasso-xgboost-and-a-detailed-eda#executive-summaryExplore Data1 数据整体情况拿到数据的第一步,先查看数据形状shape,python下dataframe数据常用方法为describe()查看要点:1、查看数据条数2、查看原始特征个数及数据格式3、.原创 2021-08-02 15:08:16 · 539 阅读 · 0 评论 -
数据清洗实战入门——数据表处理
数据筛选方法df.info():查看数据表概况df.head(n):查看前n行/条数据取某个字段:df['name']取多个字段:df[['name1','name2']]取对应字段的某/多行:df[['name1','name2']][3:6]loc函数:根据索引进行选择(Selection by Label)形式:df.loc[row,columns]选取多个列标签时,可用列表的形式放到columns那里,eg:df.loc[:,['uid','age']]可用表达式筛选行,eg:原创 2021-01-19 16:22:11 · 333 阅读 · 0 评论 -
数据清洗实战入门——文件操作
csv文件读写csv文件名尽量为英文读取方法:data=pd.read_csv('file_name.csv',encoding='utf-8'),注意提前修改当前路径,该方法返回的数据结构是dataframe参数:encoding:指定编码格式,一般为utf-8、gbk、gbk2312、gb18030dtypes:指定某列数据的数据类型,eg:data=pd.read_csv('file_name.csv',encoding='utf-8',dtypes={'a':str,'b':原创 2021-01-19 14:03:10 · 191 阅读 · 0 评论 -
数据清洗实战入门——常用数据结构
numpy常用数据结构——ndarray实质:矩阵/n维数组创建方法:array(列表/元组):不指定数据类型:np.array([1,2,3]) => [1,2,3]指定数据类型:np.array([1,2,3],dtype=str/float/int)创建多维数组:使用嵌套列表:np.array([[1,2],[3,4],[5,6]])使用arange:np.arange(a,b,s) #a为起始值,b为终止值,s为步长,左闭右开,不包含终止值创建等差数列:np.原创 2021-01-19 13:41:55 · 272 阅读 · 0 评论 -
Hive SQL整理
目录collect_setcollect_set作用:把一个字段中的值组合到一个集合中,搭配where(筛选)、group by使用;示例:-- id:用户;time:登陆日期select id,collect_set(time) as t from t_action_login where time<='20150906' group by id该查询结果如下: [email protected]原创 2021-01-14 18:30:22 · 312 阅读 · 0 评论 -
【学习日记05】进制转换+最大公约数+最小公倍数+线代+概率论
6.21一、进制转换两步走(a->10->b),10进制以上注意字母字符的处理转换为10进制的时候,权重可以用累计运算,每次循环计算一次若计算十、八、十六这三个进制间的转换,可以直接用printf的格式(d、o、x)二、最大公约数欧几里得算法模板:#include <stdio.h> int main(){ int n,m,t; while(scanf("%d %d",&n,&m)!=EOF){ whil.原创 2020-06-22 23:39:20 · 191 阅读 · 0 评论 -
【学习日记04】高数复习+学习周报
6.21*注:今天只学了一晚上,因为白天陪某个猪????出去买衣服,这个猪今天竟然炒鸡没有求生欲,找????一、高数两平面的夹角点到平面的距离空间直线(两平面相交):一般式、对称式(方向向量)、参数式两直线的夹角直线与平面的夹角(注意是sin)空间曲线(两曲面的交线)及投影(消元)旋转曲面的公式(特例:圆锥面)二次曲面(椭圆锥面、椭球、单叶双曲面、椭圆抛物面、双曲抛物面)多元函数的极限(证明不存在及求解)多元复合函数的求导(路径法)二、学习周报第一次给老师发周报,希望能得到原创 2020-06-22 00:07:05 · 1249 阅读 · 0 评论 -
【学习日记03】二叉排序树+密钥分配(Kerberos)+计网TCP拥塞控制+高数
6.20一、二叉排序树(二叉搜索树)王道只提供了二叉排序树的构建(insert),模板:#include <stdio.h>typedef struct node{ struct node *lchild; struct node *rchild; int val;}Node;Node t[105];int ind;Node* creat(){ t[ind].lchild=NULL; t[ind].rchild=NULL; .原创 2020-06-20 23:22:30 · 152 阅读 · 0 评论 -
【学习日记02】哈夫曼树+二叉树+密钥分发
一、哈夫曼树1、求法:2、数据结构:· 优先队列:priority_queue<int> Q;,这样定义的Q是大顶堆;· 小顶堆定义如下:priority_queue<int,vector<int>,greater<int>> Q;· 头文件: <queue>...原创 2020-06-19 23:51:31 · 260 阅读 · 0 评论 -
【学习日记01】栈+计网传输层
2020.6.18一、王道机试指南第三章-数据结构1、栈:简单调用:使用C++#include <stack>//head filestack<int> S;//defienS.empty();//empty?True:False;S.push(i);S.pop();int i=S.top();一个栈被多次调用时,一定要记得清空!!!经典使用:括号匹配:思路:· 顺序遍历字符串,遇到左括号就压栈,遇到右括号就弹栈匹配(栈为空就意味匹配失败);原创 2020-06-18 23:55:37 · 101 阅读 · 0 评论