文本分类心得

正式入职了一段时间,接手了NLP相关任务,作为一个初学者,分享一点最近的所学心得和体会。 稍后有时间更新,现在项目催的很紧,能力比较强的可以找我内推阿里秋招。可以私信我联系方法,个人会进行第一遍简历筛选。 1.冷启动问题: 当文本数据量很少时(可称为冷启动阶段),一般采用概率统计...

2019-08-02 10:25:03

阅读数 11

评论数 0

机器学习查准率和查全率理解

半年之后突然需要算这个东西,概念忘的差不多了。今天google搜索一查,发现搜索排名前几的讲解,都是在将概念,贴公式(没什么不好,但没有短时间解决我的问题) 今天我们就从语文的角度来理解这两个东西。 举例:在标签过程中,我原始数据中标记19个正例(关注在正例)。然后用模型跑...

2019-07-04 19:09:37

阅读数 27

评论数 0

近况

        很久没写博客了,这几个月发生了很多事情,包括家里的,个人的,公司的等等,最近也一会忙着写毕业论文,博客没时间更新了,等到5-6月份入职之后,会重启博客,记录学习心得。以下就推荐近期有感的书籍吧,包括小说和专业知识书,有兴趣的同学可以看一下。         1、《人生》    ...

2019-01-30 17:27:01

阅读数 121

评论数 1

Flink学习总结

Flink这块学习资料比较少,近期都在学习中,之后完善做一个总结,希望对自己和大家的学习有帮助,错误或者不足支持,恳请批评指正,谢谢! 目前在流失大数据这块,随着计算成本的降低,和实际业务开发需求的提升,对流失数据的开发也更加频繁,各大公司比较常用的流失框架有:Spark、Storm、Flink...

2018-10-12 10:32:16

阅读数 530

评论数 0

阿里数据研发/数据挖掘提前批录用

纪念一下今天,第一个OFFER,感谢阿里!秋招开始!大家加油! 面经和学习总结在其他博客里面有,欢迎相互讨论和学习!

2018-09-30 10:54:55

阅读数 538

评论数 3

Scala几类基本常用类型(Array,List,Tuple,Set,Map)和常用的操作(map,foreach,reduce)

创建 Array,可变的同类对象序列,长度不可变,值可变:  val example = new Array[String](3)  创建长度为3的空数组,数组里的元素类型为字符串,数组赋值可以通过example(0) = "a"    注意:字符串是双引号,字...

2018-08-28 11:29:54

阅读数 553

评论数 0

阿里2019校招数据研发/数据挖掘终面交叉面

今天下午,所有的面试都面完了,9月初出结果,耐心等待ing,面试是北京打来的电话,不是杭州,不知道为什么,base选择的杭州; 估计要到9月中旬才能发了,也不知道自己的具体情况,好运! 问题描述: 1、自我介绍 2、学校的一些情况,选择了杭州? 3、挑一篇你觉的最好的论文讲一下 4、挑...

2018-08-23 16:38:08

阅读数 894

评论数 5

2019阿里校招数据研发/算法工程师 hr面

2018-08-22更:下午6点接到hr电话,进行了25min左右的面试 主要问题如下: 1、你是控制专业,我不是很了解控制专业,你能大概给我讲解一下吗?并且告诉我这两天还要加面一轮交叉面,不知道是为什么,有知道的大佬可否私信告诉一下,谢谢! 2、你印象中最深刻的项目是哪个?做了多长时间? ...

2018-08-22 20:51:48

阅读数 2223

评论数 0

2019校招阿里数据研发/数据挖掘三面总结

2018/8/20:阿里三面总结 写在前面:面试是在13号进行的,面试时长15min左右,之前约的是视频面试1h左右的,面试官太忙了,因此转为了电话面试,主要围绕项目和个人未来规划,出去转了两天,因此晚更了,开始正题。 1、自我介绍:围绕简历,讲述了一下个人研究方向,论文情况和简历的三份实习经...

2018-08-20 09:52:21

阅读数 2250

评论数 0

2019阿里校招数据挖掘/数据开发一面总结

前两天刚面完一面,明天面二面,趁着印象还算深刻,记录下来,不管个人成功与否,希望对你们有参考意义; 面试7点40开始,是一位小姐姐来电面的(二面得知,这个小姐姐是二面小哥的Boss......),感觉应该是统计学/数学专业的,至于为什么会有这样的猜想,后续会提到; 1、上来就是对第二篇论文进行...

2018-08-11 14:18:55

阅读数 1349

评论数 2

2019年阿里数据挖掘/数据研发二面总结

2018-08-06 晚上7:00 进行了一个小时的二面,由于时间耗光了,后面又邮件补发了三道编程了,要求实现;博客按回忆顺序来写,不足之处,请多多谅解! 问题一: 你简历中上过的数据挖掘、机器学习等课程,是学校的研究生课程还是自己单独学习的;回答道:研究生课程有学习,自己单独私下也有学习 ...

2018-08-11 14:18:48

阅读数 1548

评论数 0

五大排序算法Python版本代码及其总结

后续会尽量完善:2018-08-01 稳定排序:是指当有一个相等的数字进来时,它会确定性的放在其相等数字的后面 1冒泡排序: 时间复杂度:最好状态O(n),最差O(n2),空间复杂度O(1),属于稳定排序 # -*- coding: utf-8 -*- "&qu...

2018-08-01 09:36:55

阅读数 132

评论数 0

牛客网编程之二分查找

思路和代码如下:仅供学习,牛客网回复也属于本人,不是抄袭! 1  首先题目限定了使用二分查找法 2  可能出现重复,但是想一下,如果出现了重复,如果是出现再后面,肯定不用考虑,因为执行过程中会忽略,但是出现再前面,返回的索引就不对了,因此再找的得到元素的基础上,要再一个查询条件,查找前面是否存...

2018-07-20 09:42:58

阅读数 120

评论数 0

牛客网编程之句子反转

题目描述给定一个句子(只包含字母和空格), 将句子中的单词位置反转,单词用空格分割, 单词之间只有一个空格,前后没有空格。 比如: (1) “hello xiao mi”-> “mi xiao hello”输入描述:输入数据有多组,每组占一行,包含一个句子(句子长度小于100...

2018-07-06 16:19:40

阅读数 197

评论数 0

牛客网算法错题笔记总结

1、给定节点数n后,求二叉树最多的结构结构数量num = C(2n,n)/n+1;其中n是给定的节点数2、平衡二叉树,在给定树的高度之后,求最少节点个数,递推求解,公式如下F(n) = F(n-1) + F(n-2) + 1       F(0) = 0;  F(1) = 1;F(2) = 23、...

2018-07-06 16:06:17

阅读数 120

评论数 0

机器学习要点总结

对机器学习初学者的12条宝贵建议,转自:https://blog.csdn.net/Mbx8X9u/article/details/808514151. “表征+评估+优化”构成机器的主要内容!构成机器学习算法的 3 部分:表征(Representation):分类器必须用计算机可以处理的形式化语...

2018-07-04 09:44:26

阅读数 154

评论数 0

机器学习训练集/开发集/测试集挑选

在实际应用领域,一般将数据集分成三块,训练集:用来训练算法;开发集:用来进行特征选择或者调参;测试集:用来检测算法的表现,因此测试集应该能够反映和包含现实的真正数据分布,而不是假设分布。在实际算法迭代过程中,我们最后希望得到的结果是算法在测试集上表现的非常优秀;但是,最近读吴恩达老师的笔记:有时可...

2018-06-11 09:54:12

阅读数 349

评论数 0

Linux shell学习总结

1、#!/bin/sh    定义脚本解释器,将shell语句翻译成机器语言                                        2、${var}   变量定义:通过$符号定义,变量又可以分为环境变量,脚本变量等;统计变量的信息有如下指令: (1) $$  shell...

2018-06-08 11:43:17

阅读数 180

评论数 0

用python 第一次在牛客网在线编程

题目描述请设计一个算法能够完成两个用字符串存储的整数进行相加操作,对非法的输入则返回error输入描述:输入为一行,包含两个字符串,字符串的长度在[1,100]。输出描述:输出为一行。合法情况输出相加结果,非法情况输出error示例1输入复制123 123 abd 123 输出复制246 Erro...

2018-06-07 10:17:05

阅读数 4148

评论数 0

Java初学继承问题解析

初学Java,在继承的参数方法上,遇到一些问题,但是通过以下这个例子,很好的明白了这个过程,感兴趣的朋友可以跑一下,试试,很快就能理解了;class Father{ public Father(){System.out.println("father methods&q...

2018-06-03 11:38:41

阅读数 67

评论数 0

提示
确定要删除当前文章?
取消 删除