自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 文本分类(初阶)

前言之前写了十几篇blog,但更多都是基础知识的回顾,基础知识尽管再好,也是基础知识,它只能帮助你在工作中更快上手,或者说让你在程序员的道路上走得更远——地基打得越好,楼层才能越高。毕竟最近也开始要考虑找工作的事情,所以也要把专业知识给补上。作为一个日常都是处理文本的少年,文本分类是第一道、甚至可以不夸张地说是最重要一道的坎:尽管现在各种NLP方法都热火朝天的样子,但本质上都存在着落地难的问题,NLG看似高端大气上档次,但是除了机器翻译外,其他都很难做到商用级别,而机器翻译也不是单纯地使用Bert啊,E

2021-01-13 00:29:22 415

原创 Zookeeper入门学习资料

Zookeeper作为Hadoop生态中的一员,属于那种我们日常经常有意无意用着的,但就是很少专门只用它的一种的软件——有点像黑子哲也那样。你说它不重要吧,少了它你kafka,HBase、HDFS那些又搞不动,多了它吧,反正那些软件本身都已经搭好了跟Zookeeper的互动,你也几乎不会调用Zookeeper的api。但是,Zookeeper还是有一个非学不可的理由——很简单,不用太费心。所以之前工作期间俺也特地抽了一两个周末来搞懂个大概——其实也就入门水平,毕竟入了门好像现在也没怎么使用过。.

2021-01-12 15:32:07 245

原创 浅析java和python的正则

123333

2021-01-11 22:32:02 1157 2

原创 浅析java和python的迭代

先说两句废话作为一个算法工程师,一般都要同时兼顾着模型预研和工程部署实现的工作。如果说现在模型预研用得最多的是python(简单,易上手,除了慢和写得好需要极强的内容外,几乎没有别的缺点)这个目前应该是没有争议的,但是在工程部署上就不大统一了,有的公司用java,有的用c++,还有的用JavaScript(没想到吧,毕竟js是可以贯通前端+后端的神器,还可以直接用TensorFlow),当然,他们几个之间的好处坏处我这里也懒得或者说不想叙述了,只能说,本渣更注重后台实现,所以工程上几乎都是java。

2021-01-10 17:07:32 204

原创 Redis入门学习资料

Redis作为nosql的一种(我学过最容易的nosql,虽然好像也没有特别难的nosql),在日常中还是挺常见先放资料链表《慕课网的Redis入门教程》https://www.imooc.com/learn/839评价:免费!评分高达9.63。一般的学习资料我会首推官网,但是redis除外,redis的官网的介绍,是真心一般,但慕课的这个教程个人感觉是慕课网少有的精品,而且完全免费!当然,你看完这个教程,最起码日常的查插删改问题不大,更高级的,还是努力买本书去啃啃或者直接看源码吧.

2021-01-07 20:58:33 114

原创 程序员的数学复习

毕业了近一年,也写了一整年代码。发现日常都是各种CRUD。老老实实地推导公式其实没几次(说好的高端大气上档次的算法工程师呢)。后面有一次跟老童鞋聊天发现,突然感觉自己什么拉格朗日中值定理啊、泰勒公式、什么行列式,T分布,F分布,区间估计,通通还给了老师,再想想一年前的自己还是一个可以手撕svn的数学系秃头研究僧。不禁悲从中来,不可断绝。前一段时间因为身体原因要离职回家休养一段时间,就打算从头开始刷起(毕竟属于那种巨闲无比的社会人士),毕竟以后工作总不可能一直CRUD的对不对?最后花了我两个星期的时.

2021-01-07 13:35:09 199 5

原创 Docker 入门学习资料

老规矩,先安利链接Docker官方:推荐:建议每个想学docker的人先刷一遍官方文档,讲解概念还是非常清楚的,重点搞懂container/image/repository的概念。官方的安装教程蜜汁友好,亲测可用(你想想多少人死在第一步安装上面)。https://docs.docker.com/engine/install/小滴课堂的Docker教程:推荐:个人看过很多docker的入门书,除了官方文档外,首推这个。各个概念讲得还是十分到位的,对于入门来说足够了,至于进阶....

2021-01-07 13:00:06 317

原创 Python学习资料和路线规划

现在python很火,说实话,俺都不知道被多少个朋友问过怎么入门Python.......(后面再被问到直接甩这个链接算了)当然,在学python之前我也要先泼一下冷水,虽然现在说大数据啊,机器学习啊这些都跟python有关,但完全不等同python,更准确地说模型的预研和快速部署跟python相关,一旦涉及到高并发、分布式部署..........请学c++(TensorFlow)或者java(Spark/Hadoop)这两个才是王道!!!但python也并发一无是处,例如,模型的预研.

2020-12-30 23:55:37 238

原创 Linux学习资料

基本上每个程序员都或多或少地用过Linux但是能说自己精通或者系统的学过的其实寥寥无几但这东西如果不系统学吧,每次要用的时候不会的时候再查又麻烦。(手动无语)所以之前趁着在单位有段时间稍微闲一点的时候,便计划系统地过一次。当时选了其实也挺多书来看的,什么《鸟叔的私房菜》,《Linux命令行大全》啊,不是说不好,但一看那1000多页,瞬间就没有胃口。后面选了慕课网上一门收费的Linux教程过了一下,非常通俗易懂,五星好评!https://www.imooc.com/read/39.

2020-12-30 23:24:24 113

原创 Pytorch学习资源记录

笔者之前在学习深度学习的时候,曾经学过TensorFlow,Pytorch,Keras等框架。最后在去年写毕业论文的时候最终毅然决定无脑Pytorch虽说当时已经在实习单位头秃头秃地写了3个月TensorFlow了,按道理来说用TensorFlow应该是水到渠成的。但TensorFlow有几个巨坑的点(今天无聊上去看了一下,比之前改善了一点):1. 对新的模型支持非常非常不好,我实习的时候都2018年了,但那时候调个Seq2Seq,简直想哭,那头发真是一掉一大把的恐怖。2. 官网的.

2020-12-27 22:56:20 103

原创 1. 设计模式——单例

Java的设计模式一般可以划分为3部分。分别为creational(创建型)、结构型(structural)和行为型(behavioral)型为什么这里强调Java,虽然设计模式更多是一种思想和套路,但也跟程序语言本身的特性也有一定的联系。例如Python,就很少用接口、多态这东西(虽然可以强行用abc包进行模拟)而更多使用函数作为参数进行。在python进阶书籍《fluent python》也写到“Althought design pattern are language-independent

2020-12-19 19:10:30 132 2

原创 设计模式笔记(总序)

什么是设计模式设计模式说起来非常高大上,什么为代码提供标准、增加稳健性和可复用性。但其实归根结底就俩字——“套路”,准确地来说就是程序员写代码的“套路”。这套路其实就是总结出别人的代码经验,用来帮助我们设计出更好的代码。但是,“套路”是不是一定要遵循呢?也不一定,设计模式其实更多是为你提供一种思路,但正如“尽信书不如无书”,事实上目前常见的23个设计模式大多数已经是90年代的产物——当然,并不是说老的东西不好,但有一部分确实目前已经弃用了。所以在学习过程中,不必追求面面俱到(有些模式几乎真的没人用),个

2020-12-15 23:30:05 150 2

原创 Kaggle实战——Gender Recognition by Voice声音的性别区分(结构化数据)(二)

之前讲到用验证集和测试集对模型进行评定,但除了单纯使用准确率(accuracy)外,在二分类中,还可以使用查全率(precision)和召回率(recall)进行。当然,正如一句俗话:一张图剩于千个字。除了上面干巴巴的数字之外,我们更习惯于用图进行说话,在二分类中,我们常用的是ROC曲线和PR曲线,在本文中仅讲述ROC曲线。ROC曲线的全称为“受试者工作特征”,在介绍ROC曲线之前首先要引入混淆矩...

2018-05-14 21:40:27 2651 4

原创 Kaggle实战——Gender Recognition by Voice声音的性别区分(结构化数据)(一)

这是以前的一次小组期末作业(当然编程部分都是我独立完成),写在这里也当做记录一下,顺便复习一下python和常用的机器学习算法吧。在进行数据分析时候第一件事情就是......数据集的查找........无论对于新手还是老手来说,Kaggle都是一个很好的数据平台,新手直接上手以前的玩具数据,至于老手可以直接对新数据进行比赛.......可以的话还可以混点奖金什么的(虽然哥从没得过奖)。这次的数据属...

2018-05-14 15:59:39 6169

原创 EXCEL——入门 数据查找(1)

最近在准备找数据分析的工作,然后一看,最基本要求都是会EXCEL,开始本人蜜汁自信(明明什么实习都没有),哥哥我App开发会Java,微信小程序会JavaScript,数据分析和机器学习会Python,数据库会用是SQL,不就一个简单的EXCEL么,淡定淡定,后面遇上了几轮面试,都惨遭淘汰,后面不由得反思自己........好像,真的连EXCEL也不大会唉,再加上这段时间导师那边也有另外的项目,基...

2018-04-12 11:31:18 754

原创 笔记整理:西瓜书——第1章:绪论

不知不觉就研一下啦,想了想,作为一个专硕狗也要开始考虑工作和实习了,不过在这之前打算先花那么一两个月再刷刷书。看书必然要做笔记,但是做笔记最痛苦的经常是:嗯,笔记做了,短时间还记得,过了一段.......笔记不见了,东西也基本忘光了(经常发生)。想了想,就在博客稍微记一下吧。因为本渣的专攻方向为机器学习和深度学习,西瓜书和Benjor那本蓝皮书算得上必备之本。就把两本书的大致笔记做一下吧。先刷西瓜...

2018-03-19 21:22:39 893

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除