自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(50)
  • 收藏
  • 关注

原创 台大林轩田《机器学习基石》:作业一python实现

15下载训练数据,每一行都是一个训练实例,每一行的数据中,前四项是特征值,最后一项是标签,编写PLA算法进行分类,设w初始为0,sign(0)=-1,问迭代多少次后算法结束?1.需要自己手动添加一维特征,X0=1 2.一个点分类正确的条件是x*w*y>0(PLA) 3.算法结束的条件是所有实例都被分配正确代码如下:import numpyclass NaiveCy...

2018-06-20 20:54:31 5531 3

原创 统计学习方法第五章:决策树(decision tree),CART算法,剪枝及python实现

决策树(decision tree)是一种基本的分类与回归方法。决策树模型呈树状结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。其主要优点是模型具有可读性,分类速度快。学习时,利用训练数据,根据损失函数最小化的原则建立决策树模型。预测时,对新的数据,利用决策树模型进行分类。决策树学习通常...

2018-06-18 16:34:39 3947

原创 Coursera吴恩达机器学习笔记及代码练习(Matlab版)

之前寒假其实已经在B站上看过Andrew的这门机器学习了,先在这里给出链接,基本上都是有中文字幕的。 喜欢弹幕的小伙伴可以看这个,https://www.bilibili.com/video/av9912938网易云课堂也上线了这门课,因为是官方翻译肯定比B站的好,缺点也是没有配套练习。 https://study.163.com/course/introduction/100457002...

2018-06-01 12:20:31 22465 11

原创 阿里巴巴Java开发手册:编程规约.并发处理

2.【强制】创建线程或线程池时请指定有意义的线程名称,方便出错时回溯。正例:自定义线程工厂,并且根据外部特征进行分组,比如,来自同一机房的调用,把机房编号赋值给whatFeaturOfGrouppublic class UserThreadFactory implements ThreadFactory { private final String namePrefix; pr...

2020-04-23 16:37:20 317

原创 阿里巴巴Java开发手册:编程规约.集合处理

1.【强制】关于hashCode和equals的处理,遵循如下规则:1) 只要重写equals,就必须重写hashCode。2) 因为Set存储的是不重复的对象,依据hashCode和equals进行判断,所以Set存储的对象必须重写这两个方法。3) 如果自定义对象作为Map的键,那么必须重写hashCode和equals。说明:String重写了hashCode和equals方法,所以我...

2020-04-21 12:37:07 430

原创 阿里巴巴Java开发手册:编程规约.OOP

2.【强制】所有的覆写方法,必须加@Override注解。说明:getObject()与get0bject()的问题。一个是字母的O,一个是数字的0,加@Override可以准确判断是否覆盖成功,避免外形太像导致覆写失败。另外,如果在抽象类中对方法签名进行修改,其实现类会马上编译报错。重写发生在运行期,是子类对父类的允许访问的方法的实现过程进行重新编写。返回值类型、方法名、参数列表必须相同,抛...

2020-04-20 10:56:49 271

原创 阿里巴巴Java开发手册:编程规约.命名风格

命名风格1.【强制】代码中的命名均不能以下划线或美元符号开始,也不能以下划线或美元符号结束。反例:name/name/namename / name_ / namename/name/​name /name__2.【强制】代码中的命名严禁使用拼音与英文混合的方式,更不允许直接使用中文的方式。正例:alibaba / taobao / youku / hangzhou 等国际通用的名称,可视...

2020-04-19 22:11:51 288

原创 21届春招总结

前言我的春招是从2月份开始,4月15结束,历时两个多月,六家公司,三个offer,不像一些同学是offer收割机,但也算是有所收获,接下来按公司总结一下。思目这是我面试的第一家公司,我们院有不少同学在那里日常实习,薪资福利待遇都很好。我看到一个同学在朋友圈发了招聘信息就去试了试。面试总共就一面,问了一些mysql和项目管理相关的问题,第二天就发offer了。面试体验很棒,但因为那时候还想试试...

2020-04-17 12:26:36 720

原创 阿里巴巴(阿里妈妈)面经

前言阿里妈妈我是提前批开始面试的,第一次发简历是2月7日,然后好像石沉大海了,2月27日又发了一次,这次有回应了,开始面试。一面 3.5 80分钟自我介绍项目介绍java object方法euqals hashcodehashmap原理,线程安全吗,如果要线程安全要用什么,concurrenthashmp怎么实现的,用的什么锁线程和进程内存区域,为什么有些是线程私有的直接调r...

2020-04-15 14:43:09 743

原创 字节跳动(上海抖音)面经

前言字节跳动是一个同学在学院群里发了一个内推群,是上海抖音的招聘,我就投递了,基本流程走的很快,简历发过去很快就有hr加你微信来商量面试时间,当时因为疫情原因没有复工,所以约了一周后面试,两天面完三面,offer审批也比较快。下面是具体面试过程。一面 3.9 50分钟算法题:判断一个数组是不是搜索二叉树的后序遍历的结果tcp udp区别tcp如何实现有序传输tcp有序传输过去的数据...

2020-04-12 22:01:54 3430 1

原创 《大教堂与集市》读书笔记

“软件的核心在于设计,而所有设计都会体现在源码之中,拿到源码,你就几乎拿到了软件的一切。”“大教堂模式和集市模式。传统大型软件公司的开发模式就像是艰难而缓慢的大教堂建造工程,它有着严密的管理和封闭的集中式结构,但在创新上、生产力上和Bug控制上却落后于集市模式。集市模式是一种并行的、对等的扁平化开发结构,其参与者大多来自于互联网上的志愿者,结构松散,来去自由,就像是一个乱糟糟的集市,但就是这样的...

2019-10-31 17:53:45 544

原创 《人件》读书笔记

第一部分:管理人力资源01考虑怎样去适应人的“非模块化”特征认识到问题的真正的本质分属社会学的范畴,而与政治无关,能帮助我们面对问题时更加游刃有余我们工作中的问题更多属于社会学范畴,而非技术范畴我们大多数人是在从事人类交流的职业,而非高科技职业。我们的成功源于所有参与者良好的人与人之间的互动,我们的失败则归因于这些互动的缺失02开发的本质完全迥异于生产,然而开发管理者的思想却通常被生...

2019-10-14 10:41:38 514

原创 《人月神话》读书笔记

第一章:焦油坑第二章:人月神话Brooks法则:向进度落后的项目中增加人手,只会使进度更加落后第三章:外科手术队伍需要协作沟通的的人员数量影响着开发成本,因为成本的主要组成部分是相互的沟通和交流,以及更正沟通不当所引起的不良结果(系统调试)小型,精干队伍对于真正意义上的大型系统,太慢了第四章:贵族专制,民主政治和系统设计在系统设计中,概念完整性应该是最重要的考虑因素,也就是说,为了反...

2019-10-03 10:06:49 542

原创 修改Mac的默认python和pip版本

mac本机上默认的python版本是2.7的,使用一些机器学习和数据挖掘的库时很不方便,下载了anaconda,希望把mac的默认python版本换成这个。修改python默认版本打开终端(terminal)open ~/.bash_profile写入python的外部环境变量export PATH=${PATH}:/usr/local/anaconda3/bin/pytho...

2019-09-19 16:14:11 5420

原创 How project description length and expected duration affect bidding and project success 论文笔记

论文完整名称《How project description length and expected duration affect bidding and project success in crowdsourcing software development》摘要在众包软件开发网站上,供应商对非常短期的提案请求(中位数7天)进行投标,这些请求以简短的方式描述(中位数241字)。因为它的规...

2019-05-23 13:03:49 259

原创 Introducing Collaboration in Competitive Crowdsourcing Markets论文笔记

摘要众包是一种在一定时间内以分布式方式解决问题的有效方法。众包平台的工作原理可以是竞争性的或协作性的。在这两种情况下,群体工作者(解决者)通过竞标或由请求者(任务提供者)预先通知获得报酬。即使这种形式是方便的,竞争力的诅咒也常常减少工人的参与。我们强调,通过在竞争激烈的众包市场引入协作,我们可以有效地处理可分解类型的任务。为此,我们提出了一种新的机制。如果任务是可分解的,那么工作人员可能会有兴趣...

2019-05-23 13:03:40 268

原创 SAP上海labs实习体验

18年7月份到11月在SAP上海labs实习,写一写自己的看法吧。我是SAP的VT项目进去的,首先是一些培训,了解公司产品,然后会有一个各部门的宣讲,双向选择,我最终是进了Big Data部门。首先说技术方面,我们这个部门的产品很老,用的还是JSP,不过这是跟部门有关的,我一同实习的同学也有用比较新的技术的。SAP有自己的语言ABAP,但最近似乎也在向其他语言转化,毕竟ABAP只有一家用,是否...

2019-02-17 16:30:29 3800 4

原创 git上传本地代码到github

老是忘记,记录一下1.进入项目目录2.创建一个空的本地仓库git init3.添加缓存git add .注意add后面有个点,表示添加目录下所有文件到缓存库,如果只添加某个文件,只需把 . 换成你要添加的文件名即可4.将缓存中的文件Commit到git库git commit -m "添加你的注释,一般是一些更改信息"将缓存中的文件Commit到git库5.将本地的库链接到远程仓...

2019-01-31 11:07:03 142

原创 Django问题总结(持续更新)

最近准备用Django和vue.js写一个项目,所以学习一下Django的使用,主要跟着中文文档 https://docs.djangoproject.com/zh-hans/2.0/ 一起学习,也跟着快速入门写了个小项目,地址是 https://github.com/xjwhhh/DjangoStart。开此文记录一下Django学习中遇到的一些问题,以供参考。水平不高,若有所疏漏,希望大家指...

2019-01-22 15:38:53 249

原创 Show and Tell: Lessons learned from the 2015 MSCOCO Image Captioning Challenge

论文地址:https://arxiv.org/abs/1609.066471.Introduction自动识别图像内容并转化为描述比研究得很好的图像分类或对象识别任务要困难得多,后者一直是计算机视觉界的主要关注点。事实上,描述不仅必须捕获图像中包含的对象,还必须描述这些对象如何相互关联,以及它们的属性和所涉及的活动。此外,上述语义知识必须以英语等自然语言表达,这意味着除了视觉理解之外,还需要一...

2019-01-04 17:41:49 834

原创 Java反编译

今天想要看公司项目引入的jar包源码,就下载了反编译软件,有两种方式。JD-GUI图形化界面,可以直接读取jar包JD-Eclipse/JD-IntelliJ将软件以插件的形式集成到IDE,可以直接查看项目jar包源码,在debug时很方便下载地址http://jd.benow.ca/...

2018-10-18 17:50:00 139

原创 Reachability Analysis of Deep Neural Networks with Provable Guarantees 论文小结

论文内容验证深度神经网络的正确性是困难的,我们研究一个关于前馈深度神经网络的一般性可达性问题——给定一个输入集合,使用Lipschitz连续的函数来计算输出,计算这个函数值的上下界。因为神经网络和函数都是利普希茨连续的,所以在这个上下界中的任意数值都是可达的。我们展示了如何通过实例化一个可达性问题来获取安全验证问题,输入范围分析问题和鲁棒性测量问题。我们提出了一种新的基于自适应嵌套优化的算法来解...

2018-10-09 18:54:33 816

原创 Java Keytool生成数字证书/.cer/.p12文件

任何机构或者个人都可以申请数字证书,并使用由CA机构颁发的数字证书为自己的应用保驾护航。常用的两个证书管理工具:KeyTool,OpenSSL—>构建CSR(Certificate Signing Request,数字证书签发申请),交由CA机构签发,形成最终的数字证书。最近用到p12文件,就记录一下如何使用jdk自带的keytool来创建p12文件创建私钥和证书1.打开cmd,切换到...

2018-09-18 15:59:39 10020

原创 Java解析p12文件

做公司项目遇到了关于GoogleBigQuery的问题,而要使用这个服务需要一个证书,要求支持json和p12文件两种格式。这里主要记录一下如何从p12文件中读取出公钥和私钥信息。import sun.misc.BASE64Encoder;import java.security.KeyStore;import java.security.PrivateKey;import java...

2018-09-13 17:28:05 4828 2

原创 Java Eclipse问题总结

步骤1.启动程序时,添加参数 -Xdebug -Xrunjdwp:transport=dt_socket,server=y,address=7899,suspend=n-XDebug 启用调试; -Xrunjdwp 加载JDWP的JPDA参考执行实例; transport 用于在调试程序和VM使用的进程之间通讯; dt_socket 套接字传输; server=y/n VM是否...

2018-08-14 14:03:10 273

原创 Struts2问题总结

Eclipse下struts2.5环境搭建与struts2.3的区别在struts2.3中,需要导入导入了9个常用jar包。 (1)struts2-core-2.x.x.jar :Struts 2框架的核心类库 (2)xwork-core-2.x.x.jar :XWork类库,Struts 2在其上构建 (3)ognl-3.x.x.jar :对象图导航语言(Object Gr...

2018-08-01 10:29:52 717

原创 MySQL5,5.7,8密码更改

最近重装了mysql,版本是8,在改密码时出现了一些问题,在此记录一下。MySQL5:方法1: 用SET PASSWORD命令mysql -u rootmysql> SET PASSWORD FOR ‘root’@’localhost’ = PASSWORD(‘newpass’);方法2:用mysqladminmysqladmin -u root password...

2018-07-31 17:06:02 1546

原创 mongodb安装新特性

近日在安装mongodb时,发现了最新的安装方式与以前有了一些不同,特此记录一下。首先自然是去到mongodb的官网,https://www.mongodb.com/download-center?jmp=nav#atlas,下载对应操作系统和版本的安装器。 与之前不同的是,以前的很多教程中,安装完后需要自己设置mongodb的数据存储位置和日志存储位置,但在最新的安装器中,mongo让你选...

2018-07-28 18:03:17 279

原创 OData简介

最近在公司实习碰到了Odata这个以前没见过的名词,因为以后需要使用,所以了解一下wiki: OData协定,英文全名是Open Data Protocol(OData),它是一个开源的协定,以简单和标准的方法,来建造或消除可查询和可操作的RESTful API。它创始于2007年的微软公司。版本1.0, 2.0, 和3.0发行在微软开放规格承诺书(Microsoft Open Specif...

2018-07-26 17:10:52 4908

原创 南京大学软件学院2018保研夏令营经验

首先,我要说明的是我本人是南京大学软件学院本科生,所以对于外校生的保研经历可能了解的并不是很清楚,经验只供参考。今年夏令营共四天,第一天是报到入营,第二天是讲座和导师介绍,第三天是面试和机考,第四天是自己与联系的导师进行交流,夏令营结束。其中最重要的是第三天的面试和机考。 面试本次是老师事先分好组,然后每个组内的人抽签决定面试顺序,每个组的不同就是面试老师的不同。我是本组第二个面试,但其...

2018-07-18 22:30:22 11412 44

原创 PageRank算法

在搜索引擎的发展史上,一开始组织网页的方式是网页索引(人工编辑),Yahoo,DMOZ就是使用的这种方式,但随着网页数量越来越多,这种方式耗时耗力,难以为继。第二种方式就是网页搜索,但缺陷在于,网络是巨大的,充满了不可信,过时和随机的东西。网页搜索中的两种挑战:1.网络中存在多个来源的数据,该相信谁? 方法:可信的页面彼此相互引用和链接 2.查询“数据”的最佳回答是什么? 方法:...

2018-07-06 21:29:09 731

原创 南京大学软件测试复习

BugStory• Software Fault : A static defect in thesoftware (i.e., defect),静态存在于软件中的缺陷,如code写错了• Software Error : An incorrect internalstate that is the manifestation of some fault,软件运行时,运行到fault触发产生错误的...

2018-07-04 13:26:09 2347 1

原创 统计学习方法第五章:决策树(decision tree),ID3算法,C4.5算法及python实现

决策树(decision tree)是一种基本的分类与回归方法。决策树模型呈树状结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。其主要优点是模型具有可读性,分类速度快。学习时,利用训练数据,根据损失函数最小化的原则建立决策树模型。预测时,对新的数据,利用决策树模型进行分类。决策树学习通常...

2018-06-27 09:43:23 2341

原创 《数学之美》读后感

近日拜读了吴军博士的《数学之美》,感触很深。《数学之美》最初是吴军博士在谷歌黑板报上撰写的一系列文章,用生动形象的语言,结合数学发展的历史和实际的案例,系统地阐述了与现代科技领域相关的重要的数学理论的起源,发展及作用。对于我个人来说,这本书给我的最大惊喜就是吴军博士将数学理论与他在实际工业界中的作用联系起来,看过我之前一些博文的可能发现,我自己最近在学习机器学习,但学习机器学习有个问题就是...

2018-06-25 16:01:34 2063 1

原创 台大林轩田《机器学习基石》:作业四python实现

13下载训练样本和测试样本,利用正则化的线性回归,参数lambda取10,得到Ein和Eout我计算w的方式是使用正规方程,即calculate_w_reg方法import numpy as np# load datadef load_data(filename): code = open(filename, "r") lines = code.readli...

2018-06-22 16:53:13 585

原创 台大林轩田《机器学习基石》:作业三python实现

台大林轩田《机器学习基石》:作业一python实现 台大林轩田《机器学习基石》:作业一python实现 台大林轩田《机器学习基石》:作业三python实现13给定target function,我们的工作是在X=[-1,1]x[-1,1]上随机产生1000个点,利用f(x1,x2)计算它的值,然后在基础上添加10%的噪声(二元分类的噪声就是把10%的样本的y值取相反数)。如果不做f...

2018-06-21 11:31:42 1175 1

原创 台大林轩田《机器学习基石》:作业二python实现

17,18分类方法是”positive and negative rays”,老师上课讲过的第17题是要在[-1,1]种取20个点,分隔为21个区间作为theta的取值区间,每种分类有42个hyphothesis,枚举所有可能情况找到使E_in最小的hyphothesis,记录最小E_in第18题的意思是在17题得到的最佳hyphothesis的基础上,利用第16题的公式计算E...

2018-06-21 09:24:36 1026

原创 统计学习方法第四章:朴素贝叶斯法(naive Bayes),贝叶斯估计及python实现

朴素贝叶斯(naive Bayes)法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。朴素贝叶斯法实现简单,学习与预测的效率都很高,是一种常用的方法下图是朴素贝叶斯算法:具体的解释和证明可以看《统计学习方法》或其他博文,这里不再赘述...

2018-06-18 12:24:17 3243 1

原创 统计学习方法第三章:k近邻法(k-NN),kd树及python实现

k近邻法(k-nearest neighbor,k-NN)是一种基本分类与回归方法。k近邻法假设给定一个训练数据集,其中的实例类别已定。分类时,对新的实例,根据其k个最近邻的训练实例的类别,通过多数表决等方式进行预测。因此,k邻近法不具有显式的学习过程。k近邻法实际上利用训练数据集对特征空间进行划分,并作为其分类的“模型”。k值的选择,距离度量及分类决策规则是k近邻法的三个基本要素。...

2018-06-17 17:13:53 1387 1

原创 统计学习方法第二章:感知机(perceptron)算法及python实现

感知器(perceptron)是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。感知器对应于输出空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型。感知器学习旨在求出将训练数据进行线性划分的分离超平面,为此,导入基于误分类的损失函数,利用梯度下降法对损失函数进行极小化,求得感知机模型。感知器学习算法具有简单而易于实现的优点,分为原始形式和对...

2018-06-17 16:21:22 2480 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除