自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 资源 (3)
  • 收藏
  • 关注

原创 NLP成长计划(三)

Setup假设您已经完成了(一)和(二)所需的设置。 Train-Validation-Test Split在开始在新数据集上拟合模型之前,您应该(并且尽量)将初始数据集划分为“训练集train“、“验证集validation”和“测试集test”。训练数据集为我们提供了一个让我们的模型学习的地方。验证数据集为我们提供了一种判断模型相对于其他潜在模型的性能的方法。测试数据集帮我们预...

2018-10-21 21:17:08 407

原创 NLP成长计划(二)

 Setup假设您已经完成了(一)所需的设置。在本讲座中,我们将使用 Gensim和NLTK,这两个广泛使用的Python自然语言处理库。  如果我们想要能够对文本进行分类,我们需要能够根据文章、段落、句子和文本的其他主体所包含的信息以及它们所表示的内容来生成它们的特征。有很多方法可以做到这一点,我们将采用3种方法。Term-DocumentBag-of-Words...

2018-10-19 23:56:43 427

原创 NLP成长计划(一)

Getting Set Up需要安装的程序:Anaconda 5.0.1 Python 3.6https://www.anaconda.com/download/ -- Python 3.6 可以更好地处理文本数据 -- Anacond 收集了流行的libraries以及packages.XGboost安装XGBoost:conda install -c conda-forge...

2018-10-16 21:20:01 480

原创 pagerank的实现和模拟大量数据情况下的并行分块化

所有源码都在github上(https://github.com/seasonyao/pagerank)一、pagerank简介(参考书籍《推荐书籍实践》和csdn若干博客 可以跳到第二部分 需要解决的问题)1.PageRank的核心思想如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是PageRank值会相对较高。如果一个PageRank值很高的网页链接到一个其他...

2018-07-17 23:09:25 6687 3

原创 LFM法实现的user item推荐系统

所有源码都在github上(https://github.com/seasonyao/recommended-system)代码环境:windows环境下python3.5,安装numpy和sklearn即可源码、数据、结果:https://download.csdn.net/download/codes_first/10741150各个读入文件的格式如下: ...

2018-06-25 00:06:13 5792 23

原创 教你配置出和我一样的ros工作环境&&附上整个工作空间里的源码

安装配置我就不多赘述了,官方还是大神们的博客一堆一堆其实最简单的wiki上的安装信息照做就行http://wiki.ros.org/indigo/Installation/Ubuntu还有一些博客也挺好的我推荐一下https://www.cnblogs.com/CZM-/p/5858180.html从今天开始为了准备近期一个机器人的比赛我将一直在ros平台上写各种任务的代码,当然现在先私密文章比赛...

2018-03-12 16:29:58 715 1

原创 java+mysql+tomcat MVC框架网站搭建

所有源码都在github上(https://github.com/seasonyao/24languages-words-meanings-web)1.配置介绍:Windows8环境下Java(1.8.0_121)+mysql+tomcat8.5.24用的软件intellij idea2017和navicat premium2.需求为以上20种语言的60个英文单词(I...

2018-03-09 20:08:31 4090

原创 使用朴素贝叶斯进行问卷分析(C++)

根据贝叶斯定理,对一个分类问题,给定样本特征x,样本属于类别y的概率是 在这里,x是一个特征向量,将设x维度为M。因为朴素的假设,即特征条件独立,根据全概率公式展开,上述公式可以表达为  这里,只要分别估计出,特征xi在每一类的条件概率就可以了。类别y的先验概率可以通过训练集算出,同样通过训练集上的统计,可以得出对应每一类上的,条件独立的特征对应的条件概率向量。 以下结合代码谈谈具体的实现stru...

2018-03-04 16:55:05 1325

原创 tensorflow搭建cnn人脸识别训练+识别代码(python)

环境介绍:Balabalabala任何东西的起步都是把它的环境给搭建好,关于tensorflow的环境搭建网上一众博客这里就不多说了,自己使用的是Anaconda那套安装流程。这次代码还需要的一些其他python库,大家可以在跑的时候发现哪个no moudle了在install即可。总的来说代码的大致情况如下:1.搭建工具:windows +tensorflow 1.4.0 + p

2018-02-01 00:29:13 53200 170

原创 python使用tf-idf法判断文本关键词

论文的关键词有着其特殊的重要使命,首先当然是方便别人浏览,可以一目了然的知道论文论述的主题,从而决定是否要花费时间阅读正文,节约大家的时间;其次也是更重要的一点,能够方便论文的归类和搜索。所以对待任意一段文本,如果我们能快速得到它的关键词,也就能达到和论文一样的效果。本demo用python语言结合jieba分词库+urllib爬虫库+beautifulsoup的html分析工具实现了tf-idf法

2017-12-05 22:41:59 1819 1

原创 MIT JOS LAB4学习笔记

Lab4Part A: 多处理器支持和协作式多任务练习 1 :实现在 kern/pmap.c 中的 mmio_map_region 方法。你可以看看 kern/lapic.c 中的 lapic_init 开头部分,了解一下它是如何被调用的。你还需要完成接下来的练习,你的 mmio_map_region 才能够正常运行。lapic_init()函数的一开始就调用了该函数,将从lapica...

2019-01-20 01:05:29 1978 1

原创 数据结构——导通电路板问题(排序)

有一块布满器件的电路板,器件共N行M列。每个器件只有两种状态,经一次激光照射后状态反转。初始时,器件的状态随机。激光的位置在每列器件的最上方,这意味着照射一次,当前列中的所有器件的状态全部反转。(激光可以多次照射同一列。)当一行中的所有器件全为1时,本行处于导通状态。给定一块电路板,并指定激光照射次数,求最大导通行数。限定:3≤行数N≤100,3≤列数M≤20,1≤激光照射次数K≤...

2018-10-24 09:15:36 1030 3

原创 数据结构——求金属融化所需要的时间(图的遍历)

求金属融化所需要的时间1) 在N × N的格子上放置着形状不规则的金属(5≤N≤1000)。金属为1×1格子的整数倍组成的不规则形状; 金属有可能中空,这样在开始的时刻中空的方格不会立即充满液体; 当中空的格子有缺口时,液体可以立即进入到中空的地方。2) T=0时刻从格子的最外围开始注入某种可以融化金属的液体。液体扩散填充的速度不计,例如在T=0时刻液体充满浅蓝色方块。3) 当...

2018-10-24 09:06:50 1035

原创 数据结构——Huffman编码及译码

Huffman编码及译码1.掌握二叉树的二叉链表存贮结构。2.掌握Huffman算法。 要求:使用文件保存初始的文本数据及最终的结果。文件名为inputfile1.txt的文件保存的是一段英文短文; 文件名为inputfile2.txt的文件保存01形式的编码段; 文件名为outputfile1.txt的文件保存各字符的出现次数和对应的编码; 文件名为outputfi...

2018-10-23 16:33:21 5078 1

原创 数据结构——链表实现两个多项式加减乘除

任务概述:使用链表实现两个多项式的基本操作。初级要求:实现加法、减法和微分操作。高级要求:实现乘法和除法操作。(除法操作中,当不能除尽时还要求列出余式。)要点:    链表中的每个结点形式如下:                                                          链表中,各结点按指数升幂或降幂排列,生成的结果多项式仍使用原多项式所占...

2018-10-23 16:22:35 8860 1

原创 Intel MKL FATAL ERROR: Cannot load mkl_intel_thread.dll解决(windows)

Intel MKL FATAL ERROR: Cannot load mkl_intel_thread.dll.出现错误“Intel MKL FATAL ERROR: Cannot load mkl_intel_thread.dll”,尝试以下方法: 1、从“~\Anaconda3\Lib\site-packages\numpy\core”中复制mkl_intel_thread.d...

2018-09-11 22:40:20 3388 2

原创 嵌入式实验报告(linux实验)

1 LED 灯驱动程序1.1 “文件”的实现设备驱动作为操作系统的一部分,是操作系统对设备进行操作的接口。操作系统规定了设备驱动需要实现的接口,而我们在裸机实验中也用到了控制设备所用到的接口。为了实现我们嵌入式实验箱的linux 驱动程序,我们需要将这两个接口好好的“对接”一下。参考ours_led.c 文件,我们做如下分析:首先,我们定义设备的i 节点名称, 这样我们就能在我们的文件系统中找到我...

2018-06-27 11:22:33 11600

原创 嵌入式系统实验报告(C 语言实验)

第一部分指导手册实验分析1 LED 流水灯这是我们学习C 语言实验的第一个示例,项目的烧录、执行与汇编相同,这里我们简要分析一下我们的项目。首先我们从main 函数开始,它有两个函数,do_system_initial 和led_initial。do_system_initial 函数首先会调用led_initial 函数初始化led,再通过tester_led 函数控制相应LED 的亮与灭。1....

2018-06-27 00:27:12 20885

原创 嵌入式系统实验报告(裸机实验)

1 .实验要求要求实现跑马灯与蜂鸣器的结合。每亮一次灯,蜂鸣器响一次。2 .流程分析2.1 GPIO功能为了实现目标,我们需要将GPIOA端口设为GPIO功能。首先,读入功能选择寄存器GPIOAALTFN0和GPIOAALTFN1,将GPIOAALTFN0的低8位设为0;再将第13 位设为0;最后将GPIOAALTFN1的最后一位设为0。2.2 端口使能之后,在输出使能端GPIOAOUTENB将我...

2018-06-26 04:44:13 2938

原创 高斯消去法SSE并行化实验

高斯消去法原理和伪代码: 高斯消去法(LU分解),是线性代数中的一个算法,可用来求解线性方程组,并可以求出矩阵的秩,以及求出可逆方阵的逆矩阵。高斯消元法的原理是:若用初等行变换将增广矩阵化为 ,则AX = B与CX = D是同解方程组。所以我们可以用初等行变换把增广矩阵转换为行阶梯阵,然后回代求出方程的解。 总结一套流程就是:原线性方程组——> 高斯消元法——> 下三角或上三角形式的线...

2018-04-20 21:09:57 5120 5

原创 ubantu软件界面消失了只有上方菜单栏

碰到一个小问题百度google都无果,无意解决了现在分享给大家前几天用sublime的时候突然界面消失了,左边菜单栏显示这个sublime是开着的啊,双击一下开始不出来,但是可以看到上边也跳出了sublime自己的菜单,然而就是死活没有界面出现。百度出的相关问题全都是什么为啥sublime没菜单呐啥的,完全没用。今天偶然用界面分屏时候想到会不会是不小心按什么快捷键把它隐藏起来了呢。于是打开subl...

2018-03-20 16:09:54 490

原创 As-Rigid-As-Possible Shape Manipulation论文笔记

这篇博客我会结合自己做的presentation对一篇siggraph上一篇古老但十分重要的论文As-Rigid-As-Possible Shape Manipulation做个介绍。有好几篇后来的siggraph上的文献,在视屏防抖《Content-Preserving Warps for 3D Video Stabilization》为三维视频稳定提供内容保护的空间扭曲《Bundled Cam...

2018-03-06 18:44:57 6575 3

原创 MIT JOS LAB3学习笔记

LAB3概述:本次操作系统实验,我们对计算机的操作系统进行了初步的探究,通过完成作业和问题,对lab3部分有了较好的理解。Lab3主要实现能运行被保护的用户模式环境(protected user-mode environment,即process)的内核服务。我们将增加数据结构来记录进程、创建进程、为其装载一个程序镜像。我们还要让JOS 内核能够处理进程产生的系统调用和异常。具体来说:第一部分主要...

2018-02-08 21:38:22 1111

原创 opencv人脸检测实现(使用MFC做可视化)(一)

(本篇主要为原理介绍以及效果和结果的讨论,源代码解析在下一篇)一.实现方法     VS2010可视化程序界面设计:采用MFC     人脸检测部分:采用OpenCV 2.4.91 检测方法     采用基于统计的人脸检测方法——Haar分类器。     Haar分类器=Haar-like特征+AdaBoost + 级联 +积分图     ①Haar-like特征做检测。     ②使用AdaBo...

2018-02-08 01:23:31 1962 1

原创 MIT JOS LAB1&2学习笔记

lab1和2概述:本次操作系统实验,我们对计算机的操作系统进行了初步的探究,通过完成作业和问题,我们对操作系统的启动、内核载入、一些系统函数、堆栈的使用、内存管理有了更加深刻的了解,并且在完成作业的同时,深刻了解了计算机内存的结构以及每一块儿对应的作用。从实践的角度出发,很好的理解了一个操作系统的底层功能的实现。具体来说:在启动计算机的部分中,通过gdb 的单补调试和断点控制,我们

2018-02-05 19:30:53 1265

原创 实现边坍塌的网格简化方法

一、算法介绍关于边塌陷的网格简化方法,SIGGRAPH 有一篇97年的论文Surface Simplification Using Quadric Error Metrics(Michael&&PaulS)对这个问题进行了深入的探讨。作业里的代码就是基于这篇论文来实现的。最为核心的思想就是通过对网格图形上的每一条边通过计算一个cost来维护一个堆,每次迭代都将这个堆中cost最小的边将它移除,

2018-02-04 20:47:01 8446 4

原创 geopy.geocoders解决关于具体地址和经纬度互转的问题

对于经纬度的操作也许也会在我们日常生活中使用到,这里简单的介绍一下如何使用geopy.geocoders这个库来得到对应地点的经纬度以及根据对应的经纬度得到它的地址的小工具。from geopy.geocoders import Nominatimimport reimport time这是代码需要导入的三个python包,对应网上的教程install一下即可geolocator

2018-02-01 21:17:29 4604 1

原创 爬取百度对应词汇页面量

这次要分享的内容十分简单,但也可以算是我们以后写东西可能会经常用到的一个小工具,就是关于如何爬取百度文库对应某个词汇的词条数,也就是拥有的页面量。我们首先来看一下我们直接使用百度看到的情况: 如果我们手动输入“博物馆展览”,点击文库搜索,就能看到最底下有相关文档数量 这时候来看一下最上边的url: 说明了我们的请求是一个get请求,那接下来的爬虫就十分好弄,按照对应的格式把url改成我

2017-12-06 03:46:33 781

原创 HTTP学习与Web服务器编程

这次的主题是查找HTTP协议的相关资料,基于此编写一个简单的Web服务器。 需要完成的几大主要的要求有: 1)编写一个简单的Web服务器; 2)实现的服务器应能与标准的浏览器进行简单的交互; 3)记录浏览器与服务的交互过程; 4)利用HTML语言编写网页浏览器可通过编写的Web服务器正常访问该网页; 5)支持多用户并发访问; 6)扩展编写的简单Web服务器,使浏览器能够浏览Web上存储

2017-11-20 00:00:28 5104 3

原创 八皇后问题详解(四种解法)

如果你去百度百科八皇后这个问题,你会发现人家也是历史上有头有脸的一个问题,最后一句“计算机发明后就有一万种方式解决这个问题”读起来也让程序猿们很快活。闲话少说,开始阐述我的思路:最无脑的解法一定是八个for遍历,浪费了太多的计算资源在各种无用功上面,我们稍微构思一下: 首先如何决定下一个皇后能不能放这里可以有两种思路,第一种是尝试维护一个8*8的二维矩阵,每次找到一个空位放下一个皇后就把对应行列对

2017-11-08 01:38:49 149060 18

原创 使用不可靠的UDP设计可靠的文件传输协议

一、了解UDP协议一些具体细节(可以直接跳到二、三看协议设计部分) UDP协议的工作是将待发送的网络数据流量压缩成数据报的形式,然后由服务器端发送给客户端。但是UDP协议是面向无连接的,它只提供最大努力的服务,也就是说UDP协议不带有在发送端进行数据报分组,在接收端再对收到的报文进行重新 排序和组装的功能。这样一来,当一个数据报从发送端出发后,系统是不对报文进行顺序编号和检查的,在接收端也就无法感

2017-11-05 23:48:44 12387 1

原创 java使用UDP协议进行服务器客户端通信

先唠叨一些基础东西:1、两台计算机间进行通讯需要以下三个条件:IP地址、协议、端口号2、IP地址、端口为实现网络中不同计算机之间的通信,每台计算机都必须有一个唯一的标识---IP地址。而区分一台主机的多个不同应用程序,则是用端口标识,端口号范围为0-65535,其中0-1023位为系统保留。IP地址+端口号组成了所谓的Socket。 3、Socket套接字:网络上具有唯一标识的IP地址和端口组

2017-10-29 15:47:32 6852 2

原创 入门masm32编写简单汇编程序并做具体分析

用masm32编写一个很简单的汇编程序来入门一下masm32,打算使用斐波拉切数列这个简单的小程序来作为例子讲述。

2017-10-19 00:56:27 16093 5

原创 wireshark过滤表达式&wireshark捕获ftp协议分析

记录学习Wireshark的一些问题,主要是:1.过滤表达式2.本机搭建ftp站点3.利用wireshark捕获ftp的协议交互过程并对此进行分析

2017-10-15 20:40:59 47049 2

操作系统 mit jos lab1--4代码

操作系统的lab1到4的所有源码都在这。具体讲解可以看我的博客

2019-01-20

推荐系统源码以及数据以及结果

LFM法实现的user item推荐系统(https://blog.csdn.net/codes_first/article/details/80796151#comments)相关资源

2018-10-24

人脸识别训练集

https://blog.csdn.net/codes_first/article/details/79223524对应的训练集

2018-06-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除