自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(39)
  • 收藏
  • 关注

原创 工作周报(20191130-20191206)

本周工作报告本周完成工作如下:1、将之前编写的主观题自动评阅算法流程,利用Django框架实现了网站应用化(该框架结合Pytorch还可以实现神经网络等的应用化),但是前段界面没有搭好,暂时记录一下框架使用流程:https://blog.csdn.net/qq_39591838/article/details/1034304832、学习了pytorch实战视频,并根据视频内容实现其...

2019-12-06 22:55:19 258

原创 Django框架使用及基础配置

1、下载及配置Django框架1、通过官网安装Django(或直接使用git下载:git clone https://github.com/django/django.git)2、在Django下载目录下运行python setup.py install3、配置环境变量:将C:\Python33\Lib\site-packages\django;C:\Python33\Scripts ...

2019-12-06 22:19:58 341

原创 从numpy到pytorch实现神经网络

本文章基于学习B站视频的pytorch讲解(附上视频网址:https://www.bilibili.com/video/av62138405?from=search&seid=16456035230894602976),实现了从numpy手写神经网络到pytorch实现神经网络,编写的神经网络的为两层神经网络:以下每一个代码块都可单独运行1、利用纯numpy实现神经网络,训练数据利...

2019-12-06 22:03:05 507

原创 工作周报(20191123-20191129)

本周工作报告本周完成工作如下:1、进一步编写了主观题自动评阅的内容,实现了算法流程:https://blog.csdn.net/qq_39591838/article/details/1033143472、进一步学习了循环神经网络和pytorch(由于要准备期末考试,没有做细致的笔记.....)下周工作计划emmm,下周也是要准备期末考试的一周,目标就定小一点吧1、完善...

2019-11-29 17:49:14 212

原创 主观题自动评阅实现—week2

  上周写了序列对匹配算法,并通过序列对匹配算法对词语进行相似度匹配,后面肯定还要更换词语的相似度匹配算法,现在先基于之前的工作进一步完成。  然后再明确一下程序的输入输出:程序的输入一个是学生答案,即一段文本,文本中可能包含多个句子。二是标准答案即对应分值,标准答案含有多个句子,分别输入每个句子即对应分值,分值总和加起来为10分。程序的输出即为学生答案的得分了,得分为0-10间的整数。 ...

2019-11-29 17:34:56 4340 6

原创 工作周报(20191116-20191122)

本周工作报告本周完成工作如下:1、初步编写了主观题自动评阅的部分内容:https://blog.csdn.net/qq_39591838/article/details/1032071382、学习了卷积神经网络并做了部分笔记:https://blog.csdn.net/qq_39591838/article/details/1032074383、学习了jieba分词及初步学...

2019-11-22 21:38:55 150

原创 卷积神经网络学习笔记

在学习卷积神经网络的时候粗略记录了点东西,原文地址:https://www.zybuluo.com/hanbingtao/note/485480激活函数:Relu卷积神经网络特征局部连接:每个神经元不再和上一层的所有神经元相连,而只和一小部分神经元相连。这样就减少了很多参数。 权值共享:一组连接可以共享同一个权重,而不是每个连接有一个不同的权重,这样又减少了很多参数。 下采样:...

2019-11-22 21:19:50 301

原创 主观题自动评阅初步实现—week1

通过阅读相关论文,总结实现的大致思路:(论文原文链接:https://www.docin.com/p-1845286785.html)  先设学生给出的答案和标准答案均为两段中文段落,我们的目的是计算出这两个中文段落的相似度,而中文文本一般由段落组成,段落根据标点符号可以划分成句子,句子根据分词可以划分成词汇,由此根据两个句子中词汇的相似度计算出句子的相似度,再根据句子的相似度计算出段落的相似...

2019-11-22 20:57:16 2762

原创 工作周报(20191110-20191115)

本周工作报告本周完成工作如下:1、回顾了上周的感知器及神经网络学习内容,自己动手实现了感知器的python代码:https://blog.csdn.net/qq_39591838/article/details/1030868972、阅读了Chris Piech的部分论文,阅读了解了几篇论文的摘要、介绍及大致内容,并做好相关的记录:https://blog.csdn.net/qq_39...

2019-11-15 23:33:20 89

原创 Chris Piech的部分论文阅读记录

《BlueBook: A Computerized Replacement for Paper Tests in Computer Science》论文内容概括:  为了用计算机代替计算机课程的纸质化考试,BlueBook 允许学生在与普通编程相似的环境中(例如语法突出)编写编码问题,但不为他们提供编译和运行代码的功能,以此无缝的从计算机课程类的纸质化考试过到计算机化编程考试。  Bule...

2019-11-15 22:32:25 217

原创 Python实现感知器

向量操作类为了手动实现上周学习的感知器,同样按照面向对象的思路,先编写一个操作向量的类,实现:1、计算两个向量相乘得到的新向量2、计算一个向量的每个元素和(为了计算输入向量和权重向量的內积,利用1中的新向量将每个元素求和)3、计算一个常数乘以一个向量(为了计算增量向量,利用学习速率*误差值得到的常数,乘以输入向量得到)4、计算两个向量相加(为了更新权重向量,即)from ...

2019-11-15 16:22:53 345

原创 工作周报(20191103-20191109)

本周工作报告本周完成工作如下:1、学习了深度学习中的感知器和线性单元,阅读参考文献和相关代码并做好笔记:https://blog.csdn.net/qq_39591838/article/details/1029906142、学习了神经网络和反向传播算法,笔记如下:https://blog.csdn.net/qq_39591838/article/details/102936482...

2019-11-09 21:02:09 126

原创 深度学习中感知器的学习

本文是对《零基础入门深度学习》的简单归纳和学习总结,原文地址详见:https://www.zybuluo.com/hanbingtao/note/433855感知器概念及构成  感知器就是神经元(可以进行线性分类和线性回归,但不能实现非线性运算)  由两个向量构成及一个偏置值,两个向量分别是输入向量及权值向量:xi和wi,需要的运算操作是∑xi*wi,即计算两个向量的內积,偏置值可以看...

2019-11-09 20:43:31 320

原创 python实现神经网络中的常用函数记录

reduce()函数:该函数会对参数序列(iterable)中的元素通过function函数进行累积,一般用于通过zip函数打包两个向量,然后通过该函数实现计算两个向量的內积,zip函数下面会有记录。reduce(function, iterable[, initializer])function -- 函数,有两个参数 iterable -- 可迭代对象 initializer ...

2019-11-09 19:20:49 413

原创 神经网络和反向传播算法学习

本文是对《零基础入门深度学习》的简单归纳和学习总结,原文地址详见:https://www.zybuluo.com/hanbingtao/note/476663#an1神经网络和反向传播算法  神经元和感知器本质上是一样的,只不过感知器的激活函数是阶跃函数;神经元往往选用sigmoid函数或tanh函数,sigmoid函数图像如下:                  对于一个神经网络...

2019-11-09 18:59:39 487

原创 DIPRE实践技术报告

课题目的与意义  垂直搜索引擎是针对某一特定领域、人群或需求提供的信息检索服务因此垂直搜索引擎的爬虫在 抽取数据时应该具有相当的选择性 。DIPRE(DualIterativePatternRelationExtraction)是 Google创始人之一SergeyBrin针对抽取互联网上特定格式或类型的数据而提出的一种算法,由于垂直搜索引擎具有较强的专业性和针对性,因而DIPRE算法在垂直搜...

2019-11-01 23:44:11 303

原创 工作周报(20191019-20191025)

本周工作报告本周完成工作如下:1、根据DIPRE算法实现(https://blog.csdn.net/qq_39591838/article/details/102628466)这篇文章中的代码进行了改进,改进后的代码相比于原代码的变化及具体流程如下:https://blog.csdn.net/qq_39591838/article/details/1027508582、在数据库中...

2019-10-25 23:16:18 136

原创 DIPRE算法改进后运行结果

1、使用少量真实数据进行测试1、插入网址及种子首先是测试数据,在数据库的webpage表中插入两条当当网书城的网址,并将mark置为0,表示未处理:同时在seeds表中插入两条种子元组(冯唐,无所畏)(李诞,笑场):2、第一次遍历数据库并形成模式并查询模式形成页面然后手动第一次运行代码,可以看到形成了一个模式,并通过这个模式在id为15的数据中找到了一些元组:...

2019-10-25 22:45:05 229

原创 DIPRE算法代码改进后

在看此篇文章前请确保已了解DIPRE算法实现:https://blog.csdn.net/qq_39591838/article/details/1026284661、数据库结构改进后在数据库中有三张表webpage、patterns、seeds:webpage表如下,其中mark字段表示该条数据是否已经被算法处理:patterns表用于存储形成的模式:2、MyS...

2019-10-25 22:28:53 211

原创 工作周报(20191012-20191018)

本周工作报告本周完成工作如下:1、根据论文DIPRE算法内容编写python代码,已跑通测试用例和实际数据,代码流程如下(内容可能较多):https://blog.csdn.net/qq_39591838/article/details/1026284662、根据算法内容对代码做了细节性的改进,详情同见上述链接中的小结部分3、记录了在写代码中遇到的一些问题及其处理方式下周工作计...

2019-10-18 23:23:21 138

原创 第四周代码问题记录

1、python中的正则表达式应用re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。re.match(pattern, string, flags=0) pattern 匹配的正则表达式 string 要匹配的字符串。 flags ...

2019-10-18 22:51:40 64

原创 DIPRE算法实现

1、插入并获取网页数据 为了对已经写好的代码进行测试,我们先使用测试数据来看流程是否通过,假设对于一个网站有以下两个页面,且页面中含有一些内容(将这两个网页存在本地服务器下):URL:http://localhost/DIPRE/BestSeller.htmlURL:http://localhost/DIPRE/TopRated.html 首先我...

2019-10-18 17:16:34 973

原创 工作周报(20191005-20191011)

本周工作报告本周完成工作如下:1、阅读完成原论文剩余部分,并记录相关阅读笔记:https://blog.csdn.net/qq_39591838/article/details/1024893852、查找外网相关文献,阅读并撰写自己对原文和相关文献的理解:https://blog.csdn.net/...

2019-10-11 20:52:54 213

原创 在Docker中安装Ubuntu及Python

安装Ubuntu在docker的hub仓库中,有专门的ubuntu系统。我们直接用使用就可以了,可以先进行搜索:docker search Ubuntu或者直接拉取自己需要的Ubuntu:16.04:docker pull ubuntu:16.04拉取结束后可通过docker iamges命令查看拉取的镜像Docker 允许你在容器内运行应用程序, 使用 docke...

2019-10-10 20:20:40 1067

原创 Windows10家庭或学生版下安装Docker

1、安装hyper-v对于win10家庭版,本身并没有自带hyper-v的需要先安装hyper-v:新建hyper.cmd文件,并插入以下代码: pushd"%~dp0"dir /b %SystemRoot%\servicing\Packages\*Hyper-V*.mum >hyper-v.txtfor/f %%iin('findstr /i . hyper-...

2019-10-10 20:13:33 444

原创 DIPRE论文阅读记录——参考说明

参考说明以下内容为本人在查阅与原论文相关的文献同时加上自我理解后编写的流程及备注:首先原论文中所描述算法的数据来源和格式一直是令我困惑的一件事,我曾一度以为是利用爬虫对网页进行检索,找到书名作者对,但又并不是单个网站,如果利用某度等搜索引擎进行检索又是不可行的,因为搜索引擎的检索结果是对输入内容进行处...

2019-10-10 20:01:30 326 1

原创 DIPRE论文阅读记录——原文记录

原文记录以下内容按照原文进行理解并部分翻译(看不懂或不理解可以参照:https://blog.csdn.net/qq_39591838/article/details/102489459):模式:p为模式,则MD(p)是与D中的p匹配的元素集合,|p|为MD(p)中的元素个数p的覆盖率为:C...

2019-10-10 19:44:52 219

原创 python爬虫入门学习记录

在使用爬虫前确保requests和BeautifulSoup4模块都已经安装好了: pip install requests pip install BeautifulSoup4 BeautifulSoup4使用手册:https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html简单的示列代码...

2019-10-04 21:43:16 97

原创 DIPRE论文阅读记录(1)

论文原文参见:https://github.com/Peiklong/DIPRE.git中论文文献文件夹下的1999-65.pdf,论文名为:Extracting Patterns and Relationsfrom the World Wide Web 论文中所提及的算法称作DIPRE-二次迭代模式扩展 此前先记录查全率RR、查准率PR...

2019-10-04 21:41:16 325

原创 python中的__name__变量

关于__name__,实际上是一个变量,当一个python程序运行的时候:如果一个模块是被引入的,那么__name__在这个模块下的值就是这个模块文件的名字 如果这个模块是主程序,用来执行的,那么__name__在这里的值就是"__main__"进一步解释:如果我创建了两个文件分别是header.py和test.py,header是用来引入的,test用来执行,header.py代码如下:...

2019-10-04 21:30:42 172

原创 python三个基本数据类型:小括号( )、中括号[ ]和花括号{ }

python中的小括号( )、中括号[ ]和花括号{ }的作用:1、[ ]列表:列表是序列的一种,列表元素可以由任意类型的数据构成,不要求各元素具有相同的类型list_sample = ['a',200,'b','c',100]二维列表例子如下:list_sample = [['IBM','Apple','Lenove'],['America','China']]列...

2019-10-04 21:24:01 17241

原创 更改jupyter notebook默认工作路径和默认浏览器

为了更改jupyter notebook默认工作路径,需要修改jupyter的相关配置文件,一般配置文件在C:\Users\用户名\.jupyter路径下的jupyter_notebook_config.py:更改其中的工作路径相关变量值为自己想要的路径即可(其中路径需要加转义符):c.NotebookApp.notebook_dir = 'C:\\Users\\18\\Deskto...

2019-10-04 21:15:43 274

原创 工作周报(20190928-20191004)

本周工作报告:上周的计划由于国庆假期,代码部分已完成,但论文阅读进展不大,所以没有更新论文阅读记录,完成的工作如下:1、按照python参考书内容编写了新闻爬虫,爬取了上海对外经贸大学新闻网的新闻,保存了相关新闻的标题、时间、内容等信息,并可对保存的信息进行进一步查询,同时对python数据结构有了进一步了解,遇到的相关问题附上记录链接。代码见GitHub中,名为代码文件夹下的Craw...

2019-10-04 21:06:20 147

原创 工作周报(20190922~20190927)

本周工作报告:1、本周阅读了原论文的前四页2、查询下载了相关论文文献3、写了阅读论文记录,将不理解的地方和遇到的问题用红色括号标注4、同时初步学习了python爬虫的一些知识,做了相关学习记录。论文阅读记录:https://blog.csdn.net/qq_39591838/article/details/102096581爬虫入门学习记录:https://blog.csd...

2019-09-27 16:34:18 166

原创 DeepDive安装及基础使用(上)

一、deepdive环境搭建及数据库安装1、下载deepdive在用虚拟机尝试未果后,借来了一台Mac电脑,利用桌面右上角的搜索图标,搜索terminal,打开终端,开始下载DeepDive bash <(curl -fsSL git.io/getdeepdive) 下载完成后选择1安装deepdive ### DeepDive installer f...

2019-04-22 19:43:58 5708 1

原创 VMware修改虚拟机密码

安装DeepDive需要Mac系统或者CenterOS系统,因此我准备用之前装过的虚拟机来安装,但是打开虚拟机发现忘记了账号登录密码,因此需要重置密码1、打开虚拟机进入到如下界面后,按e进入初始化脚本编辑界面2、进入编辑界面后修改两处地方,rw_rhgb和追加init=/bin/sh(或直接追加rd.break console=tty0),并按Ctrl+x退出3、退出后进入到系...

2019-04-22 19:34:18 22141 6

原创 Postgresql的基本使用

在安装好postgresql后,利用如下语句启用postgresql brew services start postgres 利用如下语句停止postgresql brew services stop postgres 新建一个数据库用户 createuser myadmin -P 为这个用户新建一个数据库 create...

2019-04-22 19:30:12 184

原创 Linux安装Stanford-CoreNLP

一、首先需要安装java8 brew cask install java 安装成功后用命令”java -version”可查看版本信息二、下载Stanford coreNLP 包1、下载https://stanfordnlp.github.io/CoreNLP/的CoreNLP 3.9.2以及模型jar包,包括英文和中文模型jar包。或如下地址:Stanf...

2019-04-22 19:28:34 2541

原创 JavaWeb入门及Tomcat配置

1.Tomcat的安装及配置:登录https://tomcat.apache.org/download-90.cgi下载,解压后进入相应路径启用startup.batTomcat运行成功:登录http://localhost:8080/则Tomcat运行成功,并有如下文件夹:其中bin为入口文件,conf为配置文件,lib存放jar包,webapps为网站根目录...

2018-04-28 11:49:56 119

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除