自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 Debug调试程序入门

一、写在前面的话 很久很久以前,在程序运行遇到问题时,我都是采用在控制台把变量打印出来以定位和分析问题。后来,看到同学帮我调试程序时用了Debug,一下子就找到了我的问题所在。当时的我以一种超级膜拜大神的眼神看着他,看他那么快速的操作着键盘,各种快捷键的按着,电脑的屏幕上各种代码文件跳来跳去,我当时天真地认为我这辈子都学不会这种技能。最近,我正在经历着从以前用Pyhton编程的习惯...

2019-05-19 20:37:52 747

原创 Python 基础入门知识学习总结

     在学校的这几年,一直断断续续地在接触python,从一开始的分词作业到后来的话题发现,主要集中用python处理自然语言处理方面的问题。但是,后来又有一段时间集中精力专攻前端开发方面的程序问题。所以现在感觉自己整个编程体系都很混乱,每个部分都略懂一点,深感基础知识薄弱,故重新通过mooc网的视频教程温习了一遍python 基础入门知识,查漏补缺。本篇为学习Python基础入门知识课程的知...

2019-01-17 11:21:16 1388

原创 响应式布局

响应式布局是指一个网站能够兼容多个终端,通过媒体查询,具体如下:@media(max-width : 800px){ <!-- CSS rules-->}当device的宽度小于或等于800像素时,使用{}内的CSS规则进行页面渲染(1)图片响应式布局  img{     max-width:100%;    display:block;     hei...

2018-08-19 22:06:31 207

原创 前端面试相关知识

浏览器中输入地址,浏览器访问的过程: 粗略一点的过程是:浏览器发送一个http请求给服务器,服务器接收到http请求后,查询数据库是否有满足请求的数据,若数据库有,数据库返回数据给服务器,服务器回复http响应给浏览器。具体的过程是:(1)在浏览器的地址栏输入地址,向服务器发送了一个http请求(2)服务器接受到http请求,服务器(Web server)进行初步处理,使用服务器脚...

2018-08-18 22:04:33 171

原创 vscode如何用浏览器预览html文件

        初次在vscode中想要本地加载html文件,发现没有sublime那个直接在浏览器打开预览的功能,解决方案为,在vs的“扩展”里直接搜索view in browser 的插件就能够解决,安装好后,直接从资源管理器中,右击需要预览的html文件,会出现“view in browser” 命令行,点击就可以在本地浏览器上预览编写的html页面效果了。 ...

2018-08-07 17:26:04 16471

原创 vue.js 初步实践Todolist(1)

一、vue.js 环境配置        (1)npm下载安装       下载安装node.js,vue.js的配置需要依赖npm, 而npm是与NodeJS一起安装的包管理工具。安装成功后,在cmd中输入命令行“npm -v” 检验是否安装成功,如下图所示:         因为国内使用npm 下载包速度比较慢,所以常用淘宝镜像,cnpm 代替npm,具体操作如下:  ...

2018-07-17 22:00:06 382

原创 Vue.js missing space before function parenthness

刚入门vue.js ,开始把环境搭建好后,看慕课网上的入门视频教程,根据实例操作熟悉vue.js框架,之前一直运行正常,直到再次通过npm打开后,就报了一系列错误,其中有一条为:missing space before function parenthness,百度原因是因为在配置vue时,设置了eslint,需要规范化js代码。 报错的代码如下:addNew:function(){ ...

2018-07-17 15:35:20 3543

原创 百度前端技术学院学习记录(1)

HTML 提示:使用小写标签HTML 标签对大小写不敏感:<P> 等同于 <p>。许多网站都使用大写的 HTML 标签。W3School 使用的是小写标签,因为万维网联盟(W3C)在 HTML 4 中推荐使用小写,而在未来 (X)HTML 版本中强制使用小写。HTML 提示:使用小写属性属性和属性值对大小写不敏感。不过,万维网联盟在其 HTML 4 推荐标准中推荐小写的属性...

2018-07-10 11:14:51 198

原创 CSS页面布局 (类似微博页面)

task1腾讯微博 body{ background-color:rgb(39, 40, 34); } /*设置主页面格式大小和居中*/ .main{ width: 600px; margin: auto; background-color:rgb(255, 255,255);

2018-07-10 11:13:09 3028

原创 python 解析 csv文件报错

在处理为微博文本的csv文件读取时报错,报错提示为:原始代码为:报错的意思大概时,utf-8 无法解码,在位置0处有非法字符。在utf-8编码文件中bom在文件头部,占用三个字节,用来标示该文件属于utf-8编码,现在已经有很多软件识别bom头,但是还有些不能识别bom头,所以读取的时候就会出现报错。解决方案:用Notepad++软件把需要读取的文件打开,点击上方工具栏...

2018-06-11 20:21:00 1170

原创 Python TF-IDF 算法 提取文本关键词

      TF(Term Frequency)词频,在文章中出现次数最多的词,然而文章中出现次数较多的词并不一定就是关键词,比如常见的对文章本身并没有多大意义的停用词。所以我们需要一个重要性调整系数来衡量一个词是不是常见词。该权重为IDF(Inverse Document Frequency)逆文档频率,它的大小与一个词的常见程度成反比。在我们得到词频(TF)和逆文档频率(IDF)以后,将两个值...

2018-03-09 16:46:34 15461 5

原创 Python 文件读取相关操作函数

一、txt文件读取(1)import codecs codecs 模块是专门用来做编码转换的。在python文件读取过程中,编码问题是经常影响新手读取文件的问题,使用该模块可以自动做编码转换。(2)读取文件def readfile(path): with codecs.open(path,"r",encoding="utf-8") as f: lines = f.readl...

2018-03-08 16:48:03 2642

原创 Git入门学习记录

一直想用git来管理代码,之前在电脑上也安装了git bash,但是总是各种原因拖延,今天终于通过参照git 入门教程,初步接触了git,故根据记录的笔记来梳理一下整个流程。    1、分布式版本控制系统 VS 集中式版本控制系统。    分布式版本控制系统主要以Git为代表,  集中式版本控制系统主要以SVN 为代表。    2、Git 学习记录:    (1)成功安装git 后

2018-01-23 16:39:46 183

原创 python3 GUI开发 (2)

在配置好python3+PyQt5 + eric6 的环境后,QT Designer 软件下载安装,就可以开始尝试python GUI 开发,初步熟悉阶段主要参照网上的博客《用eric6与PyQt5实现python的极速GUI编程》,此外对PyQt5的学习可以参考《PyQt5学习笔记》。       在了解和熟悉整个流程之后就开始尝试自己给之前写的最大逆向匹配分词程序编写一个易操作的可视化界面

2017-08-06 16:37:22 1919

原创 python3 GUI 开发 (1)环境配置

刚接到这个练习任务的时候有点小兴奋,因为不用写html+css前端代码就可以简单的实现一个用户界面操作自己编写的程序,又有点天真,我想当然的以为一个下午就可以把之前写的程序用GUI开发好,只能说图样图森破....倒腾了半天,终于默默的把GUI的环境 python3 + PyQt5 + Eric6 安装好了。写此文以记录自己瞎倒腾的这几个小时,吃一垫长一智。    首先,安装顺序需按照pytho

2017-07-30 19:36:27 2966

原创 python实现机械分词(2)-逆向最大匹配算法

2、逆向最大匹配方法            逆向最大匹配分词是中文分词基本算法之一,因为是机械切分,所以它也有分词速度快的优点,且逆向最大匹配分词比起正向最大匹配分词更符合人们的语言习惯。逆向最大匹配分词需要在已有词典的基础上,从被处理文档的末端开始匹配扫描,每次取最末端的i个字符(分词所确定的阈值i)作为匹配字段,若匹配失败,则去掉匹配字段最前面的一个字,继续匹配。

2017-07-20 10:28:12 5115 1

原创 python 实现机械分词(1)-正向最大匹配算法

词语是自然语言处理中重要的知识载体和基本操作单元, 但是中文里词与词之间没有很明显的标记,它们都是连续的字符串,所以文本处理的第一步是怎样进行中文分词。分词是添加合适的显性的词语边界标志使得所形成的词串反映句子的本意的过程。分词主要有基于字符串匹配的方法、基于规则的方法和基于统计的方法,本文主要通过python实现基于字符串匹配的方法也称为机械分词中的两类方法:正向最大匹配算法和逆向最大匹配算法,

2017-07-20 09:43:13 12778 6

原创 Windows 下 anaconda 安装第三方包

anaconda 集成了很多科学计算中所需要的包,如numpy,scipy等等,具体查看anaconda中已经预先安装配置好的包有哪些,可以通过cmd命令,输入conda list 查看,如下图所示:        但是,因为实际需求,我们会需要导入列表中没有的第三方包,如gemsim,在anaconda中,我们可以参考以下步骤安装所需要的第三方包:        1、启动anac

2017-04-28 14:04:10 12627

原创 解决Windows 下 anaconda python2 与 python3 共存问题

对于python刚入门的人都会遇到一个选择问题:选择python2 还是python3,众所周知,python与其它编程语言不一样即新版本与旧版本是不兼容的,最明显的区别就是语法上都存在差异。刚开始入门的时候因为暂时问题需求不是很多,而且因为据说1.支持python2的包比较多 ;2.现有的很多python入门教程都是基于python2; 3.据说python2比较稳定所以选择了python2。因

2017-04-21 16:42:51 12644

原创 python 预处理XML格式文档经验总结

XML(the Extensible Markup Language)格式为设计特定领域的标记语言提供了一个框架,它有时被用于表示已被标注的文本和词汇资源,不同于HTML标签是预定义的,XML允许我们组建自己的标签,不同于数据库,XML允许创建的数据不必事先指定其结构,它允许有可选、可重复的元素。       Python的标准库xml.etree.ElementTree可以直接调用来处理XM

2017-03-03 20:12:52 1013

原创 python命名实体抽取学习记录(1)

一、命名实体识别基本概念          信息有多种表现形式,一个重要的形式就是结构化数据:即实体和关系的规范和可预测的组织。而现实生活中大多数自然语言句子是非结构化数据,为从文本获得其意义,我们首先需要将自然语言数据转化为结构化数据,然后利用强大的查询工具,如sql。这种从文本获取意义的方法被称为信息提取。    文本信息提取处理的顺序是:首先,使用句子分割器将该文档的原始文本分割成句

2017-02-19 14:35:22 25602 7

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除