自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 资源 (1)
  • 收藏
  • 关注

转载 CPU与GPU的设计区别

目前GPU盛行,相信大家也是耳熟不能详,让你说一下CPU和GPU之间的区别原理可能会有点蒙圈。作为计算机的学习者,我也是很惭愧啊,只是大概了解,却一直未去认真探究原理对比。目前在华为实习,经常会用到GPU,所以这里进行了较深入的研究。首先需要解释CPU和GPU这两个缩写分别代表什么。CPU即中央处理器,GPU即图形处理器。其次,要解释两者的区别,要先明白两者的相同之处:两者都有总线和外界联系...

2019-07-09 15:59:03 1140

原创 爬取链家数据3

1、直接上代码: #coding:utf-8import sysreload(sys)sys.setdefaultencoding("utf-8")import pandas as pdimport urllib2import urllibimport timeimport refrom bs4 import BeautifulSouptotalPrice=[]hou...

2018-09-21 07:42:42 1832 2

原创 爬取链家数据2

#coding:utf-8import sysreload(sys)sys.setdefaultencoding("utf-8") #设定编码要放在最上面。之前放在引用库的最下面,然后加到pandas的DataFrame老是出现中文字符为问号的乱码import pandas as pdimport urllib2import urllibimport timeimport re...

2018-09-21 07:40:47 589

原创 爬取链家数据(城市、价格、时间)1

1、提取链家信息(城市、价格、时间)'''测试通过'''import requestsfrom bs4 import BeautifulSoupfrom datetime import datetimeimport iodef get_city_list(): city_list = {} city_from_url = 'https://m.lianjia.co...

2018-09-21 07:38:12 1392 1

原创 BeautifulSoup基本用法总结

BeautifulSoup是Python的一个库,最主要的功能就是从网页爬取我们需要的数据。BeautifulSoup将html解析为对象进行处理,全部页面转变为字典或者数组,相对于正则表达式的方式,可以大大简化处理过程。0x01 安装建议安装BeautifulSoup 4版本 利用pip进行安装:pip install beautifulsoup4 BeautifulSoup...

2018-09-20 20:11:58 469

原创 Python让你的数据生成可视化图形

今天就用 pyecharts 库来画图。安装:最简单快速的命令安装方法:pip install pyecharts柱形图柱形图简明、醒目,是一种常用的统计图形。以下生成的图都可以点击 html 文件打开,点击图形右边下载按钮可以下载到本地。#coding:utf-8from pyecharts import Barbar = Bar("成绩柱形图", "副标题")...

2018-09-20 13:34:35 6911 1

原创 获得文本语料和词汇资源 2

import nltkfrom nltk.corpus import *'''1、古腾堡语料库'''gutenberg.fileids() #所有古腾堡语料库中的文本emma = nltk.corpus.gutenberg.words('austen-emma.txt')#num_chars 变量计数了空白字符#row()对文件的内容不进行任何语言处理#sents()...

2018-09-19 19:04:42 324

原创 NLTK实例操作1.2

直接上代码:1、实例测试1# -*- coding: UTF-8 -*-# !/usr/python/bin# Filename:NltkTest42'''一些关于文本的统计信息的测试'''from __future__ import divisionimport nltkfrom nltk.book import *import timeimport datetime...

2018-09-19 18:24:22 601

原创 NLTK实例操作 1.1

#相关安装指令安装python2.7/python3.6pip install Numpypip install MatPlotLibpip install NLTKpip install NetworkXpython -m nltk.downloader all安装Prover9安装MSVCP71.DLLnltk指令代码import nltk ...

2018-09-18 22:31:40 832

原创 NLTK-- 相关软件安装以及操作 1

第一章 语言处理与 Python一 安装NLTK环境1.1 windows 7 32的安装#也可以在CSDN里搜索下载,我为了怕以后找不到了,都有上传过1. 安装Python2.7(稳定版本,http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy);2. 安装NumPy:(http://www.lfd.uci.edu/~gohlke/p...

2018-09-18 16:18:46 484 1

转载 十、半个小时搞定词性标注与关键词提取

想要做到和人聊天,首先得先读懂对方在说什么,所以问句解析是整个聊天过程的第一步,问句解析是一个涉及知识非常全面的过程,几乎涵盖了自然语言处理的全部,本节让我们尝试一下如何分析一个问句请尊重原创,转载请注明来源网站www.shareditor.com以及原始链接地址问句解析的过程一般问句解析需要进行分词、词性标注、命名实体识别、关键词提取、句法分析以及查询问句分类等。这些事情我们从头开始...

2018-09-14 10:41:19 1346

转载 九、聊天机器人应该怎么做

聊天机器人到底该怎么做呢?我日思夜想,于是乎我做了一个梦,梦里面我完成了我的聊天机器人,它叫chatbot,经过我的一番盘问,它向我叙述了它的诞生记请尊重原创,转载请注明来源网站www.shareditor.com以及原始链接地址聊天机器人是可行的我:chatbot,你好!chatbot:你也好!我:聊天机器人可行吗?chatbot:你不要怀疑这是天方夜谭,我不就在这里吗?...

2018-09-14 10:26:58 187

转载 八、重温自然语言处理

别误会,前面几节不是逗你玩,我总结了,计算机领域的知识得倒着学,不管三七二十一先用起来,然后再系统地学习,这不,前几节先给你们展示了几个常见知识和工具,从这一节开始步入主题,自然语言处理与问答系统请尊重原创,转载请注明来源网站www.shareditor.com以及原始链接地址自然语言处理怎么学?先学会倒着学,倒回去看上面那句话:不管三七二十一先用起来,然后再系统地学习nltk是最...

2018-09-14 10:26:17 138

转载 七、文法分析还是基于特征好啊

语法分析固然重要,但要想覆盖语言的全部,需要进一步扩展到文法分析,文法分析可以基于规则,但是工作量难以想象,基于特征的文法分析不但可穷举,而且可以方便用计算机存储和计算,本节简单做一个介绍,更深层次的内容还需要继续关注后面的系列文章请尊重原创,转载请注明来源网站www.shareditor.com以及原始链接地址语法和文法还记得上一节中的这个吗?  (S (NP...

2018-09-14 07:55:32 239

转载 六、教你怎么从一句话里提取出十句话的信息

按照之前理解的内容,对一句话做处理,最多是切成一个一个的词,再标注上词性,仅此而已,然而事实并非如此,一句话还可以做更多的文章,我们本节见分晓请尊重原创,转载请注明来源网站www.shareditor.com以及原始链接地址什么?还能结构化?任何语言的每一句话之所以称为“话”,是因为它有一定的句子结构,除了一个个独立的词之外,他们之间还存在着某种关系。如果任何一句话可以由任何词构成,可...

2018-09-14 07:54:57 1219

转载 五、自然语言处理中的文本分类

文本分类是机器学习在自然语言处理中的最常用也是最基础的应用,机器学习相关内容可以直接看我的有关scikit-learn相关教程,本节直接涉及nltk中的机器学习相关内容请尊重原创,转载请注明来源网站www.shareditor.com以及原始链接地址先来一段前戏机器学习的过程是训练模型和使用模型的过程,训练就是基于已知数据做统计学习,使用就是用统计学习好的模型来计算未知的数据。机器...

2018-09-14 07:54:05 2152

转载 四、何须动手?完全自动化对语料做词性标注

全人工对语料做词性标注就像蚂蚁一样忙忙碌碌,是非常耗费声明的,如果有一个机器能够完全自动化地,给它一篇语料,它迅速给你一片标注,这样才甚好,本节就来讨论一下怎么样能无需动手对语料做自动化的词性标注请尊重原创,转载请注明来源网站www.shareditor.com以及原始链接地址先插入个tips:英文词干提取器>>> import nltk>>&gt...

2018-09-14 07:53:20 378

转载 三、语料与词汇资源

当代自然语言处理都是基于统计的,统计自然需要很多样本,因此语料和词汇资源是必不可少的,本节介绍语料和词汇资源的重要性和获取方式请尊重原创,转载请注明来源网站www.shareditor.com以及原始链接地址NLTK语料库NLTK包含多种语料库,举一个例子:Gutenberg语料库,执行:nltk.corpus.gutenberg.fileids()返回Gutenberg语料...

2018-09-13 14:02:04 586

转载 二、自然语言处理工具包NLTK库

NLTK是一个比较优秀的自然语言处理工具包,是聊天机器人需要的比较重要的一个工具,本节将介绍它的安装和基本使用。请尊重原创,转载请注明来源网站www.shareditor.com以及原始链接地址NLTK库安装pip install nltk执行python并下载书籍:  [root@centos #] python Python 2.7.11 (defau...

2018-09-13 08:41:33 365

转载 一、涉及知识

人工智能一直以来是人类的梦想,造一台可以为你做一切事情并且有情感的机器人,像哆啦A梦一样,现在这已经不是一个梦了:iPhone里会说话的siri、会下棋的阿法狗、小度机器人、大白......,他们都能够具有智能,和人类交互,帮人类解决问题,这听起来非常神奇,实际上我们自己也可以做一个这样的机器人,从今天开始分享我将我学习和制作的过程智能机器人可以做到的事情可以很复杂:文字、语音、视频识别与合成...

2018-09-13 08:35:22 176

转载 三、K-Means聚类算法原理

K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体方法。包括初始化优化K-Means++, 距离计算优化elkan K-Means算法和大数据情况下的优化Mini Batch K-Means算法。1. K-Means原理初探    K-Mea...

2018-07-17 22:31:24 467

转载 二、EM算法原理总结

EM算法也称期望最大化(Expectation-Maximum,简称EM)算法,它是一个基础算法,是很多机器学习领域算法的基础,比如隐式马尔科夫算法(HMM), LDA主题模型的变分推断等等。本文就对EM算法的原理做一个总结。1. EM算法要解决的问题    我们经常会从样本观察数据中,找出样本的模型参数。 最常用的方法就是极大化模型分布的对数似然函数。    但是在一些情况下,我们得...

2018-07-17 20:58:38 465

转载 一、隐马尔科夫模型HMM

隐马尔科夫模型HMM(一)HMM模型基础隐马尔科夫模型(Hidden Markov Model,以下简称HMM)是比较经典的机器学习模型了,它在语言识别,自然语言处理,模式识别等领域得到广泛的应用。当然,随着目前深度学习的崛起,尤其是RNN,LSTM等神经网络序列模型的火热,HMM的地位有所下降。但是作为一个经典的模型,学习HMM的模型和对应算法,对我们解决问题建模的能力提高以及算法思路的拓展...

2018-07-17 20:23:14 987 1

原创 自然语言处理入门——中文分词原理及分词工具介绍

本文首先介绍下中文分词的基本原理,然后介绍下国内比较流行的中文分词工具,如jieba、SnowNLP、THULAC、NLPIR,上述分词工具都已经在github上开源,后续也会附上github链接,以供参考。1.中文分词原理介绍1.1 中文分词概述中文分词(Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的...

2018-07-17 10:52:08 894

转载 三、新版MySQL修改密码的四种方法

1. 新版MySQL修改密码的四种方法:(1) 直接设置法:# test为用户名,password后面是新密码,回车后输入旧密码即可[root@pavilion 15:09 hp]# mysqadmin -u test -p password Csdn123456.1 2 3(2) 利用SQL语句:# 登录mysql,执行如下sql语句,括号内为新密码mysql...

2018-07-17 10:28:34 70002 5

转载 二、SQLyog连接数据库报错plugin caching_sha2_password could not be loaded

SQLyog连接数据库报错plugin caching_sha2_password could not be loaded2018年06月01日 16:08:09阅读数:847下载新版的 mysql 8.0.11 安装。为了方便安装查看,我下载了sqlyog 工具 连接 mysql配置新连接报错:错误号码 2058,分析是 mysql 密码加密方法变了。解决方法:win...

2018-07-15 13:53:10 17296 12

转载 一、WINDOWS 安装MYSQL及配置环境

mysql安装过程及注意事项: 1.1. 下载:我下载的是64位系统的zip包:下载地址:https://dev.mysql.com/downloads/mysql/下载zip的包: 下载后解压:D:\软件安装包\mysql-5.7.20-winx641.2. 配置环境变量:变量名:MYSQL_HOME变量值:E:\mysql-5.7.20-winx64pa...

2018-07-15 12:38:49 561

python glob模块学习

python模块学习

2017-06-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除