AFCentry

Java、Python、机器学习、深度学习、数据挖掘、爬虫、数据库!

Linux-centos同时存在Python2-Python3

centos7搭建python3并和python2共存 注意事项: 1、非root帐号加上sudo 2、centos7自带Python 2.7.5是不能卸载的,很多系统级软件依赖这个 安装依赖 # yum -y groupinstall "Development tools&qu...

2017-06-01 16:17:27

阅读数 2974

评论数 0

分词工具介绍比较

在逐渐步入DT(Data Technology)时代的今天,自然语义分析技术越发不可或缺。对于我们每天打交道的中文来说,并没有类似英文空格的边界标志。而理解句子所包含的词语,则是理解汉语语句的第一步。汉语自动分词的任务,通俗地说,就是要由机器在文本中的词与词之间自动加上空格。 一提到自动分词,通...

2017-06-01 09:41:45

阅读数 421

评论数 0

结巴详解

https://github.com/SalutLyndon/hello-world/blob/master/中文自然语言处理基本流 # coding: utf-8 # ###jieba特性介绍 # 支持三种分词模式: # 精确模式,试图...

2017-05-31 22:31:31

阅读数 574

评论数 0

python之nltk基础用法

一、NLTK进行分词 用到的函数: nltk.sent_tokenize(text) #对文本按照句子进行分割 nltk.word_tokenize(sent) #对句子进行分词 二、NLTK进行词性标注 用到的函数: nltk.pos_tag(to...

2017-05-31 12:19:50

阅读数 542

评论数 0

文本挖掘之特征选择_python

机器学习算法的空间、时间复杂度依赖于输入数据的规模,维度规约(Dimensionality reduction)则是一种被用于降低输入数据维数的方法。维度规约可以分为两类: 特征选择(feature selection),从原始的d维空间中,选择为我们提供信息最多的k个维(这k个维属于原始空...

2017-05-31 11:25:10

阅读数 1254

评论数 0

使用python进行数据分析介绍及部分教程

Python是一种面向对象、直译式计算机程序设计语言,由Guido van Rossum于1989年底发明。由于他简单、易学、免费开源、可移植性、可扩展性等特点,Python又被称之为胶水语言。下图为主要程序语言近年来的流行趋势,Python受欢迎程度扶摇直上。 图片来源用Pytho...

2017-05-30 22:25:02

阅读数 6694

评论数 1

python中的网络编程

Python的网络编程基于socket(套接字) 基本概念:socket通常也称作"套接字",用于描述IP地址和端口,是一个通信链的句柄,应用程序通常通过"套接字"向网络发出请求或者应答网络请求。 socket起源于Unix,而Unix/Linux基本哲...

2017-05-25 22:49:50

阅读数 143

评论数 0

python对json的操作

需要工具:python中的json包(ubuntu/windows:sudo pip install json) Json简介:JSON 是 JS 对象的字符串表示法,它使用文本表示一个 JS 对象的信息,本质是一个字符串。 主要方法:json.loads()  json.dumps() (...

2017-05-25 22:49:14

阅读数 428

评论数 0

Python进行数据库操作

Python要对数据库进行操作,首先要进行python-sql连接,在python中进行数据库连接的模块有MySQLdb,pymysql,两种连接方式用法一样。 以pymysql为例进行讲解:   安装方法(linux-ubuntu):sudo pip install pymysql Wi...

2017-05-25 22:48:40

阅读数 136

评论数 0

Python常见的文件操作

在此未进行仔细的介绍,不适用复杂语法: Python处理文本文件常见模式: “r” 只读 “w”只写   模式详细介绍: r:以只读方式打开文本文件,可读取文本文件的所有文件信息【文本内容】. w:以只写的方式打开文本文件,可向文本文件写入信息。如文件存在,则清空该文件进行重新写入,...

2017-05-25 22:47:54

阅读数 182

评论数 0

python中with的用法

在python中,有一些任务,可能事先需要设置,事后做清理工作。对于这种场景,python的with语句提供了一种非常方便的处理方式。一个很好的例子是文件处理,你需要获取一个文件句柄,从文件中读取数据,然后关闭文件句柄,也例如python与数据库的连接使用,需要先创建python与数据库的连接,使...

2017-05-25 22:47:16

阅读数 160

评论数 0

python-pip操作基本指令介绍

Pip指令介绍: 通过pip查看某个库的信息:pip show tensorflow 查看已经安装的python库:pip list Pip搜索软件包:pip search tensorflow Pip升级软件:pip install --upgrade 包名 Pip安装:pip ...

2017-05-25 22:45:24

阅读数 404

评论数 0

python的11个冷门库

现在,越来越多的数据科学家开始使用Python,虽然他们从 pandas, scikit-learn, numpy中获得了不少好处,但我仍想向他们介绍一些年长且非常实用的Python库。在本文中,我将列一些不太知名的库,即使你是经验丰富的Python的开发者,也值得过来一看。 ...

2017-05-24 15:17:20

阅读数 335

评论数 0

python文本相似度之距离计算详细介绍

编辑距离 编辑距离(Edit Distance),又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个串的相似度越大。   Leven...

2017-05-24 14:45:33

阅读数 2461

评论数 1

词向量和语言模型

将词用“词向量”的方式表示可谓是将 Deep Learning 算法引入 NLP 领域的一个核心技术。大多数宣称用了 Deep Learning 的论文,其中往往也用了词向量。 本文目录: 0. 词向量是什么 1. 词向量的来历 2. 词向量的训练   2.0 语言模型简介 ...

2017-05-24 14:13:26

阅读数 330

评论数 0

python总结

python总结 一、文件 1、打开 fp = open('/etc/motd') # 以读方式打开 fp = open('test', 'w') # 以写方式打开 fp = open('data', 'r+') # 以读写方式打开 fp = open(r'c:\io.sys', ...

2017-04-05 20:40:26

阅读数 859

评论数 0

机器学习之入门篇(了解机器学习)

初步了解机器学习著名算法 机器学习与人工智能变得越来越热。大数据原本在工业界中就已经炙手可热,而基于大数据的机器学习则更加流行,因为其通过对数据的计算,可以实现数据预测、为公司提供决策依据。跟我们生活息息相关的最常见机器学习算法包括电影推荐算法、图书推荐算法。这些算法都是基于你的电影观看记录...

2017-04-05 20:14:17

阅读数 219

评论数 0

如何夯实你的深度学习知识基础?

Deep Learning Book中文第一章 深度学习概述 Deep Learning Book中文第二章 线性代数 Deep Learning Book 中文第三章 概率与信息论 Deep Learning Book 中文第四章 数值计算 ...

2017-04-05 17:54:34

阅读数 425

评论数 0

Cuda安装小记

linux 桌面安装 https://aws.amazon.com/cn/premiumsupport/knowledge-center/connect-to-linux-desktop-from-windows/ 教训:  cuda离线run文件运行错误: ...

2017-04-05 17:50:36

阅读数 565

评论数 0

Python从入门到精通

由于需要本人近期将会就Python从入门到精通持续书写博文,欢迎大家观看博文学习!

2016-11-25 15:30:18

阅读数 331

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭