xiaoahahaha-CSDN博客

原创搜狗输入法安装和问题解决

ubuntu下安装方法:1. 去官网下载deb安装包sudo apt-get install fcitx #安装 fcitxsudo dpkg -i xxx.deb2. 源安装方式sudo add-apt-repository ppa:fcitx-team/nightly #添加源sudo apt-get install fcitx sogoupinyin #安装 fcit

2017-04-23 19:12:56 409

原创示例：在约会网站上使用k-近邻算法

1，收集数据：提供文本文件2，准备数据：使用Python解析文本文件3，分析数据：使用Matplotlib画二维扩散图4，训练算法：此步骤不适用于该算法5，测试算法6，使用算法：产生简单的命令行程序，然后输入一些特征数据以判断对方是否为自己喜欢的类型from numpy import *import operator#运算符模块def createDataSet():

2017-04-17 19:57:13 558

原创 k-近邻算法

一，random：random.rand(4,4)#产生4x4的数组randMat=mat(random.rand(4,4))#把数组转换为矩阵ranMat.I#矩阵求逆eye(4)#产生单位矩阵

2017-04-16 17:26:32 218

原创安装Hadoop

运行 start-all.sh如果出现root@xiaoa-ThinkPad-E450c:/opt/hadoop-1.2.1/bin# localhost: Permission denied (publickey,password).可以试试root@xiaoa-ThinkPad-E450c:/opt/hadoop-1.2.1/bin# sudo passwd root输入新的

2017-04-13 21:08:19 214

转载通过抓取淘宝评论为例讲解Python爬取ajax动态生成的数据

import sysimport reimport jsonimport requestsimport requestsurl='https://rate.taobao.com/feedRateList.htm?auctionNumId=538039793643&userNumId=2779992133&currentPageNum=6&pageSize=20&rateType=&

2017-04-05 18:55:51 2329

原创 autodesk 安装

序列码：666-69696969 128f1

2017-03-25 13:11:41 309

转载 Python scrapy 小试

爬的网址（https://www.douban.com/doulist/1264675/）一，建立第一个工程：1.scrapy startproject doubanbook(在命令行输入)2.然后你的目录下就有一个文件夹名为doubanbook目录，按照提示，我们cd进目录，然后按提示输入，这里我们爬虫取名为dbbook，网址就是上面的网址3.在pycharm

2017-03-24 20:49:39 360

转载 python re 模块

python RE模块转自：http://blog.chinaunix.net/uid-17260303-id-2811331.html#coding:utf-8import re#match只是从头匹配字符串，search是匹配字符串的任何位置#group都是从1开始的而不是0re.match("c", "abcdef") # No match F

2017-03-22 19:34:00 233

原创 Python批量下载图片

#!/usr/bin/python# -*- coding: utf-8 -*-import requestsfrom lxml import etreeimport urllib.requestimport osurl = 'http://tieba.baidu.com/p/2166231880'header = {'User-Agent':'Mozilla/5.0 (X11;

2017-03-19 19:05:12 627

xiaoahahaha的博客