- 博客(9)
- 收藏
- 关注
原创 搜狗 输入法安装和问题解决
ubuntu下安装方法:1. 去官网下载deb安装包sudo apt-get install fcitx #安装 fcitxsudo dpkg -i xxx.deb2. 源安装方式sudo add-apt-repository ppa:fcitx-team/nightly #添加源sudo apt-get install fcitx sogoupinyin #安装 fcit
2017-04-23 19:12:56 409
原创 示例:在约会网站上使用k-近邻算法
1,收集数据:提供文本文件2,准备数据:使用Python解析文本文件3,分析数据:使用Matplotlib画二维扩散图4,训练算法:此步骤不适用于该算法5,测试算法6,使用算法:产生简单的命令行程序,然后输入一些特征数据以判断对方是否为自己喜欢的类型from numpy import *import operator#运算符模块def createDataSet():
2017-04-17 19:57:13 558
原创 k-近邻算法
一,random:random.rand(4,4)#产生4x4的数组randMat=mat(random.rand(4,4))#把数组转换为矩阵ranMat.I#矩阵求逆eye(4)#产生单位矩阵
2017-04-16 17:26:32 218
原创 安装Hadoop
运行 start-all.sh如果出现root@xiaoa-ThinkPad-E450c:/opt/hadoop-1.2.1/bin# localhost: Permission denied (publickey,password).可以试试root@xiaoa-ThinkPad-E450c:/opt/hadoop-1.2.1/bin# sudo passwd root输入新的
2017-04-13 21:08:19 214
转载 通过抓取淘宝评论为例讲解Python爬取ajax动态生成的数据
import sysimport reimport jsonimport requestsimport requestsurl='https://rate.taobao.com/feedRateList.htm?auctionNumId=538039793643&userNumId=2779992133¤tPageNum=6&pageSize=20&rateType=&
2017-04-05 18:55:51 2329
转载 Python scrapy 小试
爬的网址(https://www.douban.com/doulist/1264675/)一,建立第一个工程:1.scrapy startproject doubanbook(在命令行输入)2.然后你的目录下就有一个文件夹名为doubanbook目录,按照提示,我们cd进目录,然后按提示输入,这里我们爬虫取名为dbbook,网址就是上面的网址3.在pycharm
2017-03-24 20:49:39 360
转载 python re 模块
python RE模块转自:http://blog.chinaunix.net/uid-17260303-id-2811331.html#coding:utf-8import re#match只是从头匹配字符串,search是匹配字符串的任何位置#group都是从1开始的而不是0re.match("c", "abcdef") # No match F
2017-03-22 19:34:00 233
原创 Python批量下载图片
#!/usr/bin/python# -*- coding: utf-8 -*-import requestsfrom lxml import etreeimport urllib.requestimport osurl = 'http://tieba.baidu.com/p/2166231880'header = {'User-Agent':'Mozilla/5.0 (X11;
2017-03-19 19:05:12 627
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人