- 博客(9)
- 收藏
- 关注
原创 搜狗 输入法安装和问题解决
ubuntu下安装方法: 1. 去官网下载deb安装包 sudo apt-get install fcitx #安装 fcitx sudo dpkg -i xxx.deb 2. 源安装方式 sudo add-apt-repository ppa:fcitx-team/nightly #添加源 sudo apt-get install fcitx sogoupinyin #安装 fcit
2017-04-23 19:12:56 359
原创 示例:在约会网站上使用k-近邻算法
1,收集数据:提供文本文件 2,准备数据:使用Python解析文本文件 3,分析数据:使用Matplotlib画二维扩散图 4,训练算法:此步骤不适用于该算法 5,测试算法 6,使用算法:产生简单的命令行程序,然后输入一些特征数据以判断对方是否为自己喜欢的类型 from numpy import * import operator#运算符模块 def createDataSet():
2017-04-17 19:57:13 542
原创 k-近邻算法
一,random: random.rand(4,4)#产生4x4的数组 randMat=mat(random.rand(4,4))#把数组转换为矩阵 ranMat.I#矩阵求逆 eye(4)#产生单位矩阵
2017-04-16 17:26:32 202
原创 安装Hadoop
运行 start-all.sh 如果出现root@xiaoa-ThinkPad-E450c:/opt/hadoop-1.2.1/bin# localhost: Permission denied (publickey,password). 可以试试root@xiaoa-ThinkPad-E450c:/opt/hadoop-1.2.1/bin# sudo passwd root 输入新的
2017-04-13 21:08:19 199
转载 通过抓取淘宝评论为例讲解Python爬取ajax动态生成的数据
import sys import re import json import requests import requests url='https://rate.taobao.com/feedRateList.htm?auctionNumId=538039793643&userNumId=2779992133¤tPageNum=6&pageSize=20&rateType=&
2017-04-05 18:55:51 2303
转载 Python scrapy 小试
爬的网址(https://www.douban.com/doulist/1264675/) 一,建立第一个工程: 1.scrapy startproject doubanbook(在命令行输入) 2.然后你的目录下就有一个文件夹名为doubanbook目录,按照提示,我们cd进目录,然后按提示输入,这里我们爬虫取名为dbbook,网址就是上面的网址 3.在pycharm
2017-03-24 20:49:39 337
转载 python re 模块
python RE模块 转自: http://blog.chinaunix.net/uid-17260303-id-2811331.html #coding:utf-8 import re #match只是从头匹配字符串,search是匹配字符串的任何位置 #group都是从1开始的而不是0 re.match("c", "abcdef") # No match F
2017-03-22 19:34:00 215
原创 Python批量下载图片
#!/usr/bin/python # -*- coding: utf-8 -*- import requests from lxml import etree import urllib.request import os url = 'http://tieba.baidu.com/p/2166231880' header = {'User-Agent':'Mozilla/5.0 (X11;
2017-03-19 19:05:12 609
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人