python
文章平均质量分 51
差点儿90后
把一件事情不急功近利地坚持到底,直到有个结果。并且相信这样一句美好的话:越努力,越幸运!
展开
-
Ubuntu上如何安装gensim?
Ubuntu上如何gensim?gensim支持主题模型方法LDA(潜在狄利克雷分配,Latent Dirichlet Allocation).安装步骤:安装scipy安装gensim1、安装scipy sudo pip install scipy (版本:0.15.1) 2、安装gensim 在http://radimrehurek.com/gensim原创 2015-07-01 15:08:48 · 3082 阅读 · 0 评论 -
python爬虫
无意间发现极客学院里有Python爬虫的课程,一直对此比较感兴趣,今天就学习一点。 1、首先了解基本的正则表达式 密码:hadkfalifexxIxxfasdjifja134xxlovexx23345sdfxxyouxx8dfse 解密:I love you 解密方法:找规律 xx需要的内容xx常用符号:点号,星号,问号与括号 常用方法:findall,search,sub 常用技转载 2015-08-13 19:18:39 · 2179 阅读 · 0 评论 -
Python爬虫1
正则表达式的各种用法#-*-coding:utf8-*-#导入re库文件import re# from re import findall,search,Ssecret_code = 'hadkfalifexxIxxfasdjifja134xxlovexx23345sdfxxyouxx8dfse'#.的使用举例# a = 'xy123'# b = re.findall('x...',a)#转载 2015-08-13 19:24:42 · 615 阅读 · 0 评论 -
python爬虫2
**正则表达式的应用举例 使用findall与search从大量文本中匹配感兴趣的内容 使用sub实现换页功能** 正则表达式的应用举例 — 匹配多段内容 灵活使用findall与search 先抓大再抓小 正则表达式的应用举例 — 实现翻页 实验网址:http://www.jikexueyuan.com/course/android/?pageNum=2 核心代码转载 2015-08-13 19:28:36 · 538 阅读 · 0 评论 -
Python爬虫3
实战——制作文本爬虫 目标网站:http://www.jikexueyuan.com/ 目标内容:课程图片 实现原理: 1.保存网页源代码 2.Python读文件加载源代码 3.正则表达式提取图片网址 4.下载图片#-*-coding:utf8-*-import reimport requests#读取源代码文件f = open('source.txt','r')html =转载 2015-08-13 19:32:50 · 519 阅读 · 0 评论 -
py4j——用python访问java遇到的问题解决
简单来说就是先装上py4j的包,然后在Python环境中去执行官网py4j的demo程序,但是遇到了一些问题。ERROR:root:Exception while sending command.Traceback (most recent call last): File "/opt/cloudera/parcels/CDH-5.10.0-1.cdh5.10.0.p0.41/lib/spar原创 2017-08-07 18:16:42 · 23095 阅读 · 4 评论