- 博客(8)
- 资源 (41)
- 问答 (2)
- 收藏
- 关注
原创 Python-新浪微博爬虫采集数据
接着我们马上需要做的预登陆了。登陆的时候我们需要用到其中的servertime、nonce、pubkey、rsakv字段,使用抓包我们看到链接http://i.sso.sina.com.cn/js/ssologin.js查看,复制到txt文件中,并用NodePad++打开,搜索username的加密方式,如图我看到的是:用户名username经过base64编码后得到值 和 登陆密码的加密方式。
2016-10-30 22:13:09 7994
原创 3h: 中文 前处理4:断句 前处理8:标点清洗 前处理12:停用词清洗
3h: 中文 前处理4:断句 前处理8:标点清洗 前处理12:停用词清洗下面测试过了: 过程步骤是0,1,2,3http://blog.csdn.net/pipisorry/arti
2016-10-30 22:03:15 5140
原创 Python学习19-21
1、函数和文件from sys import argvscript,input_file=argvdef print_all(f): print f.read() def rewind(f): f.seek(0)def print_a_line(line_count,f): print line_count,f.readline() current_file=open(
2016-10-30 21:56:27 519
原创 Hadoop Mahout 推荐系统
Ubuntu:ubuntu基于linux的免费开源桌面PC操作系统,Ubuntu所有系统相关的任务均需使用Sudo指令。Mahout:Mahout是Hadoop家族用于机器学习的一个框架,包括三个主要部分,推荐,聚类,分类。Hadoop:Hadoop是一个由Apache基金会所开发的分布式系统基础架构,用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高
2016-10-30 21:53:58 1709
原创 android 音乐播放器最简单的实现
package com.example.mouse.laymen;import android.app.Activity;import android.media.MediaPlayer;import android.os.Bundle;import android.view.View;import android.widget.Button;import android.widge
2016-10-12 22:28:08 3374
原创 hadoop2.7.3 mahout 0.9 遇到问题
hadoop2.7.3 mahout 0.9 遇到问题:以命令行提交hadoop任务,VMware10虚拟机,ubuntu16.4,单机版hadoop2.7.3,mahout0.9,maven3.3.9 处理数据ratings.csv;
2016-10-01 10:25:44 1053
android笔记
2016-02-11
android—定期动态更新启动页的实现源码
2016-02-10
javaweb连接池配置
2014-07-26
JSON一系列的包
2014-07-26
javaweb 实现的图书管理系统
2014-07-25
这个东西是怎么实现的? 关键字是什么
2016-12-09
单链表存储一元多项式
2015-10-22
TA创建的收藏夹 TA关注的收藏夹
TA关注的人