新浪明星日志热门推荐(java实现)

现在进行推荐的第三步: 1:利用数据的格式如下: 2:编程语言采用的是Java,源代码如下: package top10; import java.util.*; import java.io.*; public class top {     public static void top(String []one,String []two,String []thre...
阅读(1624) 评论(0)

一、Hadoop2.6.0 单机模式配置

一、在Ubuntu下创建hadoop组和hadoop用户     增加hadoop用户组,同时在该组里增加hadoop用户,后续在涉及到hadoop操作时,我们使用该用户。   1、创建hadoop用户组                      2、创建hadoop用户          sudo adduser -ingroup hadoop hadoop...
阅读(2525) 评论(0)

Python开发安装的一些常用模块

一、BeautifulSoup模块 关于BeautifulSoup模块主要用于规范化网页源代码,利用其一些特定的解析标签函数来分析网页,的得到一些特定的内容,用起来方便简单容易入门,但仍然有一些弊端,比如说对于网页中含有js代码的就不能有效读取与分析,所以常结合正则表达式来进行使用,效率特别好 二、Scrapy + Selenium 模块 这两个模块结合起来使用常用于解析javascript...
阅读(6160) 评论(3)

新浪明星日志推荐系统——爬虫爬取数据(2)

由于之前的改造,现在将爬虫的功能做了一些改变,具体实现的功能是将推荐的日志全部抓取下来,并存放在以文章标题命名的文件中,代码如下: import urllib import os,re import sys from bs4 import BeautifulSoup reload(sys) sys.setdefaultencoding("utf-8") def if_st...
阅读(2017) 评论(0)

新浪明星日志推荐系统——爬虫爬取数据(1)

今天有了一个想法,想自己用Python写一个新浪明星日志推荐系统  那么第一步要完成的工作就是获得新浪明星日志的数据,于是自己写了一个爬虫,实现的功能是爬取新浪明星日志的作者,推荐的文章链接,以及作者日志列表或者首页链接,具体程序如下: # -*- coding: utf-8 -*- """ Created on Wed May 20 13:55:00 2015 @autho...
阅读(2085) 评论(0)

python 爬虫爬取腾讯新闻科技类的企鹅智酷系列(1)

废话不多说,直接贴代码,主要采用BeautifulSoup写的 # -*- coding: utf-8 -*- """ Created on Mon May 18 19:12:06 2015 @author: Administrator """ import urllib import os from bs4 import BeautifulSoup impo...
阅读(2256) 评论(0)

BeautifulSoup中解决乱码问题

由于初步学习Python爬取网页文本内容,在存储文本时出现乱码问题 我的代码如下: import urllib from bs4 import BeautifulSoup import sys reload(sys) sys.setdefaultencoding('utf-8') fp = file("test.txt","wb+") page=urllib.urlop...
阅读(1011) 评论(0)

python安装beautifulsoup

注明:python2.7版本貌似只支持beautifulsoup4.4 正常情况下在dos命令下将beautifulsoup解压在python安装目录下 进入beautifulsoup文件夹  使用python setup.py install安装 我在安装时遇到的问题是使用上述命令抛出错误 出现问题: 由于之前python文件我选择了由spyder打开,所以在此解压安装出...
阅读(1375) 评论(0)

Python爬虫抓取图片,网址从文件中读取

利用python抓取网络图片的步骤: 1.根据给定的网址获取网页源代码 2.利用正则表达式把源代码中的图片地址过滤出来 3.根据过滤出来的图片地址下载网络图片 import urllib import re import os                                                             #urllib,r...
阅读(1455) 评论(1)

ISBN号码(Java)CCF模拟试题

import java.util.Scanner; public class Main {    public static void main(String[] args) {           Scanner ss = new Scanner(System.in);        String str = ss.nextLine();        char str1[]...
阅读(1566) 评论(0)

出现次数最多的数(java),ccf考试模拟题

import java.util.Scanner; public class Main {    public static void main(String[] args) {        Scanner sc = new Scanner(System.in);        int n = sc.nextInt();        int a[] = new int[n];...
阅读(1832) 评论(0)

Ubuntu下终端闪退

执行sudo ls -al / | grep tmp命令,显示结果如下: 继续执行命令:sudo chmod 1777 /temp即可 附:关于tmp的相关说明: http://www.ubuntu-tw.org/modules/newbb/viewtopic.php? viewmode=compact&topic_id=11904&forum=2...
阅读(2063) 评论(0)

Java文件的写入与读出

由于要将爬虫的结果写到文件里,就自己晚上搜了一点资料,看了别人的博客,补充了一点文件的基础知识,现将其整理如下,供大家参考 Java文件的写入和读出有很多种方法我所介绍的主要是Read/Writer,OutputStream/InputStream 一:Read/Writer 由于Java本身可以导入许多包,在这里可以直接调用Java的io,语句是 import java.io; 本人...
阅读(1032) 评论(0)

java读写文件大全

使用Java操作文本文件的方法详解  摘要: 最初java是不支持对文本文件的处理的,为了弥补这个缺憾而引入了Reader和Writer两个类  最初java是不支持对文本文件的处理的,为了弥补这个缺憾而引入了Reader和Writer两个类,这两个类都是抽象类,Writer中 write(char[] ch,int off,int length),flush()和close()方法为抽象方...
阅读(1061) 评论(0)

Java中的匿名内部类总结

匿名内部类也就是没有名字的内部类 正因为没有名字,所以匿名内部类只能使用一次,它通常用来简化代码编写 但使用匿名内部类还有个前提条件:必须继承一个父类或实现一个接口   实例1:不使用匿名内部类来实现抽象方法 abstract class Person {       public abstract void eat();   }      ...
阅读(949) 评论(0)

java方法的重载,重写,super,this,final关键字

一.重载 重载(Overloading): [ruby] view plaincopyprint? (1) 方法重载是让类以统一的方式处理不同类型数据的一种手段。多个同名函数同时存在,具有不同的参数个数/类型。      重载Overloading是一个类中多态性的一种表现。             (2) Java的方法重载,就...
阅读(1262) 评论(0)

Python中try...except...finally的理解

python中无论文件是否正常打开,try...finally...都能保证正常关闭,其用法请点击本博客...
阅读(3356) 评论(1)

typedef int Long_int [3]个人理解

以三个带有...
阅读(1133) 评论(0)

windows 用户的完美“瘦身”攻略

第一步就是开启 Administrator 帐户,先取得最高管理权限,方法: 右键桌面计算机--管理,本地用户和组--用户,右键 Administrator--属性,去除“帐户已禁用”前的勾,注销当前用户登录 Administrator 帐户。 1.禁用休眠,点击开始菜单,所有程序→附件→命令提示符”,右击选择“以管理员身份运行”,进入命令提示符后,手动输入“powercfg -h o...
阅读(1130) 评论(0)

1002答案杭电详解

这道题的陷阱是无法用普通的...
阅读(1313) 评论(0)
242条 共13页首页 上一页 ... 11 12 13 下一页 尾页
    Thinkgamer微博
    微信公众号【码农故事多】
    个人资料
    • 访问:873268次
    • 积分:10380
    • 等级:
    • 排名:第1802名
    • 原创:218篇
    • 转载:22篇
    • 译文:2篇
    • 评论:294条
    个人简介
    姓名:Thinkgamer

    Github:https://github.com/thinkgamer

    主攻:云计算/python/数据分析

    程度:熟悉/熟悉/熟悉

    微信:gyt13342445911

    Email:thinkgamer@163.com

    工作状态:在职ing

    心灵鸡汤:只要努力,你就是下一个大牛...

    hadoop/spark/机器学习群:279807394(大神建的群,蹭个管理员)

    欢迎骚扰........
    博客专栏
    最新评论