新浪明星日志推荐系统——爬虫爬取数据(1)

今天有了一个想法,想自己用Python写一个新浪明星日志推荐系统  那么第一步要完成的工作就是获得新浪明星日志的数据,于是自己写了一个爬虫,实现的功能是爬取新浪明星日志的作者,推荐的文章链接,以及作者日志列表或者首页链接,具体程序如下: # -*- coding: utf-8 -*- """ Created on Wed May 20 13:55:00 2015 @autho...
阅读(1947) 评论(0)

python 爬虫爬取腾讯新闻科技类的企鹅智酷系列(1)

废话不多说,直接贴代码,主要采用BeautifulSoup写的 # -*- coding: utf-8 -*- """ Created on Mon May 18 19:12:06 2015 @author: Administrator """ import urllib import os from bs4 import BeautifulSoup impo...
阅读(2151) 评论(0)

BeautifulSoup中解决乱码问题

由于初步学习Python爬取网页文本内容,在存储文本时出现乱码问题 我的代码如下: import urllib from bs4 import BeautifulSoup import sys reload(sys) sys.setdefaultencoding('utf-8') fp = file("test.txt","wb+") page=urllib.urlop...
阅读(949) 评论(0)

python安装beautifulsoup

注明:python2.7版本貌似只支持beautifulsoup4.4 正常情况下在dos命令下将beautifulsoup解压在python安装目录下 进入beautifulsoup文件夹  使用python setup.py install安装 我在安装时遇到的问题是使用上述命令抛出错误 出现问题: 由于之前python文件我选择了由spyder打开,所以在此解压安装出...
阅读(1269) 评论(0)

Python爬虫抓取图片,网址从文件中读取

利用python抓取网络图片的步骤: 1.根据给定的网址获取网页源代码 2.利用正则表达式把源代码中的图片地址过滤出来 3.根据过滤出来的图片地址下载网络图片 import urllib import re import os                                                             #urllib,r...
阅读(1376) 评论(1)

ISBN号码(Java)CCF模拟试题

import java.util.Scanner; public class Main {    public static void main(String[] args) {           Scanner ss = new Scanner(System.in);        String str = ss.nextLine();        char str1[]...
阅读(1431) 评论(0)

出现次数最多的数(java),ccf考试模拟题

import java.util.Scanner; public class Main {    public static void main(String[] args) {        Scanner sc = new Scanner(System.in);        int n = sc.nextInt();        int a[] = new int[n];...
阅读(1713) 评论(0)

Ubuntu下终端闪退

执行sudo ls -al / | grep tmp命令,显示结果如下: 继续执行命令:sudo chmod 1777 /temp即可 附:关于tmp的相关说明: http://www.ubuntu-tw.org/modules/newbb/viewtopic.php? viewmode=compact&topic_id=11904&forum=2...
阅读(1919) 评论(0)

Java文件的写入与读出

由于要将爬虫的结果写到文件里,就自己晚上搜了一点资料,看了别人的博客,补充了一点文件的基础知识,现将其整理如下,供大家参考 Java文件的写入和读出有很多种方法我所介绍的主要是Read/Writer,OutputStream/InputStream 一:Read/Writer 由于Java本身可以导入许多包,在这里可以直接调用Java的io,语句是 import java.io; 本人...
阅读(973) 评论(0)

java读写文件大全

使用Java操作文本文件的方法详解  摘要: 最初java是不支持对文本文件的处理的,为了弥补这个缺憾而引入了Reader和Writer两个类  最初java是不支持对文本文件的处理的,为了弥补这个缺憾而引入了Reader和Writer两个类,这两个类都是抽象类,Writer中 write(char[] ch,int off,int length),flush()和close()方法为抽象方...
阅读(1007) 评论(0)

Java中的匿名内部类总结

匿名内部类也就是没有名字的内部类 正因为没有名字,所以匿名内部类只能使用一次,它通常用来简化代码编写 但使用匿名内部类还有个前提条件:必须继承一个父类或实现一个接口   实例1:不使用匿名内部类来实现抽象方法 abstract class Person {       public abstract void eat();   }      ...
阅读(908) 评论(0)

java方法的重载,重写,super,this,final关键字

一.重载 重载(Overloading): [ruby] view plaincopyprint? (1) 方法重载是让类以统一的方式处理不同类型数据的一种手段。多个同名函数同时存在,具有不同的参数个数/类型。      重载Overloading是一个类中多态性的一种表现。             (2) Java的方法重载,就...
阅读(1150) 评论(0)

Python中try...except...finally的理解

python中无论文件是否正常打开,try...finally...都能保证正常关闭,其用法请点击本博客...
阅读(2830) 评论(1)

typedef int Long_int [3]个人理解

以三个带有...
阅读(1070) 评论(0)

windows 用户的完美“瘦身”攻略

第一步就是开启 Administrator 帐户,先取得最高管理权限,方法: 右键桌面计算机--管理,本地用户和组--用户,右键 Administrator--属性,去除“帐户已禁用”前的勾,注销当前用户登录 Administrator 帐户。 1.禁用休眠,点击开始菜单,所有程序→附件→命令提示符”,右击选择“以管理员身份运行”,进入命令提示符后,手动输入“powercfg -h o...
阅读(1071) 评论(0)

1002答案杭电详解

这道题的陷阱是无法用普通的...
阅读(1222) 评论(0)

win8/win8.1完美解决系统安装VC6.0安装问题

win8/win8.1完美安装VC6.0...
阅读(2220) 评论(1)

ACM书籍推荐

acm算法书籍收藏推荐  我常感叹到,学计算机的人是幸福的,因为在这个领域中有如此多的通俗易懂(相对来说)的经典好书,你需要做的只是坚持把它们一本一本读下去而已。学力学就没有这样的好事了(抱怨一下),除了论文就是论文,满篇公式,晦涩坚深,真不是给人看的(虽然我也 没看过几篇)。在这里列出一些我看过或者准备看的算法书籍,以供参考。   1. CLRS 算法导论  算法百科全书,只做了前面十几...
阅读(1222) 评论(0)
238条 共12页首页 上一页 ... 11 12
    Thinkgamer微博
    个人微信,一起交流!

     扫一扫,关注我




    个人资料
    • 访问:758175次
    • 积分:9476
    • 等级:
    • 排名:第1976名
    • 原创:212篇
    • 转载:22篇
    • 译文:2篇
    • 评论:273条
    个人简介
    姓名:Thinkgamer

    Github:https://github.com/thinkgamer

    主攻:云计算/python/数据分析

    程度:熟悉/熟悉/熟悉

    微信:gyt13342445911

    Email:thinkgamer@163.com

    工作状态:在职ing

    心灵鸡汤:只要努力,你就是下一个大牛...

    hadoop/spark/机器学习群:279807394(大神建的群,蹭个管理员)

    欢迎骚扰........
    博客专栏
    最新评论