- 博客(5)
- 资源 (19)
- 收藏
- 关注
原创 Python开发安装的一些常用模块
========================================================================== 本文主要是博主自己看到的或者了解的,但更大一部分是博主要使用的一些python模块,如有错误,还望大家指正 windos下安装第三方模块时若出错请参考:http://blog.csdn.net/gamer_g...
2015-05-31 00:12:20 10840 3
原创 新浪明星日志推荐系统——爬虫爬取数据(2)
由于之前的改造,现在将爬虫的功能做了一些改变,具体实现的功能是将推荐的日志全部抓取下来,并存放在以文章标题命名的文件中,代码如下: import urllib import os,re import sys from bs4 import BeautifulSoup reload(sys) sys.setdefaultencoding("utf-8") def if_str(str_t...
2015-05-26 08:54:32 3416
原创 新浪明星日志推荐系统——爬虫爬取数据(1)
今天有了一个想法,想自己用Python写一个新浪明星日志推荐系统 那么第一步要完成的工作就是获得新浪明星日志的数据,于是自己写了一个爬虫,实现的功能是爬取新浪明星日志的作者,推荐的文章链接,以及作者日志列表或者首页链接,具体程序如下: # -*- coding: utf-8 -*- """ Created on Wed May 20 13:55:00 2015 @author: Thi...
2015-05-21 07:52:54 4063
原创 python 爬虫爬取腾讯新闻科技类的企鹅智酷系列(1)
废话不多说,直接贴代码,主要采用BeautifulSoup写的 #coding:utf8 from bs4 import BeautifulSoup import urllib2 import urllib import os i = 0 j = 0 list_a = [] def gettext(href): global j,list_a page = urll...
2015-05-19 00:19:18 3842
原创 BeautifulSoup中解决乱码问题
由于初步学习Python爬取网页文本内容,在存储文本时出现乱码问题 我的代码如下: import urllib from bs4 import BeautifulSoup import sys reload(sys) sys.setdefaultencoding('utf-8') fp = file("test.txt","wb+") page=urllib.urlo...
2015-05-18 18:50:54 3162
word2vec.zip
2019-11-13
NLP汉语自然语言处理原理与实战
2018-06-15
gephi-0.9.1-windows.exe
2017-02-14
mysql-connector-java-5.0.4-bin.jar
2017-02-14
commons-el-1.0.jar,jasper-compiler.jar,jasper-runtime.jar
2016-07-28
从疝气病症预测病马的死亡率的测试数据集
2016-04-25
十大算法之线性查找算法
2015-07-29
securboot未完全配置消除补丁
2014-08-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人