- 博客(5)
- 资源 (19)
- 收藏
- 关注
原创 Python开发安装的一些常用模块
========================================================================== 本文主要是博主自己看到的或者了解的,但更大一部分是博主要使用的一些python模块,如有错误,还望大家指正 windos下安装第三方模块时若出错请参考:http://blog.csdn.net/gamer_g...
2015-05-31 00:12:20 10937 3
原创 新浪明星日志推荐系统——爬虫爬取数据(2)
由于之前的改造,现在将爬虫的功能做了一些改变,具体实现的功能是将推荐的日志全部抓取下来,并存放在以文章标题命名的文件中,代码如下:import urllibimport os,reimport sysfrom bs4 import BeautifulSoupreload(sys)sys.setdefaultencoding("utf-8")def if_str(str_t...
2015-05-26 08:54:32 3438
原创 新浪明星日志推荐系统——爬虫爬取数据(1)
今天有了一个想法,想自己用Python写一个新浪明星日志推荐系统那么第一步要完成的工作就是获得新浪明星日志的数据,于是自己写了一个爬虫,实现的功能是爬取新浪明星日志的作者,推荐的文章链接,以及作者日志列表或者首页链接,具体程序如下:# -*- coding: utf-8 -*-"""Created on Wed May 20 13:55:00 2015@author: Thi...
2015-05-21 07:52:54 4092
原创 python 爬虫爬取腾讯新闻科技类的企鹅智酷系列(1)
废话不多说,直接贴代码,主要采用BeautifulSoup写的#coding:utf8from bs4 import BeautifulSoupimport urllib2import urllibimport osi = 0j = 0list_a = []def gettext(href): global j,list_a page = urll...
2015-05-19 00:19:18 3863
原创 BeautifulSoup中解决乱码问题
由于初步学习Python爬取网页文本内容,在存储文本时出现乱码问题我的代码如下:import urllibfrom bs4 import BeautifulSoupimport sysreload(sys)sys.setdefaultencoding('utf-8')fp = file("test.txt","wb+")page=urllib.urlo...
2015-05-18 18:50:54 3193
word2vec.zip
2019-11-13
NLP汉语自然语言处理原理与实战
2018-06-15
gephi-0.9.1-windows.exe
2017-02-14
mysql-connector-java-5.0.4-bin.jar
2017-02-14
commons-el-1.0.jar,jasper-compiler.jar,jasper-runtime.jar
2016-07-28
从疝气病症预测病马的死亡率的测试数据集
2016-04-25
十大算法之线性查找算法
2015-07-29
securboot未完全配置消除补丁
2014-08-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人