- 博客(4)
- 资源 (4)
- 收藏
- 关注
原创 python多进程爬取上海房价并画出热力图分析
一、分析目的1.探索上海市的房价区域分布2.看看购房者都喜欢购买哪里的房子二、数据采集采集我爱我家上海区域的一万两千个小区的数据,采集的字段有小区、位置、最近30条成交套数、在售、在租、成交均价、成交总价、小区详细介绍等数据。直接上代码:import requests,codecsimport pymongo,timefrom lxml import htmlfrom ...
2018-04-25 12:59:20 6108 13
原创 Windows32位电脑配置MongoDB出现The default storage engine 'wiredTiger' is not available with this build of m
今天配置MongoDB的时候,一直错误。看了一下错误信息,[initandlisten] exception in initAndListen: 28663 Cannot start server. The default storage engine 'wiredTiger' is not available with this build of mongod. Please specify a...
2018-04-22 01:46:43 534
原创 爬取国家药监局器材名录
写个小爬虫,爬取药监局13万条医疗器材名录。# -*- coding:utf-8 -*-from lxml import htmlimport requestsproxies = { "https": "219.138.58.13:3128",}for i in range(1,135999): url='http://db.pharmcube.com/databas...
2018-04-08 14:53:50 6611 7
原创 使用朴素贝叶斯进行垃圾邮件识别
朴素贝叶斯在文本分类、垃圾邮件识别、情感分析等方面有很好的应用。进来就来体验一下,数据借用了点击打开链接,他文件夹里面有分类好的正常邮件,垃圾邮件和测试邮件。也有代码,不过我这个代码我自己写的。主要过程:读取邮件-分词-转化为词袋模型、调用朴素贝叶斯进行分类。代码比较乱,直接上代码:import jieba,reimport osimport numpy as npfrom skl...
2018-04-07 22:51:18 2842
SSRS SQL Server 2012 Reporting Services高级教程 第2版 中文版带书签目录 完整版
2018-11-14
QlikView 教程 QV教程 QlikView官网指导含源文件
2018-07-16
SQL Server 2012 integration services SSIS高级教程 第2版 PDF电子书下载 带书签目录 完整版
2018-07-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人