案例
墨禾
这个作者很懒,什么都没留下…
展开
-
数据挖掘岗位分析
import requestsfrom bs4 import BeautifulSoupimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom selenium import webdriverimport builtwithimport re#检查网站采取了那些技术html = re...原创 2018-03-30 12:48:26 · 3560 阅读 · 1 评论 -
用selenium模拟登陆知乎账号,处理登陆界面随机出现验证码窗口的问题
import requestsfrom selenium import webdriverfrom bs4 import BeautifulSoupimport timewhile True: #option = webdriver.ChromeOptions() #option.set_headless() #因为要手动输入验证码,所以无头模式注释掉 ...原创 2018-04-01 20:56:28 · 2979 阅读 · 0 评论 -
电影数据集分析
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport reimport nltkimport jsonimport matplotlib.image as mpimgplt.rcParams['font.sans-serif'] = ['SimHei']plt.rcParams['axe...原创 2018-04-09 14:50:31 · 8643 阅读 · 1 评论 -
爬虫爬取链家二手房信息,对二手房做分析
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom bs4 import BeautifulSoupimport requestsdef generate_web_link(districts): '''此函数生成武汉地区所有区域二手房网页链接地址''' page_url...原创 2018-04-02 16:45:39 · 2611 阅读 · 0 评论 -
信用卡欺诈交易检测
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei']raw_credit = pd.read_csv('creditcard.csv')#数据可以在kaggle上获取raw_credit.head()...原创 2018-04-10 15:13:24 · 1879 阅读 · 0 评论 -
链家武汉二手房分析和数据建模
#相应模块的导入import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport reimport seaborn as snsimport matplotlib.image as mpimg # mpimg 用于读取图片plt.rcParams['font.sans-serif'] = ['SimH...原创 2018-04-04 09:36:55 · 3278 阅读 · 1 评论 -
贷款自动审批模型的构建
这个案例的背景:金融领域,申请贷款的人很多,可能银行每天要面对很多贷款申请,其中可能有很多不具备贷款资格的申请,为了缓解审批人员的工作量,可以根据申请人的一些资料,做一个模型自动过滤那些不具备贷款资格申请表。import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport matplotlib.ima...原创 2018-04-05 18:46:48 · 4573 阅读 · 1 评论 -
维基百科词条编辑贡献可视化
import requestsimport reimport jsonfrom bs4 import BeautifulSoupfrom urllib.request import urljoinimport collectionsfrom pyecharts import Mapdef get_view_history_link(search_word): "该函数用...原创 2018-04-25 12:00:15 · 513 阅读 · 0 评论