- 博客(4)
- 收藏
- 关注
原创 百度热搜和微博热搜爬取分词和筛选(未实现)
百度热搜# -*- coding: utf-8 -*-from bs4 import BeautifulSoupimport urllib.request,urllib.errorimport reimport jiebaimport jieba.posseg as psgimport pandas as pdimport pickleurl = 'http://top.baidu.com/buzz?b=341&c=513&fr=topbuzz_b341_c513'#
2020-11-13 18:37:01
363
原创 分别利用xgbboost和catboost算法做特征重要性排序
分别利用xgbboost和catboost算法做特征重要性排序xgbboost# -*- coding: utf-8 -*-import pandas as pdfrom sklearn.model_selection import train_test_splitimport xgboost as xgbfrom matplotlib import pyplot as pltfrom sklearn.metrics import confusion_matriximport warning
2020-11-13 18:33:24
3971
1
原创 友盟-开发者中心-OpenApi使用方法
起因:网上流传的《友盟 Open API.pdf》文档对于不同版本数据的获取存在缺陷,也就是version那个响应字段无效,折腾了半天,还是回归官方文档的使用。代码分析:# -*- coding: utf-8 -*-#!/usr/bin/env pythonimport aopimport aop.apiimport json# 设置网关域名aop.set_default_server('gateway.open.umeng.com')# 设置apiKey和apiSecuritya
2020-10-12 17:10:06
1599
1
原创 友盟API数据爬取与自动化报表
友盟API数据爬取与自动化报表第一步:通过已有的账号密码获取通行密钥#定义获取token的函数,此处相当于获取一个密匙来进一步获取数据def authorize(user, pasw): url = 'http://api.umeng.com/authorize' body = {'email': "%s"%(user), 'password': '%s'%(pasw)} response = requests.post(url, params = body) retu
2020-09-17 16:47:14
882
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人