Python
python学习汇总
南有芙蕖
若有一天,没更新了,也在科研,只是陷入苦海中。
展开
-
数据挖掘实践(金融风控-贷款违约预测)(五):模型融合
数据挖掘实践(金融风控-贷款违约预测)(五):模型融合原创 2020-09-26 19:51:54 · 1312 阅读 · 1 评论 -
数据挖掘实践(金融风控-贷款违约预测)(四):建模与调参
数据挖掘实践(金融风控-贷款违约预测)(四):建模与调参原创 2020-09-24 17:06:42 · 1947 阅读 · 1 评论 -
数据挖掘实践(金融风控-贷款违约预测):Baseline
数据挖掘实践(金融风控-贷款违约预测):Baseline1.相关内容数据挖掘实践(金融风控-贷款违约预测)(一):赛题理解数据挖掘实践(金融风控-贷款违约预测)(二):数据分析数据挖掘实践(金融风控-贷款违约预测)(三):特征工程数据挖掘实践(金融风控-贷款违约预测)(四):建模与调参数据挖掘实践(金融风控-贷款违约预测)(五):模型融合2.Baseline代码import pandas as pdimport osimport gcimport lightgbm as lgbimp原创 2020-09-23 21:27:56 · 1416 阅读 · 0 评论 -
数据挖掘实践(金融风控-贷款违约预测)(三):特征工程
数据挖掘实践(金融风控-贷款违约预测)(三):特征工程目录数据挖掘实践(金融风控-贷款违约预测)(三):特征工程1.引言2.特征预处理2.1缺失值填充2.2时间格式处理2.3类别特征处理3.异常值处理3.1 检测异常的方法一:正态分布法3.2 检测异常的方法二:箱型图3.3异常值的处理方法4.数据分桶5.特征交互6.特征编码6.1 labelEncode 直接放入树模型中6.2 逻辑回归等模型要单独增加的特征工程7.特征选择7.1 Filter7.2 Wrapper (Recursive feature原创 2020-09-22 19:24:00 · 2472 阅读 · 0 评论 -
数据挖掘实践(金融风控-贷款违约预测)(二):数据分析
数据挖掘实践(金融风控-贷款违约预测)(二):数据分析目录数据挖掘实践(金融风控-贷款违约预测)(二):数据分析1.引言2.基本知识点2.1缺失值(Missing data)2.1.1缺失值的机制2.1.2缺失值处理的必要性2.1.3缺失值的处理方法2.2数据类型2.2.1统计学中的分类2.2.2机器学习中的分类3.读取文件的拓展知识4.实战5.总结【参考资料】1.引言 此部分为零基础入门金融风控的第二部分:数据分析,可先学习第一部分的内容:数据挖掘实践(金融风控-贷款违约预测)(一):赛题理解原创 2020-09-16 17:00:31 · 3057 阅读 · 0 评论 -
数据挖掘实践(金融风控-贷款违约预测)(一):赛题理解
数据挖掘实践(金融风控-贷款违约预测)(一):赛题理解目录数据挖掘实践(金融风控-贷款违约预测)(一):赛题理解1 引言2 赛题介绍2.1 数据概况2.2 预测指标2.2.1 分类算法常见的评估指标2.2.2 金融风控预测类常见的评估指标3 实战4 总结【参考资料】1 引言 本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第四场——零基础入门金融风控之贷款违约预测挑战赛。赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷原创 2020-09-14 16:16:36 · 4450 阅读 · 0 评论 -
MATLAB:三维坐标及函数案例实现
虚拟现实技术:三维立体显示案例实现目录虚拟现实技术:三维立体显示案例实现案例一:matlab 绘制三维图并标注每个点的坐标1.前言2.代码实现案例二:matlab 绘制三维曲面的函数1.mesh函数2.surf函数3.两者调用格式差不多4.比较mesh、surf的区别案例一:matlab 绘制三维图并标注每个点的坐标1.前言基本原理是先绘制三维图,通过plot3,然后通过text函数在每个点标注出坐标,但由于点的数量多,标注会比较密集,不一定看得清楚,可以适当减少标注的点数来提高清晰度。2.代码实原创 2020-06-12 08:13:42 · 14518 阅读 · 0 评论 -
Python爬虫系列(四):爬取腾讯新闻&知乎
一、爬取腾讯新闻了解ajax加载通过chrome的开发者工具,监控网络请求,并分析用selenium完成爬虫具体流程如下:用selenium爬取https://news.qq.com/ 的热点精选 热点精选至少爬50个出来,存储成csv 每一行如下 标号(从1开始),标题,链接,…(前三个为必做,后面内容可以自己加)1)爬取给的腾讯新闻网页#主要是从给定腾讯新闻网页中爬取新闻的...原创 2020-04-27 08:49:13 · 4619 阅读 · 3 评论 -
Python爬虫系列(三):模拟登录163&丁香园
Python爬虫系列(三):模拟登录163&丁香园目录Python爬虫系列(三):模拟登录163&丁香园一、session和cookie1 前置:动态网页和静态网页静态网页动态网页http1.02 session和cookiessessioncookies一个重要概念3 实战案例:模拟登录163二、为什么会出现IP被封1 如何应对IP被封的问题2 如何获取代理IP地址使用代理确认...原创 2020-04-25 11:25:01 · 721 阅读 · 0 评论 -
Python爬虫系列(二):爬取中国大学排名&丁香园-用户名和回复内容&淘宝品比价
Python爬虫系列(二):爬取中国大学排名&丁香园-用户名和回复内容&淘宝品比价目录Python爬虫系列(二):爬取中国大学排名&丁香园-用户名和回复内容&淘宝品比价一、Beautiful Soup库入门1 Beautiful Soup库的基本元素2 基于bs4库的HTML内容遍历方法3 基于bs4库的HTML内容的查找方法4 实战:中国大学排名定向爬取二、学...原创 2020-04-23 12:32:48 · 548 阅读 · 0 评论 -
从NFA构造DFA(自动机)
一,算法:从NFA构造DFA(子集法)输入: 一个NFA N输出 : 一个接受同一正规集的DFA D# 构造NFAclass NFA: # 初始化NFA def __init__(self, S, s0, F, move): self.S = S # 状态集(list) self.s0 = s0 # 初态(int) sel...原创 2019-12-17 16:29:43 · 1734 阅读 · 0 评论 -
Anaconda的安装与环境管理
Anaconda的安装与环境管理Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。因为包含了大量的科学包,Anaconda 的下载文件比较大(约 531 MB),如果只需要某些包,或者需要节省带宽或存储空间,也可以使用Miniconda这个较小的发行版(仅包含conda和 Python)。Anaconda是一个开源的包、环境管理...原创 2019-10-25 21:03:28 · 204 阅读 · 0 评论 -
实现12306全自动下单功能(Python+PyCharm附:主要代码)
用python实现12306全自动下单功能(Python+PyCharm附:主要代码)基本实现步骤(一)seleniumSelenium是开源的自动化测试工具,它主要是用于Web 应用程序的自动化测试,同时支持所有基于web 的管理任务自动化。在本项目中相当于:上层统一的控制浏览器API接口流程图如下:1.安装selenium,在命令行输入“pip install selenium”...原创 2019-09-25 09:51:16 · 2603 阅读 · 2 评论