![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
努力成为一个帅气数据风控科学家
不信没有女粉
展开
-
代码粘贴板-日常python常用语法不会写就来看-常更新
python原创 2023-06-09 10:43:08 · 936 阅读 · 1 评论 -
客群质量分析、特征挖掘——灵活使用pivot_tabl批量获取特征qcut分布情况
客群质量分析、特征挖掘——灵活使用pivot_tabl批量获取特征qcut分布情况原创 2022-09-10 15:36:11 · 214 阅读 · 1 评论 -
python将100wcsv数据随机切分50份批量保存在文件夹中
python将100wcsv数据随机切分50份批量保存在文件夹中改英文字段名为中文,并且保留客户号前导0,批量保存原创 2022-08-01 19:21:50 · 732 阅读 · 0 评论 -
python实现格兰杰因果关系检验
格兰杰因果关系检验的结论是一种统计估计,它先假设时间序列之间没有因果关系, 然后检验能否否定,如果能否定这个检验,那么这就可以验证这份时间序列数据对想要预测的目标是有效的。目标使用b预测a,a是要得出预测结果的序列:from statsmodels.tsa.stattools import grangercausalitytestsimport pandas as pdimport numpy as npdf = pd.DataFrame(np.random.randint(0, 100, siz原创 2021-10-27 20:25:14 · 2464 阅读 · 1 评论 -
python将csv数据转化为txt
近期有一项这样的需求,将约500w条的数据从数据库里提取出来给到别人,但遇到csv只能最多展示110w条数据的困难。因此想到将数据保存为csv后转化位txt文档格式(没有行数限制)。亲测有效。import pandas as pddata = pd.read_csv('data.csv')with open('test.txt','a+') as f: # 现在jupyter新建一个txt空文档 for line in data.values: f.write((s原创 2021-06-27 14:43:32 · 5293 阅读 · 0 评论 -
python连接mysql读取数据库详解
python连接mysql读取数据库详解# 连接数据库conn = pymysql.connect(host = '127.0.0.1' # 连接名称,默认127.0.0.1, user='root'#用户名, passwd='password' # 密码, port=3306 # 端口,默认为3306, db='pku' # 数据库名称, charset='utf8' # 字符编码)cur = conn.cursor() # 生成游标对象sql = "select * from pku原创 2020-12-20 19:30:14 · 302 阅读 · 0 评论 -
‘Series‘ object has no attribute ‘decode‘
data2=str(data)data_cut=jieba.cut(data2)数据结构变成str即可原创 2020-12-01 19:21:32 · 1867 阅读 · 0 评论 -
AttributeError: ‘module‘ object has no attribute ‘cut‘
首先这个AttributeError: ‘module’ object has no attribute ‘cut’ 报错的原因是因为有jieba.py这个文件存在,或者jieba这样命名的文件存在,很多新人使用结巴 来分词的时候命名直接为jieba.py,但是其实官方给的教程代码里有import jieba,这样就会引用到你自己这个教程文件jieba.py,而没有引用官方的库,这样自然cut这个方法就没有,所以报错。解决方法:1、不要使用jieba.py来命名你的测试文件。2、你一开始就是用jieb原创 2020-12-01 19:19:39 · 443 阅读 · 0 评论 -
美国数学建模比赛2020 MCM C题代码详解3
重要提示!!!!!本文中的部分代码都已经公开发表在论文中,不建议直接引用,可能重复比例比较大,任何导致学术造假的后果请浏览者自行承担!!!为确保无风险,请标明引用!!!*# #!-*- coding:utf-8 -*-import pandas as pdimport numpy as npimport xlrdimport matplotlib.pyplot as plth = pd.read_excel("C:\\Users\\thous\\PycharmProjects\\unt原创 2020-07-22 13:29:01 · 720 阅读 · 0 评论 -
美国数学建模比赛2020 MCM C题代码详解2
重要提示!!!!!本文中的部分代码都已经公开发表在论文中,不建议直接引用,可能重复比例比较大,任何导致学术造假的后果请浏览者自行承担!!!为确保无风险,请标明引用!!!*#coding=utf-8import reimport codecsimport os, time, sysf = codecs.open('C:/Users/thous/PycharmProjects/untitled4/hair.txt', 'r', 'utf-8')# f = codecs.open('F:/pa原创 2020-07-22 13:21:55 · 795 阅读 · 2 评论 -
美国数学建模比赛2020 MCM C题代码详解
重要提示!!!!!本文中的部分代码都已经公开发表在论文中,不建议直接引用,可能重复比例比较大,任何导致学术造假的后果请浏览者自行承担!!!# #!-*- coding:utf-8 -*-import pandas as pdimport numpy as npimport xlrdimport vaderSentimentfrom vaderSentiment.vaderSentiment import SentimentIntensityAnalyzerfrom sklearn.prepr原创 2020-07-22 13:08:55 · 1973 阅读 · 0 评论 -
bagging、boosting的概念与区别
随机森林属于集成学习(ensemble learning)中的bagging算法,在集成算法中主要分为bagging算法与boosting算法Bagging算法(套袋发)bagging的算法过程如下: 从原始样本集中使用Bootstraping 方法随机抽取n个训练样本,共进行k轮抽取,得到k个训练集(k个训练集之间相互独立,元素可以有重复)。对于n个训练集,我们训练k个模型,(这个模型可根据具体的情况而定,可以是决策树,knn等)对于分类问题:由投票表决产生的分类结果;对于回归问题,由k个模型预测原创 2020-07-20 18:13:54 · 227 阅读 · 0 评论 -
python绘图总结
python可视化分析总结(matplotlib、seaborn、ggplot)一、matplotlib库1、基本绘图命令import matplotlib.pyplot as pltplt.figure(figsize=(5,4)) #设置图形大小plt.rcParams[‘axes.unicode_minus’]=False #正常显示负号plt.rcParams[‘font.sans-self’]=[‘Kai Ti’] #设置字体,这里是楷体,SimHei表示黑体#基本统计图plt.b转载 2020-07-19 19:26:13 · 780 阅读 · 0 评论 -
python plot的一些用法,标题重叠
16.plotfig = plt.figure(figsize=(12, 4)) # 把画布弄大一些plt.tick_params(axis=‘x’, labelsize=8) # 设置x轴标签大小plt.barh(df[‘sport_type’], df[‘score’]) # 绘制横向柱状图plt.xticks(rotation=-15) # 设置x轴标签旋转角度p...原创 2020-05-15 16:26:28 · 1066 阅读 · 0 评论 -
常用python的部分参考代码
只是个人在使用python过程中一些比较常用的简单代码,并不是完整的项目,供初学者的朋友参考1.开头# -*- coding: cp-UTF-8*-#!/usr/bin/python32.安装输入cmd.exe,打开命令提示符,pip install --user matplotlib 3.import调用 pip install 的地址C:\Users\thous\AppDa...原创 2020-04-28 19:36:06 · 289 阅读 · 0 评论 -
python常用代码参考
#!-*- coding:utf-8 -*-# ######################################### !!!不可运行!!! ################################################33from sklearn.metrics import roc_curve, roc_auc_score, auc, accuracy_s...原创 2020-04-28 12:32:42 · 299 阅读 · 0 评论 -
MCM2020C题 基于XGBoost+LR模型
```pythonimport pandas as pdfrom numpy.random import randfrom numpy.random import seedfrom scipy.stats import spearmanrimport seaborn as snsimport xgboost as xgbfrom sklearn.model_selection im...原创 2020-07-28 22:33:46 · 352 阅读 · 3 评论 -
def自定义函数统计统计字符串某单词出现频数
#!/usr/bin/python3# -*- coding: utf-8 -*-import splitfrom collections import Counterdef wordCount(): myString = ('my english name is thousand lee') list = myString.split() count = Co...原创 2019-10-09 15:30:02 · 724 阅读 · 0 评论 -
python计算矩阵的N次幂,计算方阵的值
import numpy as npa=np.array([[0,-1,1],[2,-3,0],[0,0,0]])print(a)b=np.array([[0,-1,1],[2,-3,0],[0,0,0]])i=1while True: if i <99: i=i+1 b=np.dot(b,a) print(b) else: break#shell可以算,...原创 2019-08-08 21:32:46 · 12789 阅读 · 2 评论