自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 资源 (1)
  • 收藏
  • 关注

原创 Anconda命令行安装

Python国内镜像:# 豆瓣https://pypi.doubanio.com/simple/# 阿里云 https://mirrors.aliyun.com/pypi/simple/# 清华大学https://pypi.tuna.tsinghua.edu.cn/simple/https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simp...

2019-11-25 21:00:09 604

转载 将CSDN博客内容保存为PDF

将CSDN博客内容保存为PDF,为方便使用所以保存此文章,参考其他文章,如侵权请告知。1.打开CSDN文章内容。2.按键盘上F12打开浏览器调试模式,打开Console标签。3.在Console标签页内输入一下代码,然后点击回车。(function(){$("#side").remove();$("#comment_title, #comment_list, #comment_bar...

2019-10-28 16:07:52 824

原创 【无标题】

利用Python查看内存占用情况或程序占用内存资源利用python查看运行内存占用情况,查看当前程序占用运行内存资源。#常用的:import psutilimport datetimeimport osdef info(): info = psutil.virtual_memory() print(datetime.datetime.now()) print('内存使用:',psutil.Process(os.getpid()).memory_info().rss)

2022-05-16 15:27:57 280

原创 2021-09-15

一行行写入csv文件import csvfrom tqdm import tqdm csvfile = open('文件名.csv', 'w', newline='')writer = csv.writer(csvfile)columns = ['列名']# 写入列名writer.writerow(columns)for i in tqdm(range(len(matrix))): # 遍历写入行数据 writer.writerow(matrix[i])csvfile

2021-09-15 13:56:13 150

原创 2021-09-14

**如何让python程序每个一段时间执行一次(设置间隔时间)?**import timeimport datetime# 定义函数def sleeptime(hour,min,sec): return hour*3600 + min*60 + sec; # 设置间隔时间:时分秒second = sleeptime(0,0,10);while 1==1: time.sleep(second) print('do action', datetime.datet

2021-09-14 13:47:47 135

转载 Python异常处理 -跳过异常继续执行

Python异常处理 -跳过异常继续执行ython异常处理 -跳过异常继续执行python一般使用try…except…处理异常try: #可能会出现异常的代码,放在try下 code1 #如果try内部任意一行代码出现异常,# 直接跳转至except,执行except下代码 code2except: code3 code4此方法只要有一个异常,程序就不继续执行了。当循环中出现异常时,如何跳过循环中的异常继续执行。比如当

2021-03-18 09:59:39 4826

转载 如何利用OMIM数据库获取肿瘤相关所有突变基因?

如何利用OMIM数据库获取肿瘤相关所有突变基因?OMIM是人类孟德尔遗传数据库(线上版)(0nline Mendelian Inheritance in Man)的简称。这是一个持续更新的关于人类基因和遗传紊乱的数据库,主要着眼于遗传性的基因疾病,包括文本信息和相关参考信息、序列纪录、图谱和相关其他数据库(度娘有介绍,此处省略很多字)。对于临床工作者,通过体现病人临床特征的关键词,可以从OMIM数据库中寻找最近的临床检测标准和发展趋势。在教学研究方面,OMIM可以迅速、简单地提供给学者们关于基因和遗传病

2020-10-16 11:08:11 5397 11

原创 动手学数据分析–Task05:数据建模及模型评估

动手学数据分析–Task05:数据建模及模型评估

2020-08-26 20:11:04 270

原创 数据挖掘实践(资金流入流出预测)--Task06:学习总结

数据挖掘实践(资金流入流出预测)–Task06:学习总结赛题解读赛题介绍:https://tianchi.aliyun.com/competition/entrance/231573/introduction数据集介绍及下载:https://tianchi.aliyun.com/competition/entrance/231573/information阅读完赛题介绍后,总结了一下这个赛题的目的就是预测未来一个月,每天余额宝总的的转入金额和转出金额。是一个回归问题。通过本次学习,系统的学习了如何

2020-08-25 14:36:47 529

原创 动手学数据分析–Task04:数据可视化

动手学数据分析–Task04:数据可视化导入数据text = pd.read_csv(r'result.csv')text.head()# 可视化展示泰坦尼克号数据集中男女中生存人数分布情况sex = text.groupby('Sex')['Survived'].sum()sex.plot.bar()plt.title('survived_count')plt.show()# 可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图text.groupby(['Sex','Su

2020-08-24 21:30:11 175

原创 数据挖掘实践(资金流入流出预测)--Task05:建模预测

数据挖掘实践(资金流入流出预测)–Task05:建模预测数据挖掘实践(资金流入流出预测)–Task04:特征工程赛题解读赛题介绍:https://tianchi.aliyun.com/competition/entrance/231573/introduction数据集介绍及下载:https://tianchi.aliyun.com/competition/entrance/231573/information阅读完赛题介绍后,总结了一下这个赛题的目的就是预测未来一个月,每天余额宝总的的转入金额和

2020-08-23 18:35:51 472

原创 数据挖掘实践(资金流入流出预测)--Task04:特征工程

数据挖掘实践(资金流入流出预测)–Task04:特征工程赛题解读赛题介绍:https://tianchi.aliyun.com/competition/entrance/231573/introduction数据集介绍及下载:https://tianchi.aliyun.com/competition/entrance/231573/information阅读完赛题介绍后,总结了一下这个赛题的目的就是预测未来一个月,每天余额宝总的的转入金额和转出金额。是一个回归问题。数据挖掘“二八原则“80%的

2020-08-23 18:32:57 464

原创 数据挖掘实践(资金流入流出预测)--Task3时间序列模型

数据挖掘实践(资金流入流出预测)–Task2时间序列模型赛题解读赛题介绍:https://tianchi.aliyun.com/competition/entrance/231573/introduction数据集介绍及下载:https://tianchi.aliyun.com/competition/entrance/231573/information阅读完赛题介绍后,总结了一下这个赛题的目的就是预测未来一个月,每天余额宝总的的转入金额和转出金额。是一个回归问题。时间序列是指将同一统计量的数值

2020-08-22 20:54:29 481

原创 动手学数据分析--Task3数据重构

动手学数据分析–Task3数据重构了解数据重构的方法使用groupby做数据运算1。读入数据,查看数据前几行。2.使用concat方法:将数据train-left-up.csv和train-right-up.csv横向合并为一张表,并保存这张表为result_uplist_up = [text_left_up,text_right_up]result_up = pd.concat(list_up,axis=1)result_up.head()list_down=[text_left_dow

2020-08-22 20:38:24 171

原创 数据挖掘实践(资金流入流出预测)--Task2时间序列规则

数据挖掘实践(资金流入流出预测)–Task2时间序列规则时序数据:时序数据是指时间序列数据,可以用数值反映其变化程度的数据。例如股票大盘走势、气象变化、内存监控等.时间序列的基本特征包括:趋势性,序列相关性,随机性.一、分析大小额用户前面的分析可以看出,某些用户的交易额很大,对于日交易量很明显,这里统计四月份后依旧活跃的大额用户(大于100万)二、分析用户的交易频次绘制频繁用户与非频繁用户总购买赎回量的时序图在这里插入图片描述三、分析用户的其他属性统计每个城市用户的日总交易额的区别并

2020-08-21 10:37:30 287

原创 动手学数据分析-Task02:数据清洗及特征处理

数据分析-Task02:数据清洗及特征处理一、数据清洗数据清洗(data cleaning)是在机器学习过程中一个不可缺少的环节,其数据的清洗结果直接关系到模型效果以及最终的结论。在实际的工作中,数据清洗通常占开发过程的50%-80%左右的时间。学习自:https://blog.csdn.net/loveliuzz/article/details/78833835...

2020-08-21 09:11:28 266

原创 数据挖掘实践(资金流入流出预测)--Task1数据探索与分析

金融时序数据挖掘实战学习内容–Task1数据探索与分析1. 数据探索和准备步骤1.1 时间序列图通过时间变化可以得到事务的变化趋势1.2 数据分布可视化可以使用直方图、密度曲线图、箱型图、小提琴图等1.3 变量间相关性分析与独立性分析相关性分析定类变量:名义型变量;性别定序变量:不仅分类,还按某种特性排序;两值的差无意义;教育程度定距变量:可比较大小、差有意义的变量独立性分析/检验变量间无线性相关性,还可能存在非线性关联假设X为连续型变量,Y为离散型变量(有R种取值)????_0

2020-08-20 21:28:22 604

原创 动手学数据分析-Task1

数据分析-Task1.数据基础操作1. 数据载入及观察在数据处理中,第一步通常都需要导入数据,并进行对数据的初步预览1.导入库导入所需数据库:import numpy as np; import pandas as pd2.载入数据pd.read_csv(‘filename’), csv为文件格式,可替换为其他格式:tsv;xlsx3.逐块读取有时数据库过大,为了节约内存需要分批次读取:pd.read_csv(‘filename’, chunksize=int)4.修改column索引名称

2020-08-20 20:49:03 124

转载 为了记录资料KDD Cup 2020 Challenges for Modern E-Commerce Platform: Debiasing Top13

KDD Cup 2020 Challenges for Modern E-Commerce Platform: Debiasing Top13资料为了记录资料,侵权联系,速删赛道链接https://tianchi.aliyun.com/competition/entrance/231785/introduction数据集链接: https://pan.baidu.com/s/1Mb0U001wcqCB2x7me0uchw 提取码: p3wr解压密码7c2d2b8a636cbd790ff12a0

2020-06-18 20:10:36 621 3

转载 python之 用for循环遍历字符串 列表 元组 字典 一个for循环遍历两个列表

python 如何在一个for循环中遍历两个列表利用python自带的zip函数可同时对两个列表进行遍历,代码如下:>>> list1 = ['a', 'b', 'c', 'd']>>> list2 = ['apple', 'boy', 'cat', 'dog']>>> for x, y in zip(list1, list2):   print(x, 'is', y)# 输出a is appleb is boyc is cat

2020-06-18 08:57:04 1881 1

原创 计算机视觉实践(街景字符编码识别)-Task5 模型集成

计算机视觉实践(街景字符编码识别)-Task5 模型集成5.1 学习目标学习集成学习方法以及交叉验证情况下的模型集成学会使用深度学习模型的集成学习集成学习的主要思想是利用一定手段学习出多个分类器,而且这多个分类器的要求是弱分类器,然后将多个分类器进行组合公共预测。核心思想就是如何训练处多个弱分类器以及如何将这些弱分类器进行组合。5.2Boosting集成Boosting方法是一种用来提高弱分类算法准确度的方法,这种方法通过构造一个预测函数系列,然后以一定的方式将他们组合成一个预测函数。他是一种框

2020-06-03 13:06:55 206

转载 记录5个模型(逻辑回归、SVM、决策树、随机森林、XGBoost)关于accuracy、precision,recall和F1-score、auc值的评分表格,并画出ROC曲线。

记录5个模型(逻辑回归、SVM、决策树、随机森林、XGBoost)关于accuracy、precision,recall和F1-score、auc值的评分表格,并画出ROC曲线。数据集下载地址:链接: https://pan.baidu.com/s/1eAxEpYv5jtZahDuGCIkGrw 提取码: 1024import pandas as pdimport numpy as npfrom sklearn.impute import SimpleImputerfrom sklearn.pr

2020-05-31 16:02:43 6317 1

转载 sklearn中predict()与predict_proba()用法区别

sklearn中predict()与predict_proba()用法区别学习使用,侵权联系速删转载:https://www.cnblogs.com/mrtop/p/10309083.htmlpredict是训练后返回预测结果,是标签值。predict_proba返回的是一个 n 行 k 列的数组, 第 i 行 第 j 列上的数值是模型预测 第 i 个预测样本为某个标签的概率,并且每一行的概率和为1。# conding :utf-8 from sklearn.linear_model imp

2020-05-31 14:26:13 5259

原创 ROC,AUC,Precision,Recall,F1的介绍与计算

ROC,AUC,Precision,Recall,F1的介绍与计算ROC、AUC、Recall、Precision、Accuracy、F1、PRC 是什么?https://blog.csdn.net/OOC_ZC/article/details/80180699ROC,AUC,Precision,Recall,F1的介绍与计算https://www.jianshu.com/p/963f10ff4225精确率(Precision)、召回率(Recall)、F1-score、ROC、AUChttps

2020-05-30 21:55:29 325

原创 python将csv文件转化成txt-指定列保存

python将csv文件转化成txt-指定列保存import pandas as pdimport os #读取news_data.csv,保存到新建的news_data.txt中data = pd.read_csv('news_data.csv', encoding='utf-8')with open('news_data.txt','a+', encoding='utf-8') as f: for line in data.values: #str(line[0])

2020-05-29 22:01:41 8262

转载 计算机视觉实践(街景字符编码识别)-Task04:模型训练与验证

计算机视觉实践(街景字符编码识别)-Task04:模型训练与验证4.1 学习目标理解验证集的作用,并使用训练集和验证集完成训练学会使用Pytorch环境下的模型读取和加载,并了解调参流程4.2 构造验证集在机器学习模型(特别是深度学习模型)的训练过程中,模型是非常容易过拟合的。深度学习模型在不断的训练过程中训练误差会逐渐降低,但测试误差的走势则不一定。在模型的训练过程中,模型只能利用训练数据来进行训练,模型并不能接触到测试集上的样本。因此模型如果将训练集学的过好,模型就会记住训练样本的细节,导致

2020-05-27 17:09:39 217

原创 计算机视觉实践(街景字符编码识别)-Task3 字符识别模型

计算机视觉实践(街景字符编码识别)-Task3 字符识别模型CNN介绍卷积神经网络(简称CNN)是一类特殊的人工神经网络,是深度学习中重要的一个分支。CNN在很多领域都表现优异,精度和速度比传统计算学习算法高很多。特别是在计算机视觉领域,CNN是解决图像分类、图像检索、物体检测和语义分割的主流模型。1,CNN每一层由众多的卷积核组成,每个卷积核对输入的像素进行卷积操作,得到下一次的输入。随着网络层的增加卷积核会逐渐扩大感受野,并缩减图像的尺寸。2,CNN是一种层次模型,输入的是原始的像素数据。CNN

2020-05-27 16:57:32 169

原创 Python顺序的读取文件夹下名称有序的文件

Python顺序的读取文件夹下名称有序的文件import ospath="/home/test/" #待读取的文件夹path_list=os.listdir(path)path_list.sort() #对读取的路径进行排序for filename in path_list: print(os.path.join(path,filename))

2020-05-27 15:50:30 482 1

原创 计算机视觉实践(街景字符编码识别)-Task2 数据读取与数据扩增

计算机视觉实践(街景字符编码识别)-Task2 数据读取与数据扩增2.1.数据读取与数据扩增本章主要内容为数据读取、数据扩增方法和Pytorch读取赛题数据三个部分组成。2.1 学习目标学习Python和Pytorch中图像读取学会扩增方法和Pytorch读取赛题数据2.2 图像读取由于赛题数据是图像数据,赛题的任务是识别图像中的字符。因此我们首先需要完成对数据的读取操作,在Python中有很多库可以完成数据读取的操作,比较常见的有Pillow和OpenCV。2.2.1 PillowPil

2020-05-23 20:22:27 216

原创 计算机视觉实践(街景字符编码识别)-Task01:赛题理解

计算机视觉实践(街景字符编码识别)-Task01:赛题理解1.赛题理解赛题名称:零基础入门CV之街道字符识别赛题目标:通过这道赛题可以引导大家走入计算机视觉的世界,主要针对竞赛选手上手视觉赛题,提高对数据建模能力。赛题任务:赛题以计算机视觉中字符识别为背景,要求选手预测街道字符编码,这是一个典型的字符识别问题。为了简化赛题难度,赛题数据采用公开数据集SVHN,因此大家可以选择很多相应的paper作为思路参考。2.环境安装软件:Anaconda3.赛题数据赛题来源自Google街景图像中的门

2020-05-21 15:10:00 339

原创 BP神经网络以及python实现

BP神经网络以及python实现学习博客知识保存地址:https://blog.csdn.net/admin_maxin/article/details/81274512https://blog.csdn.net/huakai16/article/details/77479127https://blog.csdn.net/qq_42633819/article/details/829038...

2019-11-24 21:05:54 268

原创 一文彻底搞懂BP算法:原理推导+数据演示+项目实战

转载自 磐创 AI 博客,感谢作者分享(侵权告知必删)网址:https://blog.csdn.net/fendouaini/article/details/79789440https://blog.csdn.net/fendouaini/article/details/93814336...

2019-11-16 15:21:24 1094

原创 大白话讲解BP算法

转载自 这孩子谁懂哈 博客,感谢作者分享博客网址:https://blog.csdn.net/zhaomengszu/article/details/77834845# -*- coding: utf-8 -*-"""Created on Sat Nov 16 10:22:10 2019@author: LK""" #coding:utf-8import randomi...

2019-11-16 10:50:47 256

原创 神经网络(附源代码)

转载自 听风的蜗牛 博客 谢谢博客网址:https://blog.csdn.net/zhouzx2010/article/details/71126800/代码:https://github.com/tingfengjushi/mymllib/tree/master/NeuralNetwork

2019-11-16 10:45:59 2804 1

转载 大数据时代的数据挖掘是怎么做的?

3月13日下午,南京邮电大学计算机学院、软件学院院长、教授李涛在CIO时代APP微讲座栏目作了题为《大数据时代的数据挖掘》的主题分享,深度诠释了大数据及大数据时代下的数据挖掘。众所周知,大数据时代的大数据挖掘已成为各行各业的一大热点。一、数据挖掘在大数据时代,数据的产生和收集是基础,数据挖掘是关键,数据挖掘可以说是大数据最关键也是最基本的工作。通常而言,数据挖掘也称为DataMining,或知识...

2019-11-10 15:34:02 1221

BP神经网络.zip

简单介绍BP算法,内有代码,网络收集,侵权告知必删。神经网络简单的说,就是用一种层次化的方式将一堆简单的函数在顶层堆叠在一起,形成一个复杂的非线性函数,以此表达输入与输出之间的关系。

2019-11-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除