自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

weixin_44104450的博客

数据挖掘学习之路

  • 博客(23)
  • 收藏
  • 关注

原创 报错OSError: No translation files found for default language zh-CN.

报错OSError: No translation files found for default language zh-CN.使用Django建站的过程中,修改时区设置后,报错OSError: No translation files found for default language zh-CN.解决方法:将时区改为‘en-us’#LANGUAGE_CODE = 'zh-CN' #时区设置LANGUAGE_CODE = 'en-us' #时区设置TIME_ZONE = 'A

2020-08-09 17:31:47 2546 1

原创 python编程基础3-异常处理

3 异常处理异常就是运行期检测到的错误。计算机语言针对可能出现的错误定义了异常类型,某种错误引发对应的异常时,异常处理程序将被启动,从而恢复程序的正常运行。3.1 python标准异常总结BaseException:所有异常的 基类Exception:常规异常的 基类StandardError:所有的内建标准异常的基类ArithmeticError:所有数值计算异常的基类FloatingPointError:浮点计算异常OverflowError:数值运算超出最大限制ZeroDivisio

2020-07-26 09:38:44 213

原创 python编程基础2-条件语句与循环语句

1 条件语句1.1 if 语句if 2 > 1 and not 2 > 3: print('Correct Judgement!')# Correct Judgement!1.2 if - else 语句if expression: expr_true_suiteelse: expr_false_suite1.3 if - elif - else 语句temp = input('请输入成绩:')source = int(temp)if 100 &

2020-07-23 22:56:11 216

原创 Python编程基础1-变量、运算符、位运算与数据类型

变量、运算符、位运算与数据类型1 注释单行注释与多行注释1.1 单行注释在 Python 中,# 表示注释,作用于整行。1.2 多行注释‘’’ ‘’’ 或者 “”" “”" 表示区间注释,在三引号之间的所有内容被注释2 运算符2.1 算术运算符操作符名称+加-减*乘/除//整除%取余**幂2.2 比较运算符操作符名称>大于>=大于等于<小于<=

2020-07-22 19:50:02 145

原创 python爬虫编程实践4-大作业:用selenium爬取腾讯新闻的热点精选

1、任务目标(1)了解ajax加载(2)通过chrome的开发者工具,监控网络请求,并分析(3)用selenium完成爬虫(4)任务: 用selenium爬取https://news.qq.com/ 的热点精选(5)目标:热点精选至少爬50个出来,存储成csv 每一行如下 标号(从1开始),标题,链接,…2、爬取腾讯新闻的热点精选(自己实现的代码)import timefrom ...

2020-04-27 09:49:39 1184 1

原创 python爬虫编程实践task3-ip代理、session和cookie、selenuim

1、IP代理如何应对IP被封的问题:1、修改请求头,模拟浏览器(而不是代码去直接访问)去访问2、设置访问时间间3、采用代理IP并轮换前两个之前已经使用过,这里贴一个建立IP代理池的代码:from bs4 import BeautifulSoupimport requestsimport reimport jsondef open_proxy_url(url): u...

2020-04-25 23:31:43 169

原创 python爬虫编程实战task2-bs4、xpath、re学习与相关实战

1、bs4学习与实战我感觉bs4虽然可以解析和提取 HTML/XML 数据,但是匹配效率还是远远不如正则以及xpath的,一般不推荐使用,在这里不作为重点学习。实战之中国大学排名定向爬取:# 导入库import requestsfrom bs4 import BeautifulSoupimport bs4# 1. 从网络上获取大学排名网页内容def getHTMLText(url)...

2020-04-23 22:01:02 374

原创 python爬虫编程实践task1

0 前期准备知识目标:了解http基础,html基础,尝试使用request-get爬取豆瓣电影信息,了解api的使用0-1 Window 下安装配置ChromeDriver(1)点击浏览器最右上角图标的查看浏览器版本依次:最右上角home图标-帮助-关于GoogleChrome可以看出我的浏览器版本是75.0.3770.100(2) 下载对应的ChromeDriver(是个.exe...

2020-04-21 17:27:41 258

原创 task5 模型融合

import pandas as pdimport numpy as npimport warningsimport matplotlibimport matplotlib.pyplot as pltimport seaborn as snswarnings.filterwarnings(‘ignore’)%matplotlibimport itertoolsimport mat...

2020-04-04 21:08:02 217

原创 task4 建模与调参

import pandas as pdimport numpy as npimport warningswarnings.filterwarnings('ignore')def reduce_mem_usage(df): """ iterate through all the columns of a dataframe and modify the data type ...

2020-04-01 20:41:35 229

原创 Datawhale-零基础入门数据挖掘 - 二手车交易价格预测-- Task3-特征工程

Datawhale-零基础入门数据挖掘 - 二手车交易价格预测-- Task3-特征工程转载自Datawhale-零基础入门数据挖掘 - 二手车交易价格预测活动中分享的资料,如有侵权,联系删除...

2020-03-28 19:18:32 148

原创 Datawhale-零基础入门数据挖掘 - 二手车交易价格预测-- 赛题理解与数据分析(EDA)

这里写自定义目录标题Datawhale-零基础入门数据挖掘 - 二手车交易价格预测-- 赛题理解与数据分析(EDA)一、赛题理解二、数据探索性分析(EDA)2.1 介绍(摘自AI蜗牛车的Task2 数据分析)2.2 本次比赛EDA过程的思维导图Datawhale-零基础入门数据挖掘 - 二手车交易价格预测-- 赛题理解与数据分析(EDA)一、赛题理解这里转载自杨煜队伍的分享的思维导图:二...

2020-03-24 19:24:17 358

原创 Datawhale第10期组队学习活动:《动手学深度学习》课程笔记第一次打卡

Datawhale第10期组队学习活动:《动手学深度学习》课程笔记第一次打卡课程页面:https://www.boyuai.com/elites/course/cZu18YmweLv10OeV1 准备1.1代码环境搭建pytorch快速安装【清华源】我之前已经安装anaconda。所以我选择conda模式安装,该方式方便快捷:按照官网(https://pytorch.org/)的方法安...

2020-02-14 18:41:16 264

原创 Python报错TypeError:'str' object does not support item assignment.

Python报错TypeError:‘str’ object does not support item assignment.Python二级刷题中遇到这样一个题:利用random随机库里的函数,生成一个由四个大小写字母组成的验证码,显示在屏幕上。我是想这样实现的:import random as rzmb = 'AaBbCcDdEeFfGgHhIiJjKkLlMmNnOoPpQqRr...

2019-09-10 16:13:40 1846

转载 pandas.read_csv() 报错 OSError: Initializing from file failed

Python版本:Python 3.6pandas.read_csv() 报错 OSError: Initializing from file failed,一般由两种情况引起:一种是函数参数为路径而非文件名称,另一种是函数参数带有中文。import pandas as pdda1=pd.read_csv('F:\\数据源')da2=pd.read_csv('F:\\2.0 数据源\\工程...

2019-08-02 11:15:25 101

原创 调用Graphviz常见问题处理

问题:在Windows环境下anaconda调用graphviz时出现failed to execute [‘dot’, ‘-Tsvg’], make sure the Graphviz executables are on your systems’ PATH环境:Windows,win7,anaconda在此之前,我已经安装了graphviz通过pip的方式pip install g...

2019-07-30 20:15:10 1121

转载 linux终端终止当前进程

linux终端终止当前进程:caffe训练测试出错还终止不了…快捷键:Ctrl+c在命令行下起着终止当前执行程序的作用Ctrl+d相当于exit命令,退出当前shellCtrl+s挂起当前shell(保护作用很明显哦)Ctrl+q解冻挂起的shell再不行就重新连接打开一个终端,reboot linux 或 kill 相关进程。转载fromhttps://blog.csdn....

2019-07-26 11:25:19 883

原创 Linux下ubuntu系统中anaconda安装以及xgboost安装全过程(汇总)

1、anaconda安装1.1安装包下载地址https://repo.anaconda.com/archive/或https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/1.2安装包版本对应关系首先,解释下如何看这张表,比如我们想安装支持python3.6.5的anaconda版本,那么我们先在python3.6一栏下找到3.6.5设个...

2019-07-26 11:20:15 1047

转载 一位数据挖掘成功人士给数据挖掘在读研究生的建议(转)

原文网址:http://www.cognoschina.net/club/viewthread.php?tid=1518关于数据挖掘方面的研究,我原来也走过一些弯路。其实从数据挖掘的起源可以发现,它并不是一门崭新的科学,而是综合了统计分析、机器学习、人工智能、数据库等诸多方面的研究成果而成,同时与专家系统、知识管理等研究方向不同的是,数据挖掘更侧重于应用的层面。因此来说,数据挖掘融合了相当多的...

2019-06-05 14:40:57 1454

原创 python实现斐波那契数列计算有感

学习python遇到一个实现斐波那契数列计算的实例,程序如下:# CalFibonacci.pya, b = 0,1while a &lt; 1000: print(a,end=',') a,b = b,a+b我注意这个程序特别的地方是对a,b赋值时用的“同时赋值”,我不知道这个名词正不正确(笑哭)。后来,我了解到这叫同步赋值语句,同时给多个变量赋值,特点是同步赋值会同时...

2019-02-22 15:09:15 450

原创 Python学习之正则表达式小结

正则表达式是处理字符串的工具。正则表达式的主要功能有:匹配字符串、切分字符串、分组提取子串。功能一:匹配字符串1.1 常用的匹配字符\d 可以匹配一个数字\w 可以匹配一个字母或数字\s 可以匹配一个空格(也包括Tab等空白符)\d{3} 匹配3个数字\d{3,8} 表示3-8...

2019-01-17 13:49:43 207

原创 Python中的学习类出现的object() takes no parameters问题

当学习面向对象的类和实例的时候,我一开始输入书中的代码,结果出现了object() takes no parameters问题,过程如下:class Student(object): def _init_(self,name,score): self.name = name self.score = score def print_score(self): print '%s: ...

2018-12-16 15:42:49 518

原创 “filter()删除 1~100 的素数”与我的一点思考

filter()请尝试用 filter()删除 1~100 的素数def is_prime(n): if n &amp;amp;amp;amp;lt;= 1: return False for s in range(2,n): if n % s == 0: return True return Falseprint filter(is_prim...

2018-12-14 20:19:22 321

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除