自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 资源 (1)
  • 收藏
  • 关注

原创 Python 显示实时时间方法

Python 显示实时时间方法:print('时间:', time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())))输出:

2020-03-29 18:24:07 9103

原创 MySql 8.0 连接Navicat客户端报错: 2059 - Authentication plugin 'caching_sha2_password' cannot be loaded

2059 - Authentication plugin 'caching_sha2_password' cannot be loaded:The specified module could not be found.11 11 use mysql select user,host,plugin,authentication_string from ...

2020-03-24 23:10:30 905

原创 Mysql 8.0.19 Win7安装教程

MySQL 官方下载

2020-03-24 09:53:24 2578

原创 Python: 运用selenium爬取下拉框数据 《中国省市县地区代码表》

import pandas as pdfrom selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.wait import WebDri...

2020-03-04 15:00:24 1655 2

原创 Win10 : WMI Provider Host 占用CPU过高解决方案

最新升级了迅雷,发现一运行就风扇哗哗响,同时CPU占用过高.打开任务管理器一查,CPU占用才1.1%,反而 WMI Provider Host 占用达30%,耗电也很明显,得查查这进程什么来头。网上搜索了一圈,找到条大路。1.Windows+R 打开 运行界面,输入 Eventvwr.msc2. 进入事件查看器 -- 应用程序和服务日志 -- Microsoft -...

2020-02-28 13:58:56 86905 11

原创 Python 初级运用 request 和 selenium 爬取漫画

from bs4 import BeautifulSoupfrom selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.wait import WebDriverWaitfrom selenium.webdriver.suppor...

2020-02-19 21:27:58 545 1

原创 Scrapy 安装及基础操作

Scrapy 安装:https://www.lfd.uci.edu/~gohlke/pythonlibs/ 各种whl安装依赖库文件1 . wheel pip install wheel2. lxml https://lxml.de/3. PyOpenssl https://pypi.org/project/...

2019-12-29 23:48:53 164

原创 SQL 1.入门

SQL入门较容易,语法简单,如同用英语一般与数据库进行操作。SQL按照语言功能可以分为以下4个部分:DDL,英文叫做 Data Definition Language,也就是数据定义语言,它用来定义我们的数据库对象,包括数据库、数据表和列。通过使用 DDL,我们可以创建,删除和修改数据库和表结构。 DML,英文叫做 Data Manipulation Language,数据操作语言,我们...

2019-11-28 23:46:07 100

原创 混淆矩阵 confusion matrix

混淆矩阵(confusion matrix)(也称误差矩阵)是一种特殊的, 具有两个维度的(实际和预测)列联表(contingency table),并且两维度中都有着一样的类别的集合。    实际的类别   Total =P + N  正例 positive(P) 负例 negative(N) Prevalence...

2019-11-07 21:32:47 587

原创 pandas.DataFrame.merge() 参数详解

pandas.DataFrame.merge() 官方文档Merge, join, and concatenatepd.merge 是使用数据库风格的连接合并DataFrame或已命名的系列对象。方法:DataFrame.merge(self, right, how='inner', on=None, left_on=None, right_on=None, ...

2019-10-23 22:17:03 13028

原创 pandas 去重函数 drop_duplicates() 和 选取重复行函数 duplicated()

1drop_duplicates() 返回删除重复行后的DataFrame,可以仅选择某些列。索引、时间型索引都是被忽略。pandas.DataFrame.drop_duplicates 官方文档方法:DataFrame.drop_duplicates(self, subset=None, keep='first', inplace=False)参数:subs...

2019-10-20 22:22:21 6575

原创 pandas.read_csv() 参数 names整理

pandas 官方文档names: array-like, default None用于结果的列名列表,如果数据文件中没有列标题行,就需要执行header=None。默认列表中不能出现重复,除非设定参数mangle_dupe_cols=True。Age Gender Education EducationField MaritalStatus...

2019-10-17 14:17:25 7473

原创 pandas.read_csv() 参数 header整理

pandas.read_csv()官方文档header:int, list of int, default ‘infer’指定行数用来作为列名,数据开始行数。如果文件中没有列名,则默认为0,否则设置为None。如果明确设定header=0 就会替换掉原来存在列名。header参数可以是一个list例如:[0,1,3],这个list表示将文件中的这些行作为列标题(意味着每一列有...

2019-10-16 23:21:30 7938

原创 数据分析 回归问题:北京PM2.5浓度回归分析训练赛

这是DC竞赛网的训练赛中的回归问题。详情前往:北京PM2.5浓度回归分析训练赛任务:由给定一段时间内的北京天气相关指数数据和北京PM2.5指数等,建立模型预测接下来一段时间内北京的PM2.5指数。数据:数据主要包括2010年1月1日至2014年12月31日间北京pm2.5指数以及相关天气指数数据。 数据分为训练数据和测试数据,分别保存在pm25_train.csv和...

2019-10-11 20:57:27 5157 3

原创 数据分析 回归问题: 美国King County房价预测训练赛

这是DC竞赛网的一道基础回归问题, 美国King County房价预测训练赛竞赛详细信息:美国King County房价预测训练赛任务:从给定的房屋基本信息以及房屋销售信息等,建立一个回归模型预测房屋的销售价格。数据:数据主要包括2014年5月至2015年5月美国King County的房屋销售价格以及房屋的基本信息。数据分为训练数据和测试数据,分别保存在kc_train....

2019-09-25 19:38:31 3872

原创 Python :selenium 爬取Ajax技术网页,并存入MySQL数据库 和 本地CSV文件

本次爬虫是对 天天基金网的 华泰柏瑞沪深300ETF基金 各年度各季度股票投资明细 爬取。因为直接通过requests 爬取的网页源代码 所爬数据需js渲染,使用selenium的Webdriver,模拟真实浏览器,用来解决JavaScript渲染问题。主程序,使用selenium打开网页,webdriver.Chrome()声明使用的浏览器from seleniu...

2019-09-04 22:40:12 1534

原创 MySQL 获取指定数据库指定表中各字段名

MySQL 安装完成后,在nformation_schema数据库中的COLUMNS 表中 记录了所有数据库的所有表的字段信息。可从此表获取指定数据库指定表中各字段名。SQL: SELECT column_name FROM information_schema.columns WHERE table_name = 'heros';如果有多个数据库内含有所需要的数据表,可以通过指定...

2019-07-16 11:19:19 1187

原创 MySQL 8.0.11版 Windows重置密码

因长久未用,遗忘密码,再次登录时的错误提醒。登录时跳过验证的方式重置root密码的方法:1.以管理员身份进入系统,关闭MySQL服务。2.使用 指令 mysqld --shared-memory --skip-grant-tables 跳过权限验证方式重启MySQL服务:3.再打开一个终端,直接运行MySQL:4. 执行刷新权限的指令 “ FLUSH PR...

2019-07-10 21:25:04 439 1

原创 Pandas 与 Numpy 中的std() var() 区别

方差(Variance):一个随机变量的方差描述的是它的离散程度,也就是该变量离其期望值的距离。将各个误差将之平方(而非取绝对值,使之肯定为正数),相加之后再除以总数。公式如下:pandas官方文档对 var() 定义:DataFrame.var(axis=None,skipna=None,level=None,ddof=1,numeric_only=None,**kwar...

2019-05-29 09:54:41 8189 1

原创 geohash库安装--python版

Geohash是一个Python模块,它提供了在纬度和经度坐标之间解码和编码Geohashes的函数。可调用decode()和encode()函数。源码地址:https://github.com/vinsci/geohashpython3 安装方法: pip install geohash安装成功后,仍无法 import geohash, 提示报错:ImportError: No mo...

2019-05-09 16:19:36 7440 2

2019年中国省市县地区代码.CSV

中国城乡代码格式详解 第1-2位表示省(自治区、直辖市、特别行政区)。 第3-4位表示市(地级市、自治州、盟及国家直辖市所属市辖区和县的汇总码)。其中,01-20,51-70表示省直辖市;21-50表示地区(自治州、盟)。 第5-6位表示县(市辖区、县级市、旗)。01-18表示市辖区或地区(自治州、盟)辖县级市;21-80表示县(旗);81-99表示省直辖县级市。 第7-9位表示镇(乡镇、街道办事处、乡、特殊区、特殊农场、特殊公司)。 第9-12位表示村(农村村委会、社区居委会、虚拟社区、特殊团部、特殊连)。 例如代码:320508019044,32代表江苏省,05代表苏州市,08代表姑苏区,019代表金阊街道,044代表养育巷社区居委会。 数据量 省份数据:31,城市数量:342,区县数量:3272

2020-03-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除