- 博客(20)
- 资源 (1)
- 收藏
- 关注
原创 Python 显示实时时间方法
Python 显示实时时间方法:print('时间:', time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())))输出:
2020-03-29 18:24:07 9103
原创 MySql 8.0 连接Navicat客户端报错: 2059 - Authentication plugin 'caching_sha2_password' cannot be loaded
2059 - Authentication plugin 'caching_sha2_password' cannot be loaded:The specified module could not be found.11 11 use mysql select user,host,plugin,authentication_string from ...
2020-03-24 23:10:30 905
原创 Python: 运用selenium爬取下拉框数据 《中国省市县地区代码表》
import pandas as pdfrom selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.wait import WebDri...
2020-03-04 15:00:24 1655 2
原创 Win10 : WMI Provider Host 占用CPU过高解决方案
最新升级了迅雷,发现一运行就风扇哗哗响,同时CPU占用过高.打开任务管理器一查,CPU占用才1.1%,反而 WMI Provider Host 占用达30%,耗电也很明显,得查查这进程什么来头。网上搜索了一圈,找到条大路。1.Windows+R 打开 运行界面,输入 Eventvwr.msc2. 进入事件查看器 -- 应用程序和服务日志 -- Microsoft -...
2020-02-28 13:58:56 86905 11
原创 Python 初级运用 request 和 selenium 爬取漫画
from bs4 import BeautifulSoupfrom selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.wait import WebDriverWaitfrom selenium.webdriver.suppor...
2020-02-19 21:27:58 545 1
原创 Scrapy 安装及基础操作
Scrapy 安装:https://www.lfd.uci.edu/~gohlke/pythonlibs/ 各种whl安装依赖库文件1 . wheel pip install wheel2. lxml https://lxml.de/3. PyOpenssl https://pypi.org/project/...
2019-12-29 23:48:53 164
原创 SQL 1.入门
SQL入门较容易,语法简单,如同用英语一般与数据库进行操作。SQL按照语言功能可以分为以下4个部分:DDL,英文叫做 Data Definition Language,也就是数据定义语言,它用来定义我们的数据库对象,包括数据库、数据表和列。通过使用 DDL,我们可以创建,删除和修改数据库和表结构。 DML,英文叫做 Data Manipulation Language,数据操作语言,我们...
2019-11-28 23:46:07 100
原创 混淆矩阵 confusion matrix
混淆矩阵(confusion matrix)(也称误差矩阵)是一种特殊的, 具有两个维度的(实际和预测)列联表(contingency table),并且两维度中都有着一样的类别的集合。 实际的类别 Total =P + N 正例 positive(P) 负例 negative(N) Prevalence...
2019-11-07 21:32:47 587
原创 pandas.DataFrame.merge() 参数详解
pandas.DataFrame.merge() 官方文档Merge, join, and concatenatepd.merge 是使用数据库风格的连接合并DataFrame或已命名的系列对象。方法:DataFrame.merge(self, right, how='inner', on=None, left_on=None, right_on=None, ...
2019-10-23 22:17:03 13028
原创 pandas 去重函数 drop_duplicates() 和 选取重复行函数 duplicated()
1drop_duplicates() 返回删除重复行后的DataFrame,可以仅选择某些列。索引、时间型索引都是被忽略。pandas.DataFrame.drop_duplicates 官方文档方法:DataFrame.drop_duplicates(self, subset=None, keep='first', inplace=False)参数:subs...
2019-10-20 22:22:21 6575
原创 pandas.read_csv() 参数 names整理
pandas 官方文档names: array-like, default None用于结果的列名列表,如果数据文件中没有列标题行,就需要执行header=None。默认列表中不能出现重复,除非设定参数mangle_dupe_cols=True。Age Gender Education EducationField MaritalStatus...
2019-10-17 14:17:25 7473
原创 pandas.read_csv() 参数 header整理
pandas.read_csv()官方文档header:int, list of int, default ‘infer’指定行数用来作为列名,数据开始行数。如果文件中没有列名,则默认为0,否则设置为None。如果明确设定header=0 就会替换掉原来存在列名。header参数可以是一个list例如:[0,1,3],这个list表示将文件中的这些行作为列标题(意味着每一列有...
2019-10-16 23:21:30 7938
原创 数据分析 回归问题:北京PM2.5浓度回归分析训练赛
这是DC竞赛网的训练赛中的回归问题。详情前往:北京PM2.5浓度回归分析训练赛任务:由给定一段时间内的北京天气相关指数数据和北京PM2.5指数等,建立模型预测接下来一段时间内北京的PM2.5指数。数据:数据主要包括2010年1月1日至2014年12月31日间北京pm2.5指数以及相关天气指数数据。 数据分为训练数据和测试数据,分别保存在pm25_train.csv和...
2019-10-11 20:57:27 5157 3
原创 数据分析 回归问题: 美国King County房价预测训练赛
这是DC竞赛网的一道基础回归问题, 美国King County房价预测训练赛竞赛详细信息:美国King County房价预测训练赛任务:从给定的房屋基本信息以及房屋销售信息等,建立一个回归模型预测房屋的销售价格。数据:数据主要包括2014年5月至2015年5月美国King County的房屋销售价格以及房屋的基本信息。数据分为训练数据和测试数据,分别保存在kc_train....
2019-09-25 19:38:31 3872
原创 Python :selenium 爬取Ajax技术网页,并存入MySQL数据库 和 本地CSV文件
本次爬虫是对 天天基金网的 华泰柏瑞沪深300ETF基金 各年度各季度股票投资明细 爬取。因为直接通过requests 爬取的网页源代码 所爬数据需js渲染,使用selenium的Webdriver,模拟真实浏览器,用来解决JavaScript渲染问题。主程序,使用selenium打开网页,webdriver.Chrome()声明使用的浏览器from seleniu...
2019-09-04 22:40:12 1534
原创 MySQL 获取指定数据库指定表中各字段名
MySQL 安装完成后,在nformation_schema数据库中的COLUMNS 表中 记录了所有数据库的所有表的字段信息。可从此表获取指定数据库指定表中各字段名。SQL: SELECT column_name FROM information_schema.columns WHERE table_name = 'heros';如果有多个数据库内含有所需要的数据表,可以通过指定...
2019-07-16 11:19:19 1187
原创 MySQL 8.0.11版 Windows重置密码
因长久未用,遗忘密码,再次登录时的错误提醒。登录时跳过验证的方式重置root密码的方法:1.以管理员身份进入系统,关闭MySQL服务。2.使用 指令 mysqld --shared-memory --skip-grant-tables 跳过权限验证方式重启MySQL服务:3.再打开一个终端,直接运行MySQL:4. 执行刷新权限的指令 “ FLUSH PR...
2019-07-10 21:25:04 439 1
原创 Pandas 与 Numpy 中的std() var() 区别
方差(Variance):一个随机变量的方差描述的是它的离散程度,也就是该变量离其期望值的距离。将各个误差将之平方(而非取绝对值,使之肯定为正数),相加之后再除以总数。公式如下:pandas官方文档对 var() 定义:DataFrame.var(axis=None,skipna=None,level=None,ddof=1,numeric_only=None,**kwar...
2019-05-29 09:54:41 8189 1
原创 geohash库安装--python版
Geohash是一个Python模块,它提供了在纬度和经度坐标之间解码和编码Geohashes的函数。可调用decode()和encode()函数。源码地址:https://github.com/vinsci/geohashpython3 安装方法: pip install geohash安装成功后,仍无法 import geohash, 提示报错:ImportError: No mo...
2019-05-09 16:19:36 7440 2
2019年中国省市县地区代码.CSV
2020-03-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人