自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(112)
  • 资源 (10)
  • 收藏
  • 关注

原创 zip,itertools 元素个数与最短/长的列表一致

itertools模块包含创建高效迭代器的函数,这些函数的返回值不是list,而是iterator(可迭代对象),可以用各种方式对数据执行循环操作.

2023-04-18 15:19:58 216 1

原创 linux常见操作(实际生产高频命令汇总)

linux常见操作(实际生产高频命令汇总)

2021-12-06 15:35:10 812

原创 好玩的pywebio,搭建简单的web页面,超简单

本文demo:http://81.70.49.226:8088/pywebio文档(包含pycharts):PyWebIO — PyWebIO 1.4.0 文档我想很多人用Python就是用pandas进行数据分析,并且你大概率每天就用到pandas那几个函数处理结构大致相似的数据。每天重复写着同样的代码,很辛苦,于是就会有人想到用Pyinstaller进行打包,但是打包的痛苦,尤其是各种乱七八糟的报错只能说试过的都懂。但你有想过将要打包的功能,做到网页上去吗?这样只要有个...

2021-12-01 15:50:23 6460 6

原创 python打印日志(控制台内容输出)

你是否遇到过这样几个问题:1、获取控制台打印的内容,并且想要保存下来2、代码本来运行的好好的,但是由于新增内容,出现bug,加入了异常处理(try...),把不满足条件的先过滤掉、这时需要查看过滤的内容并且保存文件3、。。。。。。其实打印日志很简单,只需要在你的代码最前面加入短短几行代码就可以轻松搞定。

2021-11-25 09:23:39 4319 2

原创 mysql,postgresql,oracle,hive元数据库等查看表结构信息

我们在查询表结构的时候,从information_schema里面获取,单独语句只能查询部分信息,比如:information_schema.tables 和information_schema.columns 。前者只能获取表相关数据,无法显示字段详信息,后者只能获取字段详细信息,无法获取表以及库的信息。现在将两者结合在一起,获取需要的全部信息本脚本目前只针对mysql和pg库,其他数据库后续会有补充。本脚本可以快速查询你想要的整个数据库的表结构,如图:mysql:注意:脚本需

2021-11-11 16:37:37 3420

原创 csv文件格式入库

mysql版本:大家可能遇到过这样一个情况:给过来一个csv文件,数据量较大时打开费劲,不好转化excel,还容易出错,关键还会遇到文件编码问题这篇文章只用几行简单的代码,解决以上遇到的问题。import pandas as pdimport numpy as npfrom sqlalchemy import create_engineimport timefrom datetime import datetimebegin=time.clock()print('数据开始转换

2021-09-08 10:08:32 350 2

原创 查看MySQL数据库大小的方法总结

进入information_schema 数据库(存放了其他的数据库的信息)mysql> use information_schemaReading table information for completion of table and column namesYou can turn off this feature to get a quicker startup with -ADatabase changed第一种情况:查询所有数据库的总大小,方法如下:mysql> se.

2021-09-02 17:59:24 1730

原创 python 爬取墨迹天气预报(超简单!该代码用于实际生产)

爬取墨迹天气信息用于实际生产(为了展示稍有修改)# -*- coding: UTF-8 -*-# @Time :2021/2/8 9:41# @Author :Liuzheng# @Email :1540234613@qq.comimport pymysqlimport requestsimport jsonimport datetime# from fake_useragent import UserAgentrequests.DEFAULT_RETRIES = 100#增加重

2021-03-18 16:11:08 1429 2

原创 python框架scrapy实现增量爬虫(含redis)

本案例以信用中国武清开放数据为例redis相关知识详见:https://blog.csdn.net/weixin_44675384/article/details/90723634?spm=1001.2014.3001.5501spider部分:import scrapyimport jsonfrom wq_hhb_heimd.items import WqHhbHeimdItemimport redisimport hashlibclass HhbHeimdSpider(scrapy

2021-03-15 18:02:22 510

原创 超简单!批量word文档转pdf格式

-- coding: UTF-8 --@Author :Liuzheng@Email :1540234613@qq.comfrom win32com.client import gencachefrom win32com.client import constants, gencacheimport os#创建PDFdef createPdf(wordPath, pdfPath):“”"word转pdf:param wordPath: word文件路径:param pdfPath:

2020-12-14 14:11:52 649 2

原创 python基础知识整理(持续更新)

"""切片负数开头,结尾均不包含 及 左开右开,留截取相交部分正数 左闭右开 留截取部分"""a='hello world'print(a[::-1])#dlrow ollehprint(a[-8:5])#lo 从后往前数,从前往后截取print(a[0:-8])#hel 从前往后数,从前往后截取print(a[-1:-8:-2])#drwo 从后往前数,步长为2print(a[0:-6])#helloprint(a[-6:7])#wprint(a[2:-6])#llo

2020-09-10 22:07:10 281

原创 巧妙运用python对oracle数据库进行数据分析、数据探查!

本文运用python语言对Oracle数据库进行分析,主要采用sql语句结合业务对数据进行分析结果展示:# -*- coding: UTF-8 -*-import xlrd,xlwtimport pandas as pdimport cx_Oracleimport osos.environ['NLS_LANG']='SIMPLIFIED CHINESE_CHINA.ZHS16GBK...

2020-05-07 20:37:17 1721

原创 一张图弄明白:从零维到十维空间……给大神跪了!

来源:商老师的设计学堂原文链接:https://www.sohu.com/a/116444282_482877本文稍有修改零维▼让我们从一个点开始,和我们几何意义上的点一样,它没有大小、没有维度。它只是被想象出来的、作为标志一个位置的点。它什么也没有,空间、时间通通不存在,这就是零维度。一维空间▼好的,理解了零维之后我们开始一维空间。已经存在了一个点,我们再画一个点。两点之间连一...

2020-03-04 11:30:52 4915 1

原创 全世界都爱看:numpy基础知识必知必会!

```pythonimport numpy as np#创建一个一维数组array1=np.array([1,2,3,4,5])#print(array1)#创建一个二维数组array2=np.array([[1,2,3,4],[4,5,6,7],[5,6,7,8]])print(array2)#查看二维数组结构print(array2.shape)#查看二维数组类型pr...

2020-02-29 17:30:42 293

原创 基于朴素贝叶斯算法的文本评价分析

import pandas as pdimport numpy as npimport jiebaimport matplotlib.pyplot as pltfrom sklearn.feature_extraction.text import CountVectorizerfrom sklearn.naive_bayes import MultinomialNB"""文本评价分类...

2019-07-03 19:41:28 862

原创 基于TensorFlow框架验证码识别分析

项目图例:项目流程:1 读取验证码的数据文件image_batch, label_batch=read_and_decode()2全连接网络模型建立#一层全连接#[100,20803] 权重[20803,426]+偏置[104]=[100,104]y_predict=fc_model(image_batch)#print(y_predict)#Tensor(“model/add:...

2019-07-03 16:44:29 690 1

原创 TensorFlow基础及数据读取

import tensorflow as tf#去警告import osos.environ['TF_CPP_MIN_LOG_LEVEL']='2'"""初始tensor"""#定义一个常量# a=tf.constant(3.0,name='a')# b=tf.constant(3.0,name='b')## ab_sum=tf.add(a,b)# print(a)# ...

2019-07-01 20:58:50 229

原创 基于量化交易回测的金融股票案例基础知识

1量化交易定义量化交易是指以先进的数学模型替代人为的主观判断,利用计算机技术从庞大的历史数 据中海选出能带来超额收益的多种“大概率”事件以制定策略。它极大的降低了市场波动给 投资者情绪带来的影响,避免在市场极度狂热或者悲观的情况下做出非理性的投资决策。2量化交易分类趋势性交易: 适合一些主观交易的高手,用技术性指标作为辅助工具在市场中如鱼得水的,但如果只 用各种技术指标或指标组合作为核心算法...

2019-06-28 20:18:09 1204

原创 基于量化交易回测的金融股票案例分析

本案例涉及到大量金融方面知识,大家可以自行去网上搜寻准备阶段:因子选取很重要,会直接影响量化的结果准确性。这里省去寻找因子过程因子已经提前准备好:context.weights = np.array([ 0.02953221, -0.04920124, -0.10791485, 0.00801783, -0.03613599, 0.1310877 , -0.03030564, 0.4...

2019-06-28 19:20:59 1682

原创 基于线性回归算法房价预测分析

import pandas as pdimport numpy as npimport matplotlib.pyplot as plt#加载数据 sklearn 自带from sklearn.datasets import load_bostonfrom sklearn.model_selection import train_test_splitfrom sklearn.p...

2019-06-27 21:44:21 4594 2

原创 常见机器学习算法及其原理汇总(面试必备)

监督学习与非监督学习监督学习有训练集与测试样本,在训练中找规律,有目标值和特征值非监督学习没有训练集,只有一组数据,在组内寻找数据分类与聚类聚类分析是一种分类的多元统计分析方法。按照个体或样品的特征将它们 分类,使同一类别内的个体具有尽可能高的同质性,而不同类别 之间则应具有尽可能高的异质性。聚类分析在没有训练集的条件下把样本划分若干类,自动标记确定分类分析类是确定的要做的是将每条记录...

2019-06-27 21:41:51 4782

原创 基于逻辑回归算法癌症症状预测分析

逻辑回归介绍逻辑回归(Logistic Regression)是机器学习中的一种分类模型,虽然名字中带有回归, 就是因为它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。逻辑回归应用场景##3 * 广告点击率 * 是否为垃圾邮件 * 是否患病 * 金融诈骗 * 虚假账号 通过上面的应用,我们可以发现其中的特点,那就是都属于两个类别之间的判断。逻辑回归 就是解决二分类问题的...

2019-06-27 19:55:13 2192 4

原创 基于朴素贝叶斯算法及案例分析

import pandas as pdimport numpy as npimport jiebaimport matplotlib.pyplot as pltfrom sklearn.feature_extraction.text import CountVectorizerfrom sklearn.naive_bayes import MultinomialNB"""文本评...

2019-06-26 21:07:13 1899

原创 k-近邻算法自实现和sklearn方法

自实现 import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.neighbors import KNeighborsClassifier"""电影分类数据类型分析 方法自实现k-近邻方法"""#加载数据move=pd.read_excel('./电影分类数据....

2019-06-25 20:34:12 341

原创 超简单快速排序源码

def quicksort(nums): if len(nums)<=1: return nums #定义一个左列表 left=[] #定义一个右列表 right=[] #定义一个基准值 base=nums.pop() #循环遍历原数组 for i in nums: if i<bas...

2019-06-22 17:01:39 902

原创 某连锁超市数据分析

#某超市连锁分析order=pd.read_csv('./order-14.3.csv',encoding='gbk')# print(order.columns)#数据处理,去重#这里去掉销量为负值的行a=order['销量']>0data=order.loc[a,:]#取出销量大于0的行对应的所有列#1哪些类别比较畅销#对类别进行分组,之后对销量进行排序# xiao=d...

2019-06-20 20:50:51 3687 2

原创 pandas基础及操作

import pandas as pdimport numpy as np#加载数据detail=pd.read_excel('./meal_order_detail.xlsx')# print(detail.columns)#pandas 数据分析# print(detail['amounts'].max())# print(detail['amounts'].min())#...

2019-06-19 20:56:27 1248

原创 numpy矩阵与通用函数

Numpy是用于数据科学计算的基础,不但能够完成科学计算任务,还能被用作高效地多维数据容器。用于存储和处理大型矩阵。Python提供了一个array模块,和list不同,它直接保存数值,但是由于Python 的array模块不支持多维,也没有各种运算函数。Numpy 弥补了这一遗憾。Numpy提供了一种存储单一数据类型的多维数组——ndarrayimport numpy as n#创...

2019-06-14 21:20:20 1408

原创 numpy数组类型及属性

# arr=np.array([[1,2,3],[4,5,6],[7,8,9]])# print('arr',arr)# print('arr维度',arr.ndim)# print('arr大小',arr.size)# print('arr形状',arr.shape)# print('arr类型',arr.dtype)# print('arr元素大小',arr.itemsize)...

2019-06-13 21:02:36 2222

原创 Tornado入门与实践(包含接口小项目)

使用pip安装:pip install tornado验证是否安装成功,输出tornado的版本号克隆Tornado的源代码先注册一个api的管理工具Api的管理工具:https://apizza.net/pro/#/注册完然后登陆进去:点击右上角新建项目建议直接下载apizzaTornado构建RESTful应用1什么是RESTful全称:Representational...

2019-06-12 20:52:09 2095

原创 MongoDB操作及其相关指令

一、NoSQL简介NoSQL(NoSQL = Not Only SQL ),意即"不仅仅是SQL"。在现代的计算系统上每天网络上都会产生庞大的数据量。这些数据有很大一部分是由关系数据库管理系统(RDMBSs)来处理。 1970年 E.F.Codd’s提出的关系模型的论文 “A relational model of data for large shared data banks”,这使得数...

2019-06-10 19:15:12 1695

原创 nginx操作与部署

一、安装python需要的依赖包yum install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-develgcc make二、python解释器安装1.下载python解释器wget https://www.python.org/ftp/python/3.6.2/...

2019-06-10 18:59:25 1313

原创 Git指令及其操作

1创建一个空目录:mkdir2显示当前目录路径:pwd3把当前目录变成可以管理的git仓库: git init4把文件添加到暂缓区:git add ./git add xx5提交文件:git commit -m ‘描述’6查看仓库状态:git status7查看xx 文件修改了哪些内容:git diff xx8查看历史记录:git log9返回上个版本:git reset --h...

2019-06-03 18:59:58 1286

原创 爬虫:链家房产租房信息深度爬取(运用redis和mysql)

import redis import requests from lxml import etree from fake_useragent import UserAgent import re import pymysqlclass CityArea: def __init__(self): # 初始化redis连接 ...

2019-05-31 22:24:42 1479

原创 银行家算法:原理

银行家算法原理银行家算法是避免死锁的一种重要方法。 操作系统按照银行家制定的规则为线程分配资源,当线程首次申请资源时,要测试该线程对资源的最大需求量,如果系统现存的资源可以满足它的最大需求量则按当前的申请量分配资源,否则就推迟分配。当线程在执行中继续申请资源时,先测试该线程已占用的资源数与本次申请的资源数之和是否超过了该线程对资源的最大需求量。若超过则拒绝分配资源,若没有超过则再测试系统现存的资...

2019-05-31 22:17:14 6598 1

原创 进程、线程:多线程开发可能遇到的问题及其解决方法

线程的几种状态:线程原理小结:1.每一个线程一定会有一个名字,如果用户没有指定名字,系统会为线程指定一个名字(Thread-1/2/3…)。2.当线程的run方法结束的时候该线程完成任务。3.我们程序员无法控制线程调试的顺序。CPU根据当时的状态自行决定。4.线程的几种状态。线程间的变量共享执行结果分析:其中的一种,其他可自行分析。in work2,g_num=102 此时...

2019-05-31 22:12:59 3175

原创 redis:基础知识及其操作指令

Redis环境配置下载安装地址: https://github.com/MicrosoftArchive/redis/releases解压文件到指定的目录,D:\ChromeCoreDownloads\Redis-x64-3.2.100(根据自己情况定)将该目录加入到环境变量中 :计算机—属性—高级系统设置—高级—环境变量—找到path,在末尾添加再打开cmd输入redis-ser...

2019-05-31 22:01:48 1208

原创 爬虫:深度爬取网易云音乐所有歌手及其对应热门歌曲

先根据分类,从字母搜索import requestsfrom lxml import etreefrom fake_useragent import UserAgentclass Music: def __init__(self): self.count = 1 def __call__(self, *args, **kwargs): ...

2019-05-30 09:27:40 3105

原创 爬虫:爬取糗事百科数据

import requestsfrom lxml import etreefrom fake_useragent import UserAgentclass Qiu: def __init__(self): self.count = 1 def __call__(self, *args, **kwargs): self.get_max...

2019-05-28 09:34:22 1357

原创 爬取猫眼电影首页榜单电影信息

import requests,reclass Mao(object): def __call__(self, *args, **kwargs):#类的对象当做函数使用的时候触发 self.run() def run(self): #获取猫眼的HTML信息 base_url='https://maoyan.com/board...

2019-05-27 14:00:21 1740

数据标准规范代码集(各个地区10000+)

适合数据治理等专业人士参考的数据标准规范代码集,涵盖各个地区,包含超过10000个条目。多个大类、上万数据标准。 数据标准体系规范是指为了确保数据在不同系统之间能够准确、一致地交换和共享,制定的一套标准化的规则和指导原则。数据标准体系规范通常包括数据命名规范、数据格式规范、数据存储规范、数据传输规范等内容,旨在提高数据质量、减少数据错误和混乱,从而提高数据管理和利用的效率。 在实际应用中,数据标准体系规范通常由组织内部的数据管理团队或数据管理专家制定,以确保组织内的数据管理工作能够按照一定的规范进行。同时,数据标准体系规范也需要不断更新和维护,以适应不断变化的业务需求和数据环境。

2024-04-02

2023最新数据库系统工程师知识点整理(包含上午试题和下午部分试题内容,资源持续更新中)

2023最新数据库系统工程师知识点整理(包含上午试题和下午部分试题内容,资源持续更新中) 职业前景 随着政府电子政务信息系统的广度、深度运用,数据库系统工程师将作为中高端人才大量运用于系统的数据库管理、分析、设计。各银行、企业ERP的大型运用数据库设计及管理。同时电子商务的快速增长,促成了大量的电子商务数据库设计、数据管理、挖掘分析人员就业。 资格的有效性 通过考试并获得相应级别计算机专业技术资格(水平)证书的人员,表明其已具备从事相应专业岗位工作的水平和能力,用人单位可根据《工程技术人员职务试行条例》有关规定和工作需要,从获得计算机专业技术资格(水平)证书的人员中择优聘任相应专业技术职务。取得初级资格可聘任技术员或助理工程师职务;取得中级资格可聘任工程师职务;取得高级资格可聘任高级工程师职务

2023-06-08

python 基础面试常见汇总

python 基础面试常见汇总,本人经历整理所得。适合提升基础知识的群体参考。 包含各种概念、算法(含有源代码),还有部分从网络上搜集整理所得。 其它资源参考:https://liuzheng520.blog.csdn.net/ Python由荷兰数学和计算机科学研究学会的吉多·范罗苏姆于1990年代初设计,作为一门叫做ABC语言的替代品。 Python提供了高效的高级数据结构,还能简单有效地面向对象编程。Python语法和动态类型,以及解释型语言的本质,使它成为多数平台上写脚本和快速开发应用的编程语言, 随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发。

2023-01-30

最新全国各省五级行政区划代码及名称数据

本资源包含全国各地行政区划代码5级数据

2022-07-21

数据分析主要成果模板汇总.zip

本文档里面包含了丰富的,可供数据分析交付的文件

2021-12-02

政务术语资源.xlsx

本文档记录了常见的政务术语信息,适用于从事政务项目工作人员

2021-12-02

数据质量检查记录模板.xlsx

数据质量检查记录

2021-12-02

数据清洗规则模板.xlsx

数据清洗规则

2021-12-02

数据稽核规则模板.xlsx

本文档适用于对数据进行稽核、记录

2021-12-02

docker_practice.pdf

本文档适合初学者以及从事docker开发的工程师,深入浅出的介绍了docker全生命周期

2021-11-23

小小争520_Python面试宝典(完整版).pdf

面试宝典,值得拥有

2021-07-08

Python课程讲义.pdf

本文档适合python初学者和想要巩固python基础知识的人

2021-07-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除