自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 资源 (2)
  • 收藏
  • 关注

转载 es-head插件安装踩坑记录

es-head

2022-11-27 23:25:03 171 1

原创 记录Elasticsearch的安装流程

es的安装

2022-11-02 15:32:36 465

原创 node js<18.9.0>安装

nodejs安装

2022-09-19 13:38:28 1652 1

原创 centos同步时间

centos同步时间

2022-09-05 15:48:17 185

原创 pycharm 使用 gitee /github

pycharm 如何使用gitee

2022-06-20 14:28:23 150

原创 redis安装

2022-01-13 17:25:47 216

原创 docker Centos7镜像无法联网

docker镜像启动之后,ping外网的IP无法连通,丢失率100%启动命令的问题,启动的时候需要添加网络策略参数 --net ,建议启动命令如下:docker run --net host --privileged -itd centos:7 /usr/sbin/init进入刚刚创建的docker镜像:docker exec -it <容器-id> /bin/bash...

2021-11-02 10:53:43 1640

原创 supervisor常用命令

1、更新新的配置到supervisordsupervisorctl update2、重新启动配置中的所有程序supervisorctl reload3、启动某个进程(program_name=你配置中写的程序名称)supervisorctl start program_name4、查看正在守候的进程supervisorctl5、停止某一进程 (program_name=你配置中写的程序名称)supervisorctl stop program_name6、重启某一进程 (pro

2021-10-12 14:52:49 1183

原创 服务器内存中加载超大型数据集并在 Django Web 应用程序上的不同请求之间共享

问题:开发了一个的应用程序。当它启动时,它会一次性加载一些数据表。大约 4 GB 的数据。然后,连接到应用程序的人可以使用该界面并使用这些数据。解决方式:版本要求:django>=1.7、AppConfig.ready()方法,仅加载一次。找到django下的apps.pyfrom django.apps import AppConfigimport pandas as pdclass MappingsysConfig(AppConfig): name = 'xxx'

2021-07-08 17:20:53 141

原创 django 搜索功能实现

定义搜索页(先进搜索页好看)ps:搜索页接收input传过来的值,渲染到search页面在search.html 拼接跳转网址,直接跳转到目标页定义index页ps:获取url链接上的search值,去数据库查询,返回查询结果。分页操作:推荐代码:https://mozillazg.com/2013/01/django-pagination-by-use-paginator.html然后把search值、分页值、数据库返回值、渲染到index页面search值用于page翻页绑定

2021-05-19 16:53:54 256 1

翻译 Python多线程操作

Python多线程操作什么是线程:线程(Thread)也称为轻量级进程。它是操作系统可执行操作调度的最小单位。它包含在过程中,并且是过程中的实际操作单元。线程不拥有系统资源,而仅具有运行中必不可少的一些资源,但是它可以与属于同一进程的其他线程共享该进程拥有的所有资源。一个线程可以创建和取消另一个线程,并且同一进程中的多个线程可以并发执行。举一个简单的例子来理解:假设有一个7 * 24小时不间断的工厂。由于功率有限,一次只能使用一个车间。当一个生产车间投入生产时,其他生产车间将关闭。在这里我们可以了解

2021-05-19 11:29:12 354

原创 从Python中的多个线程更新文件 --- 使用锁定在多个线程之间正确共享资源

1.简介多线程程序中的资源管理是一个棘手的情况。举例来说,您有一个计数器变量,该变量由多个线程读取和修改。如果您未采取适当的措施,则可能会读取和/或传播不一致的值。这会导致细微且难以调试的错误。管理跨线程对共享资源的访问的一种解决方案是使用锁。线程必须在访问共享资源之前获取锁。如果另一个线程正在使用该资源,则第一个线程将等待直到锁被释放。当多个线程正在等待一个锁时,其中一个线程将被唤醒并能够获取该锁。让我们检查一下如何从多个线程读取和写入文件。我们有一个带有多个工作线程的应用程序,每个工作线程都需要读

2021-05-19 11:09:13 241

原创 codeforces crawl-demo

import requests,os,csv,refrom lxml import etreeclass codeforces(object): global prefix,syspath prefix = 'https://codeforces.com' syspath = "D:\\szs\\opyion" """ 请求主页 return: 分页链接 """ @staticmethod def index_page(x): content = reques

2021-05-12 15:02:20 118

原创 python 文件压缩(压缩一个文件夹下的所有文件)

直接代码:from zipfile import ZipFileimport osdef get_all_file_paths(directory): # 初始化文件路径列表 file_paths = [] for root, directories, files in os.walk(directory): for filename in files: #连接字符串形成完整的路径 filepath = os.

2021-04-29 16:24:38 2194

原创 python文本预处理+获取值

准备数据集**.csv代码示例:import requestsimport reimport pandas as pdfrom bs4 import BeautifulSoupimport nltkimport matplotlib.pyplot as pltfrom nltk.corpus import gutenbergimport numpy as npimport unicodedatafrom nltk.corpus import wordnetfrom nltk.ste

2021-04-28 16:52:51 189 1

原创 python超大型数据集分割

直接上源码import pandas as pdimport numpy as npimport glob,osimport openpyxlpath =r'001\信息.xlsx' #文件路径chunksize = 5000 #切分行数i = 0df = pd.read_excel(path,engine='openpyxl')print('切分总数',len(np.array_split(df, len(df) // chunksize)))for chunk in np.a

2021-04-28 16:47:22 369

原创 python+mysql实现自动化 新建表+导入mysql

setp1:导包import pymysql setp2:以你比较深厚的mysql基础功底,徒手写一个建表语句:setting = ' (序号 INT NOT NULL PRIMARY KEY auto_increment,主分类 VARCHAR(500),次分类 VARCHAR(500),方向分类 VARCHAR(300),主仓位 VARCHAR(500),基金名称 VARCHAR(500),代码 VARCHAR(500),风险收益比 VARCHAR(500),当前推荐度 VARCH

2021-04-28 15:52:58 580

原创 Flask+Vue 前后端分离项目使用nginx+uwsgi部署

uwsgi 配置文件nginx配置文件位置配置内容vue配置root是vue项目位置后台项目配置因为是前后端分离项目 所以需要两个server

2021-04-25 15:05:45 649 1

原创 centos部署Flask项目 -----uwsgi启动

第一步:登录阿里云服务器在根目录下创建文件夹(个人习惯随意建)第二步:进入文件夹,输入python,查看是否有python环境,一般会默认带个python2.7,升级到3.6就行,没有的就加虚拟环境吧第三步:把Flask项目用ftp传到你建的文件夹,然后运行一下,看能否跑通,运行方式和线下一样(python ***.py runserver)第四步:能跑通的话pip install uwsgi 安装这个包和安装requirement.txt那些包,跑不通的话再调调第五步:在你的项目启动文件相同目

2021-04-23 22:57:25 378

原创 安装nginx

1 编译nginx时make报错[-Werror=implicit-fallthrough=]的解决方案打开 nginx的安装目录/objs/Makefile,去掉CFLAGS中的-Werror,再重新make还有一个问题忘了是什么了。。用vi编辑器打开一个文件注释一行就行了安装nginx推荐 博文https://www.cnblogs.com/boonya/p/7907999.html...

2021-04-23 11:23:00 123

原创 missing optional dependency ‘tables‘. use pip or conda to install tables

写入hd5文件报错:missing optional dependency ‘tables’. use pip or conda to install tables*解决方式:pip install tables==3.5.2*

2021-04-22 22:12:54 6654 3

原创 Pthon绘制动漫(附turtle方法介绍)

本文采用Python中的绘图turtle程序包 绘制动漫人物一、安装turtle使用pip进行安装的时候会返回错误:在网上查阅资料各种说法都有有的是升级两个包,有的是安装Visual C++ 14.0在这里我采用的是在公众号上找到的一种方法(亲测很好用~~)1,从网上下载 turtle 程序包,下载链接为:https://files.pythonhosted.org/packages/ff/f0/21a42e9e424d24bdd0e509d5ed3c7dfb8f47d962d9c04.

2020-08-05 10:56:47 1208

原创 Python集合(set)

Python集合可以使用大括号 { } 或者set()函数创建集合 注意:创建一个空集合必须用set()而不是 { },因为 { } 是用来创建一个空字典。集合对象是一组无序排列可哈希的值,集合成员可以做字典中的键。集合用in和not in操作符检查成员,以len()內建函数得到集合的基数(大小),用for循环迭代集合的成员。但是因为集合本身是无序的,不可以为集合创建索引或执行切片(slice)操作,也没有键(keys)可用来获取集合中元素的值。set和dict一样,只是没有value,相当

2020-08-03 14:22:30 836

原创 二维数组的高效查找(Python)

二维数组中的查找题目:在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。import numpy as npdef number(array,data): if array == None: return False i = 0 rows...

2020-04-24 14:14:52 302

原创 Python数组排序的基本操作+小例子

数组的排序sort() 和 sorted()相对于sort()来说,sorted的应用更加广泛sorted() 作用于任意可迭代的对象而 sort() 一般作用于列表sort():x = [4, 6, 2, 1, 7, 9]x.sort()print(x)打印结果为 [1, 2, 4, 6, 7, 9] 从小到大排序sort()提供了两个可选参数,分别是 key和rever...

2020-04-24 10:07:53 1042

原创 Python实现HTML网址转换为pdf图片

该功能的实现主要依赖于Python中的pdfkit模块1.安装方式pip install PyPDF2 #Python下的PDF工具pip install requests #网络请求包pip install beautifulsoup4 #用于操作 html 数据pip install pdfkit #wkhtmltopdf 的Python封装包2.安装wkhtmltopdfs...

2020-04-23 14:16:46 449

原创 公众号历史文章爬虫

所需工具: python3.6 fidder抓包工具 Mysql数据库第一步: 1.登录手机版微信,搜索到所爬取的公众号、在电脑端打开历史消息 2.打开fidder抓包工具、清除session、准备抓包 3.打开公众号历史信息界面向下滑动、滑动到第二页出现带有json标识的网址第二步(点击json查看json数据是否和公众号文章符合)...

2020-04-23 11:39:20 576

通过抓包工具实现公众号文章爬虫

要求会抓包的使用!!!可转换为pdf

2020-04-23

内容相似度算法分析.py

该代码使用TF-IDF模型,可做内容相似度匹配,可做简易版论文查重使用, 注:代码我也是借鉴别人+自己改装

2020-04-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除