![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
风启新尘
努力生活,坚持不懈
展开
-
本机安装两个python环境
python安装教程原创 2023-03-01 16:50:06 · 266 阅读 · 1 评论 -
删除本地redis表
删除库中表名为数字的所有表。原创 2023-02-14 14:09:03 · 232 阅读 · 0 评论 -
python语音转文字
语音转文本原创 2023-02-02 13:30:33 · 1022 阅读 · 0 评论 -
module ‘frida‘ has no attribute ‘get_remote_device‘
module 'frida' has no attribute 'get_remote_device'原创 2022-08-18 14:46:01 · 969 阅读 · 4 评论 -
安装Frida工具
安装的frida版本原创 2022-08-18 14:36:00 · 1236 阅读 · 2 评论 -
docker+splash安装使用
记录一下教程没问题,已经照着安装成功https://www.jb51.net/article/219166.htm原创 2022-05-31 12:21:08 · 2262 阅读 · 0 评论 -
mitmproxy安装和使用
安装教程,参考这个两个教程https://blog.csdn.net/agrapea/article/details/124660959?https://blog.csdn.net/liujingliuxingjiang/article/details/121633927?switchyomega的使用插件下载安装点击选项随便起名,然后创建输入ip地址和端口号,点击应用先启动mitmproxy ,启动之后,开启刚才设置的代理。可以抓包了...原创 2022-05-27 11:53:50 · 786 阅读 · 2 评论 -
linux安装最新python版本
第一步,先别卸载自带的2.7版本然后按照下面教程来就行,已测试,根据教程安装成功。https://blog.csdn.net/weixin_44621343/article/details/114707923?需要注意的是,在下载依赖包时,遇到下图问题用kill -s 9把pid旁边的进程杀了就行。因为yum被其他进程占用,所以无法下载。...原创 2022-05-24 20:44:50 · 472 阅读 · 0 评论 -
snowflake安装教程
pip3 install pysnowflake#########雪花算法############## 首先安装库# pip3 install pysnowflake# 安装完成后,就可以在本地命令行启动snowflake服务# snowflake_start_server --worker=1# # 生成唯一idimport snowflake.clientprint(snowflake.client.get_guid())# 4589032814791368705# 解析成二进.原创 2022-05-06 10:22:11 · 4625 阅读 · 1 评论 -
python异步爬虫
# coding:utf-8# __auth__ = "maiz"import osimport reimport randomimport asyncioimport aiofilesimport aiohttpfrom datetime import datetimefrom lxml import etreeclass Spider(object): headers = { 'User-Agent': 'Mozilla/5.0 (Win原创 2022-05-03 16:36:18 · 2580 阅读 · 0 评论 -
python补字典空白字段
def mush(postItem): values = ( postItem.get('easy', '详见公告'), postItem.get('just', '详见公告'), postItem.get('commune_id', 24621045042524160) ) print(values)postItem = {"easy": 38,}mush(postItem)```原创 2022-03-03 14:56:37 · 508 阅读 · 0 评论 -
Python写入数据到CSV文件
import csvlat=["始终没明白游戏起到的正向作用和价值是什么","建议关闭游戏大人孩子都不玩"]f = open('data.csv', 'w', encoding='utf-8', newline="")# 2.基于文件对象构建csv写入对象csv_write = csv.writer(f)# 3.构建列表头csv_write.writerow(['title'])# 4.写入csv文件for data in lat: csv_write.writerow原创 2022-02-14 19:00:11 · 4751 阅读 · 1 评论 -
pandas的各种用法
1,索引转为列,并在原来索引生成正常的数据df.reset_index(level=0, inplace=True)#索引,列变行行列转换 用 df.Tdata= pd.read_excel('./公共部门.xls',header=3,index_col=3,sheet_name='Data')#社会保护与劳动力.xls #社会发展以进pd.set_option('display.width', None) # 去列省略pd.set_option('display.max_rows', N原创 2022-01-28 10:56:49 · 383 阅读 · 0 评论 -
python用QQ邮箱给多人发送邮件
一,登录邮箱,获取授权码第二部,替换参数给多人发送邮箱,我只是做了个循环,把每个人得授权码循环输入了。把授权码和邮箱替换成自己得就行,内容你可以自己定义import smtplibfrom email.mime.text import MIMETextfrom email.mime.image import MIMEImagefrom email.mime.multipart import MIMEMultipartfrom email.mime.application import MI原创 2022-01-19 17:47:03 · 2807 阅读 · 1 评论 -
爬虫中文乱码
import requestsfrom lxml import etreeimport chardeturl = "http://www.ceh.com.cn/syzx/index.shtml"headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36", "Co原创 2021-12-17 10:35:34 · 216 阅读 · 0 评论 -
pyecharts绘图大全
官方教程这个值得观看https://gallery.pyecharts.org/#/Tree/tree_top_bottomfrom typing import Listimport pyecharts.options as optsfrom pyecharts.globals import ThemeTypefrom pyecharts.commons.utils import JsCodefrom pyecharts.charts import Timeline, Grid, Ba原创 2021-11-25 15:40:46 · 314 阅读 · 0 评论 -
linux定时任务介绍
转分,时,天,月,周,注意这个,好理解https://www.cnblogs.com/dabai-wang09/p/11260766.html原创 2021-11-25 11:13:25 · 445 阅读 · 0 评论 -
TypeError: ‘Word2Vec‘ object is not subscriptable
我电脑重系统了,导致gensim3版本不对。报错改成model.wv,在取值或者降低版本,这个我没测试pip install gensim==3.2原创 2021-11-24 14:41:41 · 2708 阅读 · 1 评论 -
Python安装word2vec
一Python 安装 WORD2VEC做训练时,直接可以pip安装。‘pip install gensim调用时from gensim.models import word2vec需要注意点,图片粘贴不上,呃呃呃。model = word2vec.Word2Vec(sentences, size=100, window=10)当size 报错时,可修改如下model = word2vec.Word2Vec(sentences, vector_size=100, window=1原创 2021-11-24 10:17:43 · 2940 阅读 · 0 评论 -
Python进度条
import sysimport timefor i in range(1,101): print('\r',end='') print(f'进度:{i}%','▉' * (i//2),end='') sys.stdout.flush() time.sleep(0.05)原创 2021-11-15 14:57:49 · 599 阅读 · 0 评论 -
使用百度aip进行情感倾向分析
个人笔记其中代码中的txt为文本 ,client_appid ,client_ak ,client_sk 为百度智能云中创建的管理生成的import aipimport requestsimport reimport jsonimport timeclient_appid = '24890'client_ak = 'G8L2LwoNbi8N'client_sk = 'i8gUweGf28uX16GB7Y9G'my_nlp = aip.nlp.AipNlp(client_appid,原创 2021-10-19 16:46:30 · 811 阅读 · 0 评论 -
相似度语句计算
import distancedef edit_distance(s1, s2): return distance.levenshtein(s1, s2)strings = [ '你在干什么', '你在干啥子', '你在做什么', '你好啊', '我喜欢吃香蕉']target = '我喜欢香蕉'results = list(filter(lambda x: edit_distance(x, target) <= 2, strings))原创 2021-10-09 16:12:01 · 112 阅读 · 0 评论 -
提取一篇文章中的关键字,生成词云
1,读取jie.txt中的文章2,使用jieba进行分词3,读stopwords.txt中的停运词,来判读清洗文章中的停运词。4,使用jieba提取关键词,withWeight =True中的TRUE表示提取词向量,FALSH表示不提取5,pip 安装 pyecharts和WordCloud两模块6,stopwords.txt停运词自行百度,应该都有。from pyecharts import WordCloudimport jieba.analyseimport codecs#第一步:分原创 2021-09-29 14:48:05 · 941 阅读 · 1 评论 -
word2vec学习
wqx.txt文件,是使用jieba模块分词好的文件#词向量from gensim.test.utils import common_texts, get_tmpfilefrom gensim.models import word2vecsentences = word2vec.LineSentence('wqx.txt')#训练语料model = word2vec.Word2Vec(sentences, hs=1,min_count=1,window=5,size=100)print(mod原创 2021-09-28 09:06:43 · 174 阅读 · 0 评论 -
中文词频统计
可用jieba模块,进行·中文分词import nltkfrom snownlp import SnowNLP# 需要操作的句子text = '你站在桥上看风景,看风景的人在楼上看你。明月装饰了你的窗子,你装饰了别人的梦's = SnowNLP(text)# 分词cut=s.words# 统计词频freq = nltk.FreqDist(cut)# 可以把最常用的5个单词拿出来standard_freq = freq.most_common(5)print(standard_freq原创 2021-09-24 14:52:26 · 1454 阅读 · 0 评论 -
nltk模块安装
直接来个这个报错快下班了,不写了https://www.cnblogs.com/zrmw/p/10869325.html看这个连接原创 2021-09-23 17:59:01 · 89 阅读 · 0 评论 -
python的while不断加一
sum = 1while sum <= 13: sum += 1 print(sum)原创 2021-09-19 19:05:23 · 546 阅读 · 0 评论 -
猿人学第一题
我当个人笔记的。就不写过程了import requestsimport refrom lxml import etreeimport execjsimport requestsimport timework=int(time.time()*1000)with open('yuanrenxue.js', 'r', encoding='utf-8') as f: jscode = f.read()context1 = execjs.compile(jscode)params=co原创 2021-09-14 15:41:52 · 95 阅读 · 0 评论 -
pyecharts的x轴数据不全
在我使用可视化时,遇到了这样一个坑x轴的数据没有展示出来。解决办法红的为增大像素黄的为修改字体倾斜度,现在为0,不倾斜import pandas as pdfrom pyecharts.charts import *from pyecharts import options as optsfrom pyecharts.faker import Fakerfrom pyecharts.globals import ThemeTypefrom pyecharts.charts impor原创 2021-09-10 18:01:01 · 1612 阅读 · 0 评论 -
selenium无头浏览爬取搜狐新闻
个人笔记import requestsimport refrom lxml import etreefrom selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsdef hebej(): url="http://www.hebei.net.cn/web/main/jjjxx_jyzf/2c940d846564b37b017a1cb158c058f2.htm" headers原创 2021-09-06 16:48:41 · 203 阅读 · 0 评论 -
scrapy携带参数post爬取
个人笔记class GjcxGgwSpider(scrapy.Spider): name = 'gjcx_ggw' start_urls = ['http://sc.ndrc.gov.cn//policy/advancedQuery?'] def get_form_data(self, page): return { 'pageNum':f"{page}", 'pageSize'原创 2021-09-03 13:50:08 · 527 阅读 · 0 评论 -
中文乱码处理
个人笔记html_temp=requests.get(url=url,headers=headers)html_temp .encoding = html_temp .apparent_encodingprint(html_temp.text)记住·,先转码,后txt原链接添加链接描述原创 2021-09-01 10:33:03 · 72 阅读 · 0 评论 -
Python对时间的处理
from datetime import datetimecurrent=1item_data='2021-08-19'date_time = datetime.strptime(item_data, "%Y-%m-%d")#格式化时间,使其规范now_time = datetime.now()#获取当前时间diff_day = (now_time - date_time).days#两个时间进行相减print(diff_day)if diff_day > current:#这些没什么原创 2021-08-20 10:22:18 · 68 阅读 · 0 评论 -
Python的txt文件转wps
from docx import Documentdocument = Document()f = open('./隐私收集器APP潜在风险整改思路.txt', 'r', encoding='UTF-8')content = f.read()f.close()print('读取完毕')document.add_paragraph(content) # 写入worddocument.save('隐私收集器APP潜在风险整改思路.docx')print('文档写入完毕')...原创 2021-07-22 09:42:37 · 543 阅读 · 0 评论 -
python读取和解压zip文件
读取`import zipfilez = zipfile.ZipFile("E://MIS//MIS//API_NY.GDP.PCAP.KD_DS2_zh_csv_v2_2262867.zip", 'r' ) # 这里的第二个参数用r表示是读取zip文件,w是创建一个zip文件for f in z.namelist(): print(f)解压import zipfiletry: with zipfile.ZipFile("E://MIS//MIS//API_NY.GDP.PC原创 2021-05-19 14:17:36 · 766 阅读 · 0 评论 -
批量更改sql表头
1,首先你的把所有表明提取出来组合sql语句就行import pymssqlimport osimport pandas as pdimport randomconn = pymssql.connect(host='ip', user='', password='', database='数据库名,不是表明’, charset='utf8')#这块是链接数据库的 cursor = conn.cursor() #sql=f"alter原创 2021-05-10 10:29:39 · 880 阅读 · 0 评论 -
更改csv文件表头
#更改csv文件表头。可根据以前代码,批量更改表头file_path = r'E:/mimwqx/open/Demographic/Population/195_DT_YAB_0003_20210429152421.csv'df = pd.read_csv(file_path, header=0)df.columns = ["a", "b", "c"]df.to_csv(file_path, index=False)保存为csvwith open('Population.csv','a+',e原创 2021-05-06 11:19:56 · 2880 阅读 · 0 评论 -
爬虫根据标题爬去数据
个人笔记 while k < 10: params['page'] = k enum_url = enum_base + '?' + urlencode(params) headers['Referer'] = enum_url content = get(enum_url, headers) html = etree.HTML(content) href_list = html.xpath('/原创 2021-04-13 08:41:37 · 121 阅读 · 2 评论 -
保存html文件
url = f'https://www.londonstockexchange.com/live-markets/market-data-dashboard/price-explorer?categories=ETFS&subcategories=15&page={page}' headers[ 'path'] = f'/live-markets/market-data-dashboard/price-explorer?categories=ETF..原创 2021-04-12 17:30:42 · 418 阅读 · 0 评论 -
读取本地html文件进行清洗
import os import re path = "C:\dyta\Resource_File\机器学习实战教程" #文件夹目录 files= os.listdir(path) #得到文件夹下的所有文件名称 files.sort()#排序 for file in files: #遍历文件夹 print(file) print('加') htmlf=open('C:\\dyta\\Resource_File\\机器学习实战教程\\{}'.format(file),'原创 2021-04-08 11:26:33 · 164 阅读 · 0 评论