python
sin_404
谎言的世界如果有艺术品,'没时间'一定是被观瞻的最多的一个
展开
-
pycharm在虚拟环境下跑jupyter notebook问题记录
最近在pycharm里运行ipynb文件发现个问题,如果是在conda的虚拟环境或者额外创建项目的venv里会提示:jupyter kernel does not match project interpreter提示内核版本不匹配,要求register project interpreter as kernel,选择的话提示dll问题找不到模块,我尝试改configer从url读取依旧无效事实上此时jupyter是已经启动了的,且可以在网页上访问,猜测是pycharm识别的问题我通过重复.原创 2021-03-04 16:31:15 · 4758 阅读 · 8 评论 -
keras-ocr实例测试
keras-ocr 文档地址参考文章一篇入门深度学习OCR:数据集和算法合集 错误集合加载Keras保存的模型时,“ AttributeError:‘str’对象没有属性’decode’”?pip install ‘numpy1.19’ --force-reinstall 重装库版本pip install 'h5py2.10.0’ --force-reinstallWin10 conda环境,OSError: [WinError 126] 找不到指定的模块 ·co原创 2021-03-02 18:30:37 · 616 阅读 · 0 评论 -
pandas中dict和dataFrame互转
一、dict转Dataframepd.DataFrame(dict_a)二、df转dict使用df.to_dict()默认会把key和值分开参数:'dict' (默认) ,'list','series','split','records','index'如果是list(dict)这种嵌套情况转的df,回转需要使用records# 拿上面的数据举例,df_b a b c0 0 1 21 3 4 52 6 7转载 2020-10-28 09:48:39 · 5146 阅读 · 0 评论 -
pymysql查询查询结果转换json
python3使用pymysql通常select返回的是一个不含字段的列表,通常我们需要通过访问字段来获取字段值把返回结果转成dict会方便我们操作核心就在于创建连接时指定游标类:cursorclass=pymysql.cursors.DictCursor # 打开数据库连接 # db = pymysql.connect(host, user, passwd, db) conn = pymysql.connect(host=host, port=3306, user=u原创 2020-10-09 16:36:45 · 2098 阅读 · 1 评论 -
备忘录:python.requests获取url(重定向)
import requestsurl = 'http://home.cnblogs.com/u/xswt/'r = requests.get(url,headers={"Content-Type":"application/json"})reditList = r.history#可以看出获取的是一个地址序列print(f'获取重定向的历史记录:{reditList}')print(f'获取第一次重定向的headers头部信息:{reditList[0].headers}')print(f'获取原创 2020-07-22 14:09:42 · 1769 阅读 · 0 评论 -
python几个简单的正则使用
获取时间reg = '\d{4}年\d{1,2}月\d{1,2}日'# # reg = '\d{4}年\d{2}月\d{2}日'string = '2019年10月17日 - 论坛引起强烈反响,中国人民大学中国普惠金融研究院(CAFI)理事会联席主席兼院长贝多广...www.licai18.com/article/ArticleDetail.jsp?d...-快照-理财18'x = re.search(reg, string)print(x.group(0))一次性替换多个字符,可以替代多次使原创 2020-05-13 15:14:17 · 208 阅读 · 0 评论 -
Flask对接mongo上载文件
from bson import ObjectIdfrom flask import Flask, render_template, request, Responsefrom gridfs import GridFSfrom pymongo import MongoClientapp = Flask(__name__)client = MongoClient('localhost', 27017)db = client.mediagfs = GridFS(db)@app.route.原创 2020-05-12 16:57:45 · 194 阅读 · 0 评论 -
python爬虫 标签对网页内容解析的影响
一 、 第一种是标签嵌套的情况,直接上图。如上图这种情况,直接使用 .xpath("//div/ul[@class='show']/text()")[0]是拿不到被<em></em>标签括在里面的内容的,如果单独获取em标签内容的话,拼接的字符串容易乱套,最好还是一次性拿到字符串。通过搜索引擎发现xpath的.string用法尝试后发现没卵用,八成是版本变迁吧。...原创 2020-01-20 10:20:56 · 527 阅读 · 0 评论 -
python爬虫 \x00对网页解析的影响
前两天在爬贴吧的时候,发现解析网页内容的时候无法获取部分元素。开始以为是动态网页,后发现当前页面包含我需要的数据,并非是靠js异步,在屏蔽js使用后发现通过模拟浏览器和保存到文本后都能解析到文本,唯独我直接把pq(rsp.text)无法获取到元素,这就很有意思了。然后怀疑是否是解析库的缘由,使用lxml与bfs4均无法获取到元素,排除这个原因。接着用蠢办法一步一步解析网页,通过对比删...原创 2020-01-20 10:20:32 · 688 阅读 · 0 评论 -
selenium常见问题
基本操作from selenium import webdriverbrowser = webdriver.Chrome(executable_path='chromedriver.exe') # 声明一个浏览器对象 指定使用chromedriver.exe路径browser.get("https://www.baidu.com") # 打开Chromeinput = b...转载 2020-01-20 10:22:48 · 1552 阅读 · 0 评论