Python
laoyaotask
Vue,PHP,Python,Office
展开
-
vue3+flask 简易登录功能实现
较为关键的几个点有:flask中session功能的应用和接收前端传递数据的方式、vue3中的组件跳转等。原创 2023-06-20 00:07:03 · 1653 阅读 · 0 评论 -
Vue3 Flask 渐进式入门笔记
以下均在Windows 10环境下实现。原创 2023-06-19 13:46:22 · 1836 阅读 · 0 评论 -
【无标题】PyQt5初体验——一个简单的数据管理应用
过去10多年中,我一直断断续续地学习和开发Web应用,对桌面应用开发技术的认识还停留在大学时学习的VB。近段时间在工作中产生了一个在单机上运行一个小型数据管理软件的需求,于是开始学习使用PyQt5技术,断断续续大概1周时间基本上弄出来了,现记录一下。原创 2023-01-14 02:42:05 · 857 阅读 · 1 评论 -
python json 序列化反序列化 和 中文编码问题
在一个项目中,需要从云端获取一个json格式的数据,并保存到本地文件中,然后再读取出来,这中间要用到json的dumps方法和loads方法,以实现数据的序列化和反序列化。具体来说,dumps方法,可将json格式数据序列为python的相关的数据类型,通常用于打印等;loads方法则是相反,把python数据类型转换为json相应的数据类型格式要求,反序列化后可以对json数据进行各种操作。在编程过程还发现一个问题,在序列化时,中文汉字总是被转换为unicode码,在网上搜索后发现,在dumps函数中添加原创 2014-11-10 22:26:58 · 5868 阅读 · 0 评论 -
python3.2.5 + mysql-connector-python-1.2.2-py3.2 连接mysql基本用法
今天又发现另一个python连接mysql的工具,原创 2014-07-08 00:58:15 · 2327 阅读 · 1 评论 -
python3.2.5 + PyMySQL3 0.5 基本使用方法
在网上看到不少文章都选用mysqldb作为python连接mysql数据库的工具,但是mysqldb目前支撑的版本较低,安装失败。所以才尝试pymysql,这个比较简单易用原创 2014-07-05 01:14:31 · 6376 阅读 · 0 评论 -
python urlopen 网址中有中文时报错的解决办法
用urllib.request.urlopen()打开带有中文的网址时会报错.在网上查了半天没有找到好的解决方法,功夫不负有心人,终于让找到了解决这个问题的方法.先用urllib.parse.quote()对链接中的中文进行处理import urllib.request;import urllib.parse;url = "http://www.ba转载 2014-07-05 15:32:55 · 5211 阅读 · 1 评论 -
Python2.x 利用urllib.quote实现url地址编码解码
#!/usr/bin/pythonimport urllibimport sysstring = sys.argv[1]string = unicode(string,"gbk")utf8_string = string.encode("utf-8")gbk_string=string.encode("gbk")gbk=urllib.quote(gbk_string)utf8=ur原创 2014-07-16 20:02:08 · 5896 阅读 · 0 评论 -
matplotlib 几种常见2d图
import numpy as np;import math;from matplotlib import *;import matplotlib.pyplot as pltx=np.arange(1,10,1);y=np.sin(x);plt.subplot(321);plt.scatter(x,y,marker='*'); #散点图plt.grid(True);plt.原创 2014-05-13 00:29:59 · 3069 阅读 · 0 评论 -
pyhton 从web获取json数据 保存到本地然后再读取
从web中获取json数据直接进行处理总觉得太慢,主要是从web中获取获取数据的过程有点慢。所以就在想 如果先利用空闲时间把json数据获取并保存到本地,然后再从本地文件中读取和操作,应该就要快很多。这中间的主要问题就是格式的转换问题:1、将获取取的json数据序列化后保存到本地文件中;2、从文件中逐行读取数据,再将其反序列化为json格式。原创 2014-11-11 16:03:26 · 10102 阅读 · 0 评论 -
python3 多线程的基本用法
python3 多线程的基本用法原创 2014-11-12 23:27:58 · 3385 阅读 · 1 评论 -
Python 产生特定范围内不重复多个随机数的两种方法
首先想到的递归的方法,然后才发现Python中居然已经提供了此方法的函数,可以直接使用。原创 2014-11-18 14:57:58 · 66096 阅读 · 2 评论 -
从CRF测试结果中提取出连续的标注行
现在在处理一批CRF标注的语料,需要将测试结果中标为B、I的行提取出来,对于连续的B、I标注行,要在一起抽出。如有以下测试语料标注结果(片断): a a1 a2 O b b1 b2 B c c1 c2 I d d1 d2 I e e1 e2 O f f1 f2 B 从中将b、c两行合在一起抽出,f行要单独抽取,目标结果格式如下: [[[原创 2015-07-15 22:25:02 · 1437 阅读 · 0 评论 -
Python将一个大文件按段落分隔为多个小文件的简单方法
今天帮同学处理一点语料。语料文件有点大,并且是以连续两个换行符作为段落标志,他想把它按段落分隔成多个小文件,即每3个段落组成一个新文件。由于以前没有遇到过类似的操作,在网上找了一些相似的方法,看起来都有点复杂。所以经尝试,自己写了一段代码,完美解决问题。 基本思路是,由先读原文件内容,并使用正则表达式,依据\n\n进行切片处理,结果为一个列表,其中每一个列表元素都存放一个切片中的内容;然后创建一个原创 2015-07-08 00:40:20 · 8339 阅读 · 0 评论 -
Python中可避免读写乱码的一个强大方法
昨天在帮同学解析一批从网络上爬取的文件时,遇到一个奇葩的问题,文件本身的编码是gbk,Eclipse编辑环境的默认编码是utf8,使用常规的open方法批量打开文件时,某些文件中存在一些不可被gbk识别的特殊字符导致读取错误,而这些特殊字符又是存在于utf8编码中的。经不断尝试,发现一个很好的解决办法:使用Python自带的codecs。codecs就是为编码转码而生的,关于此功能的更多详情请移步原创 2015-06-30 13:37:11 · 4812 阅读 · 0 评论 -
HBuilder 配置Python、PHP开发环境
HBuilder是一个神器,不仅可以用于HTML页面的制作,通过安装各种扩展插件,还可实现多种语言编程。原创 2015-01-20 17:07:51 · 13664 阅读 · 0 评论 -
python 判断一个正整数是否循环素数
import stringimport math#判断是否素数的函数def isPrime(n): if(n<2): return False; elif(n==2): return True; elif(n>2): for d in range(2,int(math.ceil(math.sqrt(n))+1)):原创 2014-12-21 22:02:18 · 3291 阅读 · 0 评论 -
Python3 模拟MapReduce处理分析大数据文件——《Python宝典》
最近买了一本《Python宝典》在看,此书所讲Python知识的广度明显,但是深度略显不足,所以比较适合入门及提高级的读者来看。其中对于Python大数据处理一章的内容比较有兴趣,看明白了以后,我根据书上提供的案例对源代码进行了修改,也实现了模拟MapReduce的过程。目标:从Apache的用户访问日志access.log中统计出页面资源的访问量。我们假设这个文件体积十分巨大。acc原创 2014-12-19 10:50:40 · 3492 阅读 · 0 评论 -
python 不借助第三方包实现xml转json
xml转json?猛一听是不是挺蛋疼的,都是结构化数据的格式有这转换的必要么?是的,其实我也觉得无聊,不过手痒痒,总想来试试。网上也能找到一款名为xmltodict的转换工具,也挺好用的。我的方法如下,原理很简单,代码也很短。原创 2014-11-22 19:48:15 · 6905 阅读 · 0 评论 -
基于KNN算法的约会网站配对效果 python3.2
续前文 Python3.2 实现基于KNN算法的数据分类。今天看完了《机器学习实战》中关于KNN算法的一个完整案例,将所有代码加了注释,并利用tkinter 将其改造为GUI式的交互界面。(文中没有直接作用的方法我已经注释)原创 2014-05-12 18:51:08 · 1589 阅读 · 3 评论 -
matplotlib 3d 散点图
from matplotlib import pyplot as plt;from mpl_toolkits.mplot3d import Axes3D from matplotlib import cm import numpy as npx=np.arange(1,6,0.1)y=np.cos(x)z=np.sin(x*x)fig = plt.figure() cm =原创 2014-05-12 23:17:13 · 2378 阅读 · 0 评论 -
win7 x64环境下 python3.2 nltk3.0及相关工具包的安装
Python2.x中存在的最大问题是中文显示的编码,要想让其正常显示,需要做许多设置和编写相应的代码。Python3起,这个问题得到较为彻底的解决,用户基本不用关心非英文字符的编码问题。环境:win7 x64位,python3.2 x86, numpy1.8.1 x86, matplotlib 1.3.1 x86, nltk3.0a3 x86(是目前唯一支持python3的一个nltk版本原创 2014-03-21 23:30:28 · 2330 阅读 · 0 评论 -
python3.2 简单面向对象编程
虽然Python面向对象编程的原理与其他语言并无二致,但还是有其独有的编程过程以及代码结构,写下来方便记。以一个根据用户输入的半径来计算圆面积和周长的过程来说明:class_calc.pyclass cal: s=0 #定义类属性 r=0 #定义类属性,用于接收参数 c=0 #定义类属性 def __ini__(self,xingcan): #初始化方法原创 2014-03-22 02:07:40 · 1352 阅读 · 0 评论 -
python nltk 统计语料的词性标注分布
import nltksent='消息/n 源/g 新浪/nz 财经/n 称/v ,/w 针对/p 今日/t 有/v 媒体/n 平台/n 报道/v 央行/n 已经/d 发文/v 暂停/v 比特/q 币/g 交易/n 的/u 消息/n ,/w 接近/v 监管/vn 层/qv 人士/n 对/p 新浪/nz 财经/n 表示/v ,/w 央行/n 确实/ad 下发/v 文件/n ,/w 但/c 并非/v原创 2014-03-21 23:43:39 · 5293 阅读 · 3 评论 -
python3.2+libsvm3.17的配置
python3.2+libsvm3.17 安装配置 测试原创 2014-03-31 14:08:38 · 2168 阅读 · 3 评论 -
Python3.0 下NLTK工具的安装与配置
这几天在看《Natural Language Processing with Python》,根据书上的提示,需要安装NLTK工具包,在安装配置的过程中遇到不少问题,现在一 一总结下来。首先要说明的是,目前最新版的Python3.3.2不能完全兼容最新版的NLTK3.0a0,因为后者是基于Python3.0的,所以我把以前安装的Python3.3.2卸载了,安装了Python3.0.1。我的安原创 2013-06-25 01:44:36 · 6083 阅读 · 8 评论 -
Python 导入外部类文件
通常,定义类的代码和调用类创建对象的代码很少放到同一文件下,这就遇到【一个文件需要调用另一个独立存放的类文件来创建对象】的问题。书上和网上的入门教材对此提及较少,以下举例说明其实现方法:t1.py:# 这里是定义类的文件class Cal: def sum(self,a,b): return a+b def cha(self,a,b): ret原创 2013-06-24 18:29:46 · 10382 阅读 · 0 评论 -
MyEclipse10+PyDev 不能识别中文字符串?看这里
有两个Python程序文件:t1.py:import t2t2.py:china="中国"print(china)结果程序总报错:SyntaxError:Non-UTF-8 code starting with...这明显是因为字符编码的问题造成的。结果我用记事本一查看这两个文件的编码,果然默认的是ANSI,手工改为UTF-8编码后,问题解决。那么如何在MyE原创 2013-06-23 17:25:39 · 2003 阅读 · 0 评论 -
MyEclipse10中配置开发Python所需要的PyDev 绝对靠谱 不忽悠!
在NLP(自然语言处理)这个领域中,Python具有良好的声誉,于是也想学习一下。首先第一步就是需要在计算机上配置Python环境。由于Python自带的编辑器太简单,使用起来不顺手,于是就考虑在相对熟悉的MyEclipse中配置PyDev来进行Python开发。在网上搜了一下配置方法,发现介绍基于MyEclipse10配置Dev的网页很少,而且需要配置的地方有点多,于是自己亲自来摸索,终于成原创 2013-06-23 16:16:43 · 8860 阅读 · 0 评论 -
Python 中文分词工具 ——结巴分词的使用方法总结
结巴分词工具的安装及基本用法,昨天的博客中已经有所描述。今天要说的内容与实际应用更贴近——从文本中读取中文信息,利用结巴分词工具进行分词及词性标注。示例代码如下:#coding=utf-8import jiebaimport jieba.posseg as psegimport timet1=time.time()f=open("t_with_splitter.txt","r")原创 2013-07-08 21:38:09 · 13203 阅读 · 12 评论 -
一种基于迭代与分类识别方法的入门级Python爬虫
python,爬虫,迭代与分类原创 2014-03-24 20:00:37 · 1768 阅读 · 0 评论 -
python3+nltk3+matplotlib1.3中plot方法无法执行的解决办法
python3+nltk3+matplotlib1.3中plot方法无法执行的解决办法原创 2014-03-26 01:06:06 · 2188 阅读 · 0 评论 -
Python3.2 实现基于KNN算法的数据分类
1 前言这几天在看《机器学习实战》一书,买这本书的最首要原因是它里面采用Python来实现,而我这段时间对Python的好感越来越强烈。拿到手后一看,果然很不错,书中对一些经典机器学习算法的解释与实现 阐述的都很通俗。今天把KNN算法看懂了,在些基础上用Python进行了实现,代码主要还是基于书中的示例,我在看明白后,加上了注释。2 KNN算法的基本原理KNN属于监督学习,要求事先原创 2014-05-12 18:46:28 · 1708 阅读 · 0 评论 -
Python 中文分句
今天在某论坛中看到应用Python对中文进行分句的源码(http://www.corpus4u.org/forum/showthread.php?s=86a8e08ccda003206c8f8d66c011df67&t=8662&page=2),原理很简单,帖上来传播一下。注释是我自己加上去的。向原作者致谢!# coding: utf-8 #设置分句的标志符号;可以根据实际需要进行修改转载 2013-07-06 22:31:56 · 13570 阅读 · 2 评论 -
python matplotlib plot 数据中的中文无法正常显示的解决办法
python matplotlib plot 显示中文数据原创 2014-03-26 00:50:17 · 4952 阅读 · 2 评论 -
python 正则表达式用法示例
要求:现有文本:“牧牌全脂牛奶1L*12盒【品牌】: 牧牌【规格】:1L*12盒(乳脂肪含量≥3.5%)【产地】:德国【类型】:超高温瞬时灭菌纯牛奶【原料】:100%牛奶【非脂乳固体含量】:≥8.5%【生产日期】:见包装【保质期】:12个月储藏条件 置于阴凉干燥处存放食用方法使用前摇匀。开启后,请储藏于1-4℃,并于3日内饮用完。” 要求从中提取出【】内的文字和对应的内容。代码:text=原创 2014-03-25 00:25:47 · 1199 阅读 · 0 评论 -
Python 结巴分词在使用过程中遇到的问题及对策
结巴分词是Python语言中效果最好的分词工具,其功能包括:分词、词性标注、关键词抽取、支持用户词表等。这几天一直在研究这个工具,在安装与使用过程中遇到一些问题,现在把自己的一些方法帖出来分享一下。官网地址:https://github.com/fxsjy/jieba1、安装。按照官网上的说法,有三种安装方式,第一种是全自动安装:easy_install jieba 或者 pi原创 2013-07-08 00:43:36 · 10104 阅读 · 3 评论