- 博客(30)
- 收藏
- 关注
原创 seaborn画图
import pandas as pd dataset = pd.read_csv("E:\data\cal_housing.csv")print("Dataset: {}".format(dataset.shape))print("Columns: {}".format(dataset.columns))dataset.head(5)import matplotlib.pyplo...
2019-10-17 17:39:47 340
原创 stanfordcorenlp安装
stanfordcorenlp安装:win10+JDK1.8.0_144+Python3.7.3+stanford-corenlp-full-2016-10-31成功调用Server,启动服务后调用速度能加快cmd启动服务命令:cd E:\tools\stanford-corenlp-full-2016-10-31; java -mx4g -cp "*" edu.stanford.nlp.p...
2019-10-14 14:17:06 1034
原创 Tensorflow分布式训练
#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time : 2019/10/10 13:50# @Site : # @File : distributed_MNIST.py# @Software: PyCharmimport tensorflow as tffrom tensorflow.contrib.learn...
2019-10-11 16:36:50 400
原创 python多进程和串行运行
#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time : 2019/10/8 10:40# @Site : # @File : 多进程_串行.py# @Software: PyCharmimport timeimport multiprocessingdata = range(8)def muchjob(x...
2019-10-08 11:06:37 469
原创 使用单例模式加速
from ... import ...相当于一个单例模式,模块第一次导入后会生成.pyc文件第二次导入时,就会直接加载.pyc文件基于__new__方法实现当我们实现单例时,为了保证线程安全需要在内部加入锁我们知道,当我们实例化一个对象时,是先执行了类的__new__方法(我们没写时,默认调用object.__new__),实例化对象;然后再执行类的__init__方法,对这个对象进...
2019-09-24 11:51:22 216
原创 numpy求范数
用于求向量欧式距离import numpy as npw[u][v] += num / (1 + np.linalg.norm(u_vector - v_vector))
2019-09-23 14:59:47 834
原创 正则匹配护照格式
美国、英国护照号码:9 位数字 加拿大护照:2 个字母加 6 个数字 法国护照:2 个数字加 2 个字母加 5 个数字 意大利护照:2 个字母加 7 个数字 西班牙护照:3 个字母加 6 个数字 德国护照:9 个字符,由 2-3 个数字与 6-7 个字母混排,头尾是字母。或者单纯为 9 个数字def foreign_passport(sentence): pattern = [r'...
2019-09-20 16:46:07 5382
原创 判断字符串中是否有身份证号码
# -*- coding: utf-8 -*-import reclass Solu:# Errors=['验证通过!','身份证号码位数不对!','身份证号码出生日期超出范围或含有非法字符!','身份证号码校验错误!','身份证地区非法!'] def checkIdcard(self, idcard): Errors = ['验证通过!', '身份证号码位数不对...
2019-09-18 18:22:06 2371
原创 mysql查询在一个表而不在另一个表中的数据
select C.company_name,C.company_address from Companylist C left join "company_LoAndLa" L on C.company_name=L.company_name where L.company_name is null其他两种写法:select distinct A.ID from A where A.I...
2019-09-18 09:10:25 676
原创 scrapy 通过命令行传参数批量爬取
class EypSpider(scrapy.Spider): name = 'eyp' def __init__(self, category=None, *args, **kwargs): super(EypSpider, self).__init__(*args, **kwargs) cat = [category, category] ...
2019-09-10 16:09:42 572
原创 手写逻辑回归
LR代码:import numpy as npfrom sklearn.metrics import accuracy_scoreclass LogisticRegression(object): def __init__(self): """初始化Logistic Regression模型""" self.coef = None ...
2019-09-04 10:55:47 596
原创 查找两个数组的公共元素,最大和子序列
jd面试题l1 = [2,3,4,5]l2 = [4,6,7,8]print([x for x in l1 if x in l2])查找数组中最大和子序列nums = [3,-5,7,4,10]s = 0seq = [x for x in nums if x >=0]print(sum([x for x in nums if x >=0]))最大连续子序列...
2019-09-03 10:45:03 732
原创 python 读取本地excel存入数据库
import pandas as pdimport osfrom read_pgdata import Postgredataroot_dir = r'root'file_names = os.listdir(root_dir)[:-1]print(len(file_names), file_names)pg = Postgredata()for i in range(len(...
2019-09-02 11:44:40 577
原创 查询表中第一个下订单的用户id和订单id
滴滴笔试题order_list表:userid,orderid,start_timeselect userid,orderid from order_list awhere(select count(*) from order_list b where b.start_time<a.start_time)<=1 selectuserid,orderidf...
2019-08-29 17:33:40 2485
原创 python时间格式转换
import time, datetimenow = datetime.datetime.now()ago = now - datetime.timedelta(days=30)print(ago.strftime("%Y-%m-%d %H:%M"))输出:2019-07-30 15:51得到30天前的时间。
2019-08-29 15:51:54 246
原创 python RPC原理
rpc远程调用原理 :比如 A调用B提供的remoteAdd方法:首先A与B之间建立一个TCP连接;然后A把需要调用的方法名(这里是remoteAdd)以及方法参数(10, 20)序列化成字节流发送出去;B接受A发送过来的字节流,然后反序列化得到目标方法名,方法参数,接着执行相应的方法调用(可能是localAdd)并把结果30返回;A接受远程调用结果,然后do()。RPC框...
2019-08-28 16:41:50 385
原创 Postgresql 数据库操作类
# -*- coding: utf-8 -*-'''Postgresql 数据库操作类'''import psycopg2import json# import pandas as pd# 从postgresql获取数据class Postgredata(): def __init__(self): self.dbname = "----" ...
2019-08-16 18:46:33 296
原创 同时解决最长公共子序列和最长回文子序列
'''给定两个单词word1和word2,找到使得word1和word2相同所需的最小步数,每步可以删除任意一个字符串中的一个字符。示例 1:输入: "sea", "eat"输出: 2解释: 第一步将"sea"变为"ea",第二步将"eat"变为"ea"说明:给定单词的长度不超过500。给定单词中的字符只含有小写字母。'''#LCS 最长公共子序列#构建dp...
2019-08-15 15:26:38 305
原创 回溯法电话号码字母组合问题
https://leetcode.com/problems/letter-combinations-of-a-phone-number/#回溯法电话号码问题import itertoolsclass Solution: def letterCombinations(self, digits): if len(digits) == 0: r...
2019-08-03 10:54:47 400
原创 selenium模拟firefox点击,优化内存
import scrapyfrom parse_tools.parseTools import get_text, get_js_webpagefrom parse_tools.Postgredata import Postgredatafrom customswords.items import realtime_flight_filterfrom selenium import we...
2019-08-02 09:29:54 1044
转载 Linux chmod命令
Linux/Unix 的文件调用权限分为三级 : 文件拥有者、群组、其他。利用 chmod 可以藉以控制文件如何被他人所调用。使用权限: 所有使用者语法chmod [-cfvR] [--help] [--version] mode file...参数说明mode : 权限设定字串,格式如下 :[ugoa...][[+-=][rwxX]...][,...]其中:...
2019-07-31 10:24:09 163
原创 win10+tensorflow1.12.0+CUDA9.0+cudnn7.1
注意:上面版本成功安装,tensorflow1.7.0也可以安装,环境变量只需配置path路径就可以。
2019-07-30 11:54:09 234
转载 Tensorflow搭建bilstm+attention文本分类模型
# 构建模型class BiLSTMAttention(object): """ Text CNN 用于文本分类 """ def __init__(self, config, wordEmbedding): # 定义模型的输入 self.inputX = tf.placeholder(tf.int32, [None, confi...
2019-07-26 16:46:57 8164 1
原创 爬虫相关
模拟浏览器访问:from selenium import webdriverfrom scrapy.selector import Selectorbrowser = webdriver.Firefox()browser.get("https://www.planespotters.net/deliveries/1960/01")res = Selector(text=browser...
2019-07-25 16:53:14 300
原创 scrapy爬虫
创建一个新scrapy项目:scrapy genspider boatcompany www.sofreight.com使用scrapy爬取航司网站数据爬取一个div中所有文字text:text = response.xpath('//div[@class="carrier_desc"]').xpath('string(.)').extract_first()爬取链接时要注意空链接判断使...
2019-06-20 17:18:12 248
原创 python实现树的广度优先搜索BFS
题目描述从上往下打印出二叉树的每个节点,同层节点从左至右打印。# class TreeNode:# def __init__(self, x):# self.val = x# self.left = None# self.right = Noneclass Solution: # 返回从上到下每个节点值列表,...
2019-05-03 20:54:59 1149
原创 定义一个栈,得到栈中最小元素,要求时间复杂度为O(1)
题目描述定义栈的数据结构,请在该类型中实现一个能够得到栈中所含最小元素的min函数(时间复杂度应为O(1))。思路:利用一个辅助栈来存放最小值 栈 3,4,2,5,1 辅助栈 3,3,2,2,1每入栈一次,就与辅助栈顶比较大小,如果小就入栈,如果大就入栈当前的辅助栈顶当出栈时,辅助栈也要出栈这种做法可以保证辅助栈顶一定都当前栈的最小值。#...
2019-05-03 13:01:14 471
原创 Python写一个微信个性签名词云
#!/usr/bin/env python# -*- coding: utf-8 -*-# File : wxfriends_information.py# Author: PengLei# Date : 2018/8/2import itchat ,time,sys,xlwtfrom pyecharts import WordCloudimport randomfile...
2018-08-02 16:36:18 451
原创 Python生成微信好友信息excel
包括昵称,备注,个性签名等import itchat ,time,sys,xlwtfile = xlwt.Workbook()table = file.add_sheet('info', cell_overwrite_ok=True)itchat.auto_login(hotReload=True)print(u'logged')friends = itchat.get_fri...
2018-08-02 15:45:28 926
转载 用Python画一个3D散点图
话不多说,直接代码~from pyecharts import Scatter3Dimport randomdata = [ [random.randint(0, 100), random.randint(0, 100), random.randint(0, 100)] for _ in range(580)]range_color = [ '#...
2018-08-02 14:04:32 5674 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人