python_ing
嘀嗒嘀嘀嗒嘀
别低头,王冠会掉
展开
-
ipython-jupyter-skils
jupyter原创 2022-12-28 11:06:33 · 161 阅读 · 0 评论 -
【python】实用tools
json解析变 if else高手import jsonfrom urlparse import *# 词典获取value值需要判断key是否存在,于是慢慢变成 if else高手了# dict 本身有个get函数,可以不用判断,直接获取,如果没有key, 获取的就是默认值# 获取 key = realtitle 的值,如果没有就设为默认值 realtitlereal_title = ana.get('page_element', {}).get('realtitle', "realtitle"原创 2021-07-25 19:00:19 · 274 阅读 · 0 评论 -
linux python matplotlib.font_manager 中文显示问题
https://zhuanlan.zhihu.com/p/81262346原创 2021-03-26 19:35:12 · 399 阅读 · 0 评论 -
【python】collections
from collections import namedtupledef csv_reader(fd, delimiter='\t'): def gen(): for i in fd: yield i.rstrip('\n').split(delimiter) return gen()def read_tsv(input_file, quotechar=None): with open(input_file, 'r', encoding原创 2021-02-19 13:24:33 · 204 阅读 · 1 评论 -
【python】itertools
groupby以为只有pandas有groupby,没想到python自带groupby,两个的不同点在于自带版本只能聚合相邻相同key,pandas的聚合没有相邻这个限制# -*-coding:utf-8-*-import sysreload(sys)sys.setdefaultencoding('utf-8') import osimport refrom itertools import groupby def group_pattern(line): return line原创 2021-02-19 11:27:20 · 177 阅读 · 0 评论 -
【python】time
【代码】【python】time。原创 2021-02-19 11:23:28 · 167 阅读 · 0 评论 -
【python】随机数
目前用到啥,整理啥随机打乱样本数据linuxpandas'''frac指的是返回的样本,如果需要30%的数据,那么可以设置参数为0.3df.sample(frac=1).reset_index(drop=True) 随机生成无重复数据'''list中取出5个样本import randomlist = []sap = random.sample(list, 5)...原创 2019-12-16 22:21:07 · 357 阅读 · 0 评论 -
【python-bug】日期正则表达式 unbalanced parenthesis at position 64
# 正则表达式import repattern = re.compile(r"^((19[2-9]\d{1})|(20((0?[0-9])|(1?[0-8]))))\ ((0?[1-9])|(1?[0-2]))\ ((0?[1-9])|([1-2][0-9])|30|31)$")pattern.findall("1989 01 08")pattern = re.compile(r"^((1...原创 2019-12-12 16:57:01 · 2277 阅读 · 0 评论 -
【python】文件操作---读写创建
文件是否存在、不存在创建if(os.path.exists("lstm_res.txt") is False): fp = open("./lstm_res.txt",'x') 读取文件夹下的所有文件原创 2019-12-10 23:46:58 · 210 阅读 · 0 评论 -
【python】堆heap
记录序列的前5大import heapqlist_o = [1,6,4,9,10,8,4]list_s = []for num in list_o: heapq.heappush(list_s, num) if(len(list_s) > 5): heapq.heappop(list_s)print(list_s)...原创 2019-11-25 16:52:07 · 277 阅读 · 0 评论 -
【python】Dask并行
背景双重for循环,40000 * 40000的时间复杂度,其中不涉及改值,只是读取,而且计算之后需要保留top5大值,符合并行原则。for i in n: for j in m:其实i和j的计算不冲突,i和0-m进行计算,i+1值分别和0-m计算,不必排序计算,可以多进程。...转载 2019-11-23 22:58:04 · 2334 阅读 · 0 评论 -
mysql存入json数据
import pymysqlimport pandas as pdimport csvdef connectdb(): print('连接到mysql服务器...') # 打开数据库连接 # 用户名:hp, 密码:Hp12345.,用户名和密码需要改成你自己的mysql用户名和密码,并且要创建数据库TESTDB,并在TESTDB数据库中创建好表Student ...原创 2019-11-14 22:43:34 · 1026 阅读 · 0 评论 -
【python】各种数据类型
1.list 和 turple两个很相似,不同在于: list 是可变的,turple是不可变的。turple没有append,insert方法 但是不可变并不代表内容不变,只是指向的地址不变。 可变在here...原创 2018-05-27 14:48:46 · 397 阅读 · 0 评论 -
【python】如何判断nan
本以为python的nan是专有的类型,但是JS也是有这个类型的。这里出了7个判断的方法,但实际有效的只有3个,还有半有效的~后四个方法则是只有np.nan可以判断自己的类型,其他三种没办法自己判断自己。也就是说:np.nan is np.nan是Truefloat(‘nan’) is float(‘nan’) 是False,另外两个也是False为什么呢?Nan 全称是Not ...原创 2019-03-15 20:26:00 · 47954 阅读 · 1 评论 -
数据预处理
1、 python数据预处理—将类别数据转换为数值的方法# 将字符型转为数值型from sklearn.preprocessing import LabelEncodercol = list(data.columns)for i in col: if(data[i].dtype == 'object'): Lale = LabelEncoder() ...原创 2019-03-01 13:44:12 · 204 阅读 · 0 评论 -
【python】yield--------未解决
https://blog.csdn.net/u013205877/article/details/70332612yield 关键字原创 2019-05-28 17:25:58 · 130 阅读 · 0 评论 -
[pyhon]人生苦短,我用python
1、输入'''按照空格分开,等同于list,每个元素类型默认str'''a = input().split()'''输入n, 然后输入n个数字'''n = input().split()a = [int(i) for i in input().split()]2、字符串逆转'''reverse 为 string 的逆转'''reverse = string[::-1]3、L...原创 2019-06-17 12:23:32 · 808 阅读 · 0 评论 -
【python】list,dict,set的时间复杂度
listpython的列表内部实现是数组(具体实现要看解析器, CPython的实现 ),因此就有数组的特点。超过容量会增加更多的容量,set, get 是O(1),但del, insert, in的性能是O(n)。具体的看下表,'n’是容器中当前的元素数, 'k’需要操作的元素个数OperationAverage CaseAmortized Worst CaseCopy...转载 2019-07-23 17:42:57 · 17280 阅读 · 2 评论 -
未解决-深拷贝与浅拷贝
https://blog.csdn.net/u011630575/article/details/78604226转载 2019-10-07 22:53:05 · 138 阅读 · 0 评论 -
【python】csv
一、读取5G的csv文件没问题,但是内存就用了11G,仍然没办法进行数据分析的操作。只能读取的话,import dask.dataframe as ddimport osfrom tqdm import tqdmTRAIN_PATH = '../input/train.csv'# Set columns to most suitable type to optimize for mem...原创 2019-01-22 19:20:23 · 88 阅读 · 0 评论 -
【python入门】zip()函数
将list打包成turple,然后返回由这些turple组成的list,如果传入的参数是大小不一的,返回的是较小的范围。import numpy as npa = [1,2,3]b = [2,4,6]c = zip(a,b) # 压缩a,b listfor i in c: print(i)# (1, 2)# (2, 4)# (3, 6)e = [[1,2,3],[...原创 2018-06-05 14:09:06 · 212 阅读 · 0 评论 -
【python入门】enumerate()
#可以同时获取value和index#字符串for i ,j in enumerate('abc'): print(i,j)# 输出结果为:#0 a#1 b#2 c#列表a=[1,2,3,4,5,6]for i ,j in enumerate(a): print(i,j)#0,1#1,2#2,3#3,4#4,5#5,6list2=a[::-1]l...原创 2018-06-05 14:08:21 · 752 阅读 · 0 评论 -
【python入门】排序
1.字符串内部排序return t = "".join((lambda x:(x.sort(),x)[1])(list(strs[i])))2.快速排序def quicksort(arr): if len(arr) <= 1: return arr pivot = arr[len(arr) // 2] # 在python3.X中 ...原创 2018-06-05 14:07:22 · 271 阅读 · 0 评论 -
【python入门】数组,列表
1.axis(轴)import numpy as npndarray = np.arange(1,10).reshape(3,3)a = ndarray.sum()b = ndarray.sum(axis = 1) #分别计算每一列的和c = ndarray.sum(axis = 0) #分别计算每一行的和d = ndarray[:][0:2] #轴0全部都取,...原创 2018-06-05 14:05:51 · 267 阅读 · 0 评论 -
【python】collections + dict
1.按key排序dic={'a':7,'b':2,'c':3}print(sorted(dic.keys(),reverse=True)) # 按照 递减 排序 reverse=true# 只返回键值 ['c', 'b', 'a']import operatordic={'a':7,'b':2,'c':3}print(sorted(dic.items(),key=operato...原创 2018-06-05 12:31:39 · 1731 阅读 · 0 评论 -
【数据分析】绘制统计图
频率分布直方图# 运行以下代码# sort the values from the top to the least value and slice the first 5 itemsimport pandas as pdimport matplotlib.pyplot as pltimport numpy as nppath7 = './data.csv' # train.cs...原创 2018-05-24 17:04:24 · 2152 阅读 · 0 评论 -
None和NaN 区别
转载自here 为了理解文本的内容,希望本文的读者需要对pandas 的Series使用有一定的经验 本人对series并不熟悉,所以在此做个记录,内容以后补充。数据类型?None是一个python特殊的数据类型,但是NaN却是用一个特殊的floatfrom numpy import NaN #又见识到一个新的NaNfrom pandas import Series, Dat...转载 2018-05-23 10:21:58 · 1264 阅读 · 0 评论 -
【numpy】方便功能
import numpy as np#pad填充# Z = np.ones((5,5))# Z = np.pad(Z, pad_width=1, mode='constant', constant_values=0)# print(Z)#NaN与None# print('0 * np.nan = ',0*np.nan) #nan# print('np.nan == np.na...原创 2018-05-26 16:58:50 · 792 阅读 · 0 评论 -
【科赛网15天培训】前期准备
选择错题 #[题目链接](https://www.icourse163.org/learn/NJU-1001571005?tid=1002701006#/learn/ojhw?id=1003423011)def find_person(dict_users, strU): if strU in dict_users: return dict_use...原创 2018-05-20 16:11:35 · 524 阅读 · 0 评论 -
【Python爬虫】获取网易云表单
pip install 配置环境 未成功,因为现在使用的是headless。 用了google的headless,扩展应用一直关不掉,导致运行失败,用Firefox试试原创 2018-05-20 13:07:01 · 436 阅读 · 0 评论 -
【看代码学Python】图像基本处理
import cv2import glob# box folder pathpath = "/box"# original image path#img_path = "/run/media/syc/sakamoto/dianjing/bad_particles/HBsAg_tif"#img_path = "/box"save_path = "/box_cls/"#保存路径fi...原创 2018-05-19 18:03:06 · 342 阅读 · 0 评论 -
Python入门错误集合
1.imshow()失败import tensorflow as tffrom sklearn.datasets import load_digitsimport matplotlib.pyplot as pltimport numpy as npdigits = load_digits() #载入数据集plt.imshow(digits.image[12]) #获取标签为...原创 2018-04-27 20:42:19 · 312 阅读 · 0 评论 -
tensorflow入门:基本语法------未完待续【TensorFlow中的Mini-batching】
以下是tensorflow包导入,默认在每一段代码里都有了from __future__ import print_function,division#_future_必须放在最前边,这个模块比较特别,它可以导入那些在未来会成为标准python组成的新特性import tensorflow as tffrom sklearn.datasets import load_digitsim...原创 2018-04-27 20:39:49 · 307 阅读 · 0 评论 -
c++ \\ Python读文件 + 写入任意文件
import globimport csvimport os#csvFile = open('文件名','r-读,w-写,a-追加',指定缓冲)csvFile2 = open('out_test4.1.csv','r',newline='')num = 0with csvFile as f: for line in f.readlines():...原创 2018-05-18 11:25:42 · 907 阅读 · 0 评论 -
【numpy】linspace用法
linspace 实现等差数列import numpy as npy1 = np.linspace(-10.0, 10.0) # 默认生成50个数据y2 = np.linspace(1.0, 10.0, 10) #指定生成大小为10,从1到10的等差数列print(y)输出: [-10. -9.59183673 -9.18367347 -8.7755102 ...原创 2018-06-06 21:58:21 · 2461 阅读 · 0 评论 -
【python】seaborn可视化
Python 中,数据可视化一般是通过较底层的 Matplotlib 库和较高层的 Seaborn (之前并不知道,留着学)库实现的,本文主要介绍一些常用的图的绘制方法。原创 2019-01-14 22:25:14 · 1284 阅读 · 0 评论 -
【python可视化一Matplotlib 绘制】可视化图片中显示中文
# ----------------------显示中文----神奇般的存在----------------from pylab import *mpl.rcParams['font.sans-serif'] = ['SimHei']# -------------------------显示中文--------------------...原创 2019-01-08 12:49:31 · 751 阅读 · 0 评论 -
【python】pandas
一边删除一边遍历,需要删除后重新建立索引wea= pd.read_csv(path) for i in range(wea.shape[0]): datee = str(wea.loc[i,'date']) #读取某一列 if():#满足某个条件 wea.drop(wea.index[i],inplace=True) wea = wea.re...原创 2019-11-10 13:21:06 · 532 阅读 · 1 评论 -
通过分析ajax网页获取今日头条街拍美图
首先解释下什么是ajax动态网页,刷微博会经常遇见这种,往下一直拉取,就会一直有数据在加载,然后显示在你的界面,类似于下图。也能发现,该网页是通过改变offset(步长为20),来加载数据(观察改步是通过的XHR标签)然后抓取数据。有待学习google开发者F12network如果看ajax加载,需要XHR标签如果看源码,需要Doc标签待有机会,详细解析代码,目前只是崔老师的成功爬...原创 2019-03-01 13:45:48 · 277 阅读 · 0 评论 -
Django连接VUE,前后端分离
搭建Django参考改自here1、创建Django项目:django-admin startproject ulb_manager2、进入项目根目录,创建app作为项目后端cd ulb_managerpython manage.py startapp backend在这里backend为项目后端名字因为已经有了VUE前端,所以目前就只是连接起来,能够在django下连接到前...原创 2018-11-29 12:25:17 · 1638 阅读 · 1 评论