python笔记
文章平均质量分 82
赵大寳Note
公众号:赵大寳Note(ID:StateOfTheArt),跟我一起探索世界
展开
-
Python大数据工程师速查手册
https://medium.com/towards-data-science/collecting-data-science-cheat-sheets-d2cdff092855转载 2017-10-15 10:20:21 · 463 阅读 · 0 评论 -
Pandas中常用的方法
1、pandas.Series为数据分配索引,例如:data=np.random.randn(5)pd.Series(data, index=['a', 'b', 'c', 'd', 'e'])>>>a -0.287461b 0.736157c 1.759875d -0.238167e 0.621458dtype: float...原创 2017-09-11 21:37:06 · 613 阅读 · 0 评论 -
MAP@K metric for keras with tensorflow backend
https://www.kaggle.com/c/santander-product-recommendation/discussion/25928转载 2017-11-15 11:28:56 · 778 阅读 · 0 评论 -
使用sklearn之LabelEncoder将Label标准化
LabelEncoder可以将标签分配一个0—n_classes-1之间的编码原创 2017-10-29 17:00:12 · 79804 阅读 · 2 评论 -
在Jupyter notebook里使用conda和pip
# Install a conda package in the current Jupyter kernelimport sys!conda install --yes --prefix {sys.prefix} numpy # Install a pip package in the current Jupyter kernelimport sys!{sys.executable} -m转载 2017-12-14 13:23:23 · 1484 阅读 · 0 评论 -
用C#调用命令行运行Python文件
第一次运行的时候会请求Python路径,需要手动定位python.exe的位置 /// <summary> /// C#里运行Python文件 /// </summary> /// <param name="cmd">要运行的python文件</param> /// <param name="args">参数</param原创 2017-12-18 13:30:35 · 5244 阅读 · 0 评论 -
栈的数据结构与基本操作
C语言:// C program for array implementation of stack#include "stdafx.h"#include <stdlib.h>#include <limits.h>// A structure to represent a stackstruct Stack{ int top; unsi...原创 2018-03-30 12:56:12 · 208 阅读 · 0 评论 -
python2与python3的除法
【背景】有一道算法题,在直角坐标系的第一象限内,NxN的区域内有多少个能与原点直线相连又不经过其他整数点的点 我本来想根据数据推理总结出数学公式来,但是归纳了半天还没弄出来还浪费了时间,还不如直接编程解决。我的思路如下: NxN的区域内的整数点与原点相连构成直线斜率各不相同,只要算出有多少个不同的斜率就能得到有多少个不被挡住的点 斜率我准备直接通过点坐标(x,y)y/x得到,但是pyth...原创 2018-03-31 22:15:01 · 1347 阅读 · 2 评论 -
Python数据可视化-seaborn
1、绘制正负样本对比图seaborn.countplotimport matplotlib.pyplot as pltimport seaborn as sns# sns.set(style=&quot;darkgrid&quot;)titanic = sns.load_dataset(&quot;titanic&quot;)f,ax=plt.subplots(1,2,figsize=(11,5))titanic['...原创 2018-04-10 15:17:43 · 522 阅读 · 0 评论 -
Python中的缺失值None和NaN
http://python.jobbole.com/87266/ https://blog.csdn.net/xiaodongxiexie/article/details/54352889转载 2018-06-19 10:42:10 · 4483 阅读 · 0 评论 -
pandas concat
pd.concat([feature,tmp],axis=1):X轴横向拼接,这种拼接方法需要保持两个DataFrame的index一致,如果不一致可以reset_index:tmp = df[df['years'] == year][userd_Feature].reset_index(drop=True)...原创 2018-07-04 11:17:43 · 203 阅读 · 0 评论 -
将Python程序模块化执行python -m
Python 头部 #!/usr/bin/python 和 #!/usr/bin/env 有区别吗?在Python文件中指定Python解释器 https://blog.csdn.net/u011008379/article/details/79319093References: https://segmentfault.com/q/1010000000680188...原创 2018-08-08 20:34:57 · 1009 阅读 · 0 评论 -
Python 头部 #!/usr/bin/python 和 #!/usr/bin/env 有区别吗?
如果你用 python xxoo.py 来运行,那么写不写都没关系,如果要用 ./xxoo.py 那么就必须加这行,这行被称为 shebang, 用来为脚本语言指定解释器.通常认为用 #!/usr/bin/env python 要比 #!/usr/bin/python 更好,因为 python 解释器有时并不安装在默认路径,例如在 virtualenv 中。#!/usr/bin/pytho...转载 2018-08-08 21:30:16 · 347 阅读 · 0 评论 -
python正则表达式从字符串中提取数字
python从字符串中提取数字使用正则表达式,用法如下:## 总结## ^ 匹配字符串的开始。## $ 匹配字符串的结尾。## \b 匹配一个单词的边界。## \d 匹配任意数字。## \D 匹配任意非数字字符。## x? 匹配一个可选的 x 字符 (换言之,它匹配 1 次或者 0 次 x 字符)。## x* 匹配0次或者多次 x 字符。## x+ 匹配1次或者多次 x 字符。...原创 2018-10-15 17:42:39 · 172626 阅读 · 2 评论 -
Pandas DataFrame 行列操作
以下实验中的train.csv文件使用Digit Recognizer中的训练数据集import pandas as pd # 引用pandas库import numpy as np # 引用Numpy库dataset = pd.read_csv("../data/train.csv") #读取csv文件dataset.head() # 查看数据前5行# 随机构造一个5行3列的DataFr原创 2017-08-09 19:22:46 · 23493 阅读 · 0 评论 -
python用tqdm库来实现进度条功能
I’ve been a fan of the tqdm Python module for quite some time, but I found it difficult to find a reason to use it; generally, loops run fast enough that a progress bar is unnecessary. However, I found转载 2017-10-29 16:20:38 · 1730 阅读 · 0 评论 -
用Python将list中的string转换为int
用Python将list中的string转换为int原创 2017-05-15 00:42:01 · 126997 阅读 · 12 评论 -
Python数据结构之集合Set
python中的Set()数据结构具有的一个特殊属性就是Set()中不存在重复元素1、集合定义a=set()2、向Set中添加元素a = set([1,2,3,4])##用adda.add(5)##用或运算符号a |= {6}##Set还有个update函数,可以接受多组参数一次添加到set里a.update([5,6,3], [-11,11])3、Set中的元原创 2017-07-02 11:01:05 · 1289 阅读 · 0 评论 -
机器学习各种相似性度量及Python实现
用scikit cosine_similarity、pairwise_distances计算向量相似度原创 2017-03-05 15:10:50 · 20451 阅读 · 2 评论 -
Python创建二维数组和切片操作
在推荐系统的数据构造时,经常要使用二维数组,通常先创建元素均为0的数组,这要使用Numpy模块中的zeros()函数1.创建一个元素为0的二维数组:from numpy import *b=zeros((2,3))>>array([[ 0., 0., 0.], [ 0., 0., 0.]])2.给数组赋不同值,将第1行赋值为1,2,3a[0]=[1,2,原创 2017-03-01 20:14:02 · 22330 阅读 · 1 评论 -
机器学习中常用的Numpy函数
1、numpy.nonzeros()返回非0元素的索引 如果是二维矩阵的话,返回两个数组。第一个数组包含矩阵非0元素按从左到右从上到下在行上的索引,第二个数组包含矩阵非0元素按从左到右从上到下在列上的索引2、numpy.flatten()返回矩阵展开在一维下的元祖3、numpy.argsort(x)返回元祖x按升序排列的索引值,默认为按照从小到大排列 numpy.argsort(-x) 回元祖原创 2017-07-24 10:33:00 · 9883 阅读 · 0 评论 -
Lambda 表达式
作者:涛吴 链接:https://www.zhihu.com/question/20125256/answer/14058285 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。简单来说,编程中提到的 lambda 表达式,通常是在需要一个函数,但是又不想费神去命名一个函数的场合下使用,也就是指匿名函数。这一用法跟所谓 λ 演算的关系,有点像原子弹和质能方程的关转载 2017-07-26 17:12:43 · 279 阅读 · 0 评论 -
Keras中的多分类损失函数categorical_crossentropy
from keras.utils.np_utils import to_categorical注意:当使用categorical_crossentropy损失函数时,你的标签应为多类模式,例如如果你有10个类别,每一个样本的标签应该是一个10维的向量,该向量在对应有值的索引位置为1其余为0。可以使用这个方法进行转换:from keras.utils.np_utils import to_catego原创 2017-08-07 14:55:19 · 54744 阅读 · 3 评论 -
怎样删除numpy.array中的行或列?
import numpy as npA = np.delete(A, 1, 0) # 删除A的第二行B = np.delete(B, 2, 0) # 删除B的第三行C = np.delete(C, 1, 1) # 删除C的第三列参考引用:https://stackoverflow.com/questions/1642730/how-to-delete-columns-in-numpy-ar转载 2017-08-14 20:51:03 · 51279 阅读 · 2 评论 -
Keras源码分析之常用网络层
Dense层 Dense就是常用的全连接层 源码分析:model = Sequential()model.add(LSTM(4, input_shape=(1, look_back)))model.add(Dense(2213)) ## 2213是输出长度model.compile(loss='categorical_crossentropy', optimizer='adam')mo原创 2017-08-07 21:43:41 · 1274 阅读 · 0 评论 -
Python Excel Mini Cookbook
转载自:http://pythonexcels.com/python-excel-mini-cookbook/To get you started, I’ve illustrated a number of common tasks you can do with Python and Excel. Each program below is a self contained example, ju转载 2017-09-27 14:49:42 · 408 阅读 · 0 评论 -
Windows下python3 连接SQL数据库
20180228更新: 前几天SQL Server Management Studio突然打不开了,提示缺少组件,需要重新安装,我修复和重新安装依然打不开,搜索Google发现是Visual Studio 2015 Shell的问题,修复Visual Studio 2015后果然SQL Server Management Studio,可是根据之前的方法Python却怎么也无法连接SQL Ser...原创 2017-10-01 17:08:49 · 6948 阅读 · 0 评论 -
tensorflow中常用的计算操作
1、tf.reduce_sum从tensor的维度上面计算元素之和tf.reduce_sum( input_tensor, # 输入 axis=None, # 表示在哪个维度进行sum操作。 keepdims=None, # 表示是否保留原始数据的维度,False相当于执行完后原始数据就会少一个维度。 name=None, reduction_ind...原创 2018-10-22 19:09:45 · 1135 阅读 · 0 评论