python
BabY虎子
新手一个,纯属娱乐~
展开
-
Python爬取高清图片
placeholder原创 2017-10-11 16:55:55 · 1316 阅读 · 0 评论 -
numpy计算两二维数组距离
利用numpy可以很方便的计算两个二维数组之间的距离。二维数组之间的距离定义为:X的维度为(a,c),Y的维度为(b,c),Z为X到Y的距离数组,维度为(a,b)。且Z[0,0]是X[0]到Y[0]的距离。Z(m,n)为X[m]到Y[n]的距离。如下图所示。代码如下:#computer the distance between text point x and train point x_train原创 2017-12-22 10:14:34 · 7273 阅读 · 1 评论 -
python3调用百度翻译接口样例
baidu开放的翻译接口python语言的demo是2版本的,稍作修改在python3跑了下,并将结果写入文件中。#coding=utf-8import http.clientimport hashlibfrom urllib imp原创 2017-11-15 14:48:06 · 5199 阅读 · 0 评论 -
python3打开pkl文件
python中带有pickle包对pkl文件进行操作。 打开带有中文的pkl文件,需要指定编码格式:import pickle# f = open('dict_word.pkl', 'rb')# for line in f:# print(line)dict_word = pickle.load(open("dict_word.pkl", 'rb'), encoding='utf-8原创 2017-10-30 12:06:28 · 29779 阅读 · 3 评论 -
Elasticsearch入门2 导入导出数据
将数据导入导出elasticsearch,对elasticsearch进行查询是常用操作。python特供很方便的接口,对数据进行导入导出。参考博客python批量导入数据进Elasticsearch Term精确匹配中文字符串短语原创 2017-09-12 19:12:34 · 1687 阅读 · 0 评论 -
python开发常用命令小结
conda命令virtualenv命令linux命令python命令原创 2017-08-31 17:26:22 · 1672 阅读 · 0 评论 -
正则表达式小应用
正则表达式在处理文本尤其是对文本进行过滤和筛选等工作时很有用,经常用于字符串的匹配等操作。原创 2017-05-31 11:37:28 · 339 阅读 · 0 评论 -
python kmp算法简单实现
def getnext(a,next): al = len(a) next[0] = -1 k = -1 j = 0 while j < al-1: if k == -1 or a[j] == a[k]: j += 1 k += 1 next[j] = k原创 2017-04-26 10:21:21 · 1976 阅读 · 0 评论 -
python快排
快排最少的时间复杂度是O(n),平均是O(n logn),最坏O(n^2)。#quick_sort原创 2017-04-17 09:16:01 · 1840 阅读 · 0 评论 -
统计学习方法 习题5.2 python实现
根据表5.2所示的数据,用平方误差损失准则生成二叉回归树二叉回归树的算法为:其中公式5.21中的c1,c2分别为R1和R2上数据的平均值代码仿照机器学习实战上关于决策树实现:原创 2017-03-20 00:36:34 · 2094 阅读 · 0 评论 -
统计学习方法 习题5.1 c4.5实现
题目要求:根据训练数据集,利用信息增益比(C4.5算法)生成决策树。信息增益比算法是id3算法的改进:信息增益比的定义:代码实现(机器学习实战的改编,保存为tree.py):from math import logimport operatordef createDataSet(): dataSet = [1,0,0,1,0],\原创 2017-03-20 09:11:17 · 1164 阅读 · 0 评论 -
leetcode 64&70
两道比较简单的动态规划问题,用python实现64题大概意思是给出一个矩阵,从左上到右下最的和最小,70题就是更熟悉的爬楼梯的问题。其实也是对python语法进行熟悉,不像c语言有数组的概念,python里面用list实现类似的功能。但是,还是有些不一样的地方。class Solution(object): def minPathSum(self, grid): "原创 2016-12-11 18:41:34 · 407 阅读 · 0 评论 -
leetcode 110
解题思路:平衡树是一棵树中每个节点的左右子树的高度差不大于1。递归,面向对象,self。两个函数,一个求某个节点的高度,另一个递归求书否为平衡树。class Solution(object): def isBalanced(self, root): """ :type root: TreeNode :rtype: bool原创 2016-11-07 09:43:40 · 377 阅读 · 0 评论 -
leetcode 104
求树的深度,与110类似。# Definition for a binary tree node.# class TreeNode(object):# def __init__(self, x):# self.val = x# self.left = None# self.right = Noneclass Solution原创 2016-11-07 09:49:58 · 341 阅读 · 0 评论 -
leetcode 344
字符串倒置问题。python中字符串是不可改变的对象,无法直接修改某一位的字符,可以先将字符串转换为list,在进行操作。class Solution(object): def reverseString(self, s): """ :type s: str :rtype: str """ t = list(s原创 2016-11-07 10:06:28 · 291 阅读 · 0 评论 -
leetcode 345
题目意思是让一个string类型中的原因字母前后调换顺序,典型的字符串处理问题,要注意的是原因字母可以是大写或者小写。用两个指针一前一后遍历原因字母。原创 2016-11-08 10:33:25 · 378 阅读 · 0 评论 -
python对xml的处理和文件的写入操作1
今天查找了一些python对xml文档的处理,之前用过java对xml文件进行处理,这个以后应该还会用到,这里先记录一下最基本的用到的操作。要解析的xml文档格式为可以先用notepad进行一些处理。代码为:try: import xml.etree.cElementTree as ETexcept ImportError: import xml.etre原创 2016-11-21 10:40:15 · 2863 阅读 · 1 评论 -
Python爬取当当网亚马逊书名
爬取当当网,亚马逊书名原创 2017-12-18 22:57:04 · 1278 阅读 · 0 评论