自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小白兔的窝

心平气和,不起执念。

  • 博客(30)
  • 资源 (1)
  • 收藏
  • 关注

原创 python:pandas包

例子:列表的按列取数

2016-04-26 22:12:51 787

原创 python:集合set的操作

当列表中存在多个重复元素,待删除时,Set删除高效而方便。集合的添加有两种常用方法,分别是add和update。1. 集合add方法:是把要传入的元素做为一个整个添加到集合中,例如:>>> a = set('boy')>>> a.add('python')>>> aset(['y', 'python', 'b', 'o'])2. 集合update方法:是把要传入的元素打散,逐

2016-04-26 21:04:53 720

原创 python:有序字典与嵌套字典

1. OrderedDict 有序字典OrderedDict是dict的子类,它记住了内容添加的顺序。而普通字典是无序的。普通字典>>> import collections>>> d=dict()>>> d['a']='A'>>> d['b']='B'>>> d['c']='C'>>> for k,v in d.items(): print k,va Ac Cb B

2016-04-26 20:30:03 4041

原创 算法:拓扑排序

定义:对一个有向无环图(Directed Acyclic Graph简称DAG)G进行拓扑排序,是将G中所有顶点排成一个线性序列,使得图中任意一对顶点u和v,若边(u,v)∈E(G),则u在线性序列中出现在v之前。通常,这样的线性序列称为满足拓扑次序(Topological Order)的序列,简称拓扑序列。应用:有向图来表示,图中的顶点代表活动(子工程),图中的有向边代表活动的先

2016-04-26 20:08:32 830

原创 python:if __name__ == '__main__': 的作用

python中if __name__ == '__main__': 的解析当你打开一个.py文件时,经常会在代码的最下面看到if __name__ == '__main__':,现在就来介 绍一下它的作用.        模块是对象,并且所有的模块都有一个内置属性 __name__。一个模块的 __name__ 的值取决于您如何应用模块。如果 import 一个模块,那么模块__nam

2016-04-18 16:07:34 730

原创 程序员养生

作为一名准coder,已经能够感觉到自己身上的变化:眼睛干涩、颈椎酸痛变形、皮肤变差作为一名female,第三点是最无法容忍的。日积月累,会让你渐渐脱离自己的本征。国外程序员Zed A. Shaw 给出了一些实质性的建议:“你要一贯地保持健康,因为身体好时会减少对精神的摩擦损害,而将注意力集中到要事上,而不是你生理上的小毛病。”“真正的编程者都是有点傻蛋。他们从来吃不到正...

2016-04-17 20:06:14 3242 5

原创 python:inspect函数自动生成函数名

有时候我们会碰到这样的需求,需要执行对象的某个方法,或是需要对对象的某个字段赋值,而方法名或是字段名在编码代码时并不能确定,需要通过参数传递字符串的形式输入。举个具体的例子:当我们需要实现一个通用的DBM框架时,可能需要对数据对象的字段赋值,但我们无法预知用到这个框架的数据对象都有些什么字段,换言之,我们在写框架的时候需要通过某种机制访问未知的属性。这个机制被称为反射,或是自省,用于实现在运行

2016-04-16 14:42:55 3390

原创 Python工具:保留小数的指定有效位数

处理一个数据文件,发现数据不一致,小数点后有三位、四位、六位、更多位。部分还进行四舍五入。需要对数据文件进行处理。如果有效位超过6位,则四舍五入。如果小于6位,则保持原来的数字不变。考虑两种情况:小数点后无数字:判断数字有效位(len(str(num))-1)是否超过6,超过则通过整除去尾,没有则返回小数点后有数字:判断数字有效位(len(str(num))-1)是否超过6,超过则

2016-04-12 17:59:25 68451

原创 机器学习:好用的工具包

libliner:  logisticlibfm:     矩阵分解xgboost:  gbdtspark shell:单机配置spark环境

2016-04-12 10:17:33 1061

原创 【Python】如何将字符串作为变量名

一共三种方法:>>> var = "This is a string">>> varName = 'var'>>> s= locals()[varName]>>> s'This is a string'>>> s2=vars()[varName]>>> s2'Thi...

2016-04-11 15:37:47 109184 5

原创 Python:字符串的多重替换

字符串的多重替换:(1)把str中出现的所有s1字符串替换为str2字符串:str.replace(s1, s2) (2)把str中出现的所有s1,s2字符串分别替换为s3,s4字符串:str.replace(s1, s3) .replace(s2, s4)(3)把str中出现的所有s1,s2字符串替换为s3字符串:酌情使用正则:import re;  re.sub(“conditio

2016-04-11 11:47:34 3159

原创 Python陷阱:tuple与Nonetype

1. 慎重使用tuple处理string生成的list首先我要把从文件里逐行读取的字符串转变为数字列表,正确的是:>>> [float(item) for item in "1e2 to 2".split() if item not in ["to", " "]][100.0, 2.0]接着读取到某一行时,出现一个“le” 无法转换类型,于是报错:>>> [float(item) f

2016-04-11 11:30:44 7771

原创 笔试题:腾讯基础研究方向

编辑公式不方便,需要公式可自己上网查,这里只给形象的概念帮助记忆。1. 数学问题:3sigma原理,T分布,特征根,特征值,最大似然估计,马尔科夫链。(1)3sigma原理在正态分布中σ代表标准差,μ代表均值x=μ即为图像的对称轴,三σ原则即为:数值分布在(μ—σ,μ+σ)中的概率为0.6526数值分布在(μ—2σ,μ+2σ)中的概率为0.9544数值分布在(μ—3σ,μ+

2016-04-10 22:11:19 3524

原创 互联网时代:天才与伟人的区别

无意中看到一篇文章,是关于互联网时代天才和伟人的区别,很受触动。一直以来,都把人文方面的爱好与专业隔离开来,觉得人文的东西是个人的,专业的东西是社会性的。为了安抚精神而去接近自然、接近内心;为了谋生,为了价值实现,去学习去工作。而工作的目的也仅仅是为了有更多时间与资源去接近想要的精神生活。可是这两个人的对话,打通了人文理念与产品的任督二脉,对人性的洞察更是细致入微。难得有机会这么从头到尾地

2016-04-10 19:45:04 7317 3

原创 【技术】Word转PDF图像失真的解决方法

用Word自带的功能pdf生成PDF格式的文档,发现图像颜色变得很淡。对于学术论文来说肯定是不过关的,因此找了以下解决方式:1. 关于使用word2013转换成pdf后图片失真的解决方法方法一:增加word中图片的采样方式。在文件-选项-高级-图像大小和质量 中去除“不压缩文件中的图像”,默认目标输出设置为最高的ppi,220ppi​​​​。如果该方法输出的pdf依然失真,用下面的...

2016-04-10 13:49:28 92485 3

原创 python解析:Java环境配置简化版

1. 下载安装jdk怎样判断JDK已经安装成功windows下:开始->运行->键入cmd->在窗口中输入 javac-> 回车,看看是否出来java相关命令的参数。java -version 查看JDK的版本信息。2. 写入path路径例如:D:\Program Files\Java\jdk1.8.0_77\bin3. 运行第一个java文件public clas

2016-04-08 10:58:45 1251

转载 代码迁移攻略:在Java工程中调用Python代码

Python是一门好用的脚本语言,底层基于C实现,快速且简单。使用python可以说是站在巨人肩膀上编程,使得程序员更专注于业务及逻辑,而不是被人学烂的语言工具。但是团队合作时候,就会有一些多语言编程,然后集成的问题,例如我遇到的Java和Python。为了方便非Python程序员能够使用写好的python程序,需要考虑两个方面: - 环境是否可迁移,在没有python环境的机器上如何运行。

2016-04-07 18:55:21 9605 8

原创 机器学习:防止过拟合的方法

在对模型进行训练时,有可能遇到训练数据不够,即训练数据无法对整个数据的分布进行估计的时候,或者在对模型进行过度训练(overtraining)时,常常会导致模型的过拟合(overfitting),即模型复杂度比实际数据复杂度还要高。防止过拟合,主要从以下几方面着手:模型参数:减少特征、权值衰减、early stopping数据集:数据集扩增(源头取数、随机噪声、重采样、分布估计)、验证

2016-04-07 13:18:52 6814

转载 机器学习:金融领域的岗位需求

1.蚂蚁金服招聘资深推荐算法工程师岗位描述:1、结合业务需要提出合适的算法解决方案,推动方案在业务系统中实现,构建实时化高并发系统,尤其是基于大规模用户行为,建立推荐系统。算法包括但不限于机器学习、推荐系统、自然语言处理、文本挖掘等;2、从数据中发现现有系统和算法的不足,提出改进的算法并推动实现;3、追踪算法前沿技术,结合业务特点,探索将前沿的算法技术应用于实际业务岗位

2016-04-06 17:18:22 9846

原创 贝叶斯网络:Netica的使用记录

1. 节点的Name与Title区别。name是根据IDname的命名规则,只能用字母开头,随后跟数组、下划线。不能出现空格或者发音。Title突破了这一限制。系统首选Title,如果没有,用name作为节点名字。2. 节点的Status Value与 Table Value的区别。Status对应着状态的名字,可以是单词,Status Value表示状态对应的值。例如爆炸控制系统中“off”状态

2016-04-05 13:55:15 13211 7

原创 笔试题:SQL

1. 题目:答案(待确定):select * from t_score group by FUin having count(FName)>=2 order by AVG(FScore) DESC

2016-04-04 20:58:28 686

原创 LeetCode:蛇形矩阵II(spiral matrix II)

原题:

2016-04-04 20:33:25 1426

原创 LeetCode:简化路径(Simplify Path)

题目:Given an absolute path for a file (Unix-style), simplify it.For example,path = "/home/", => "/home"path = "/a/./b/../../c/", => "/c"Corner Cases:Did you consider the case where path = "

2016-04-04 15:47:41 9183

原创 一道有趣的数学题

题目:假设现在有16个石子,A和B每次可以取走1,3,6个,每次不能不取。最后一个把石子取完的人胜利。现在A先取,问如何取数才能保证自己胜利。思路:从三个数的组合下手。1,3,6两数相加可得:2,4,6,7,9,12。由于题目是要保证A有100%的胜利,因此假设B和A一样聪明,每次都会取最有利的石子数。(1) A给B剩2个:B只能选1个,剩1个,A必胜;(ok)(2) A给B剩4个:B

2016-04-03 22:02:53 1193

原创 LeetCode:计算相同数组元素的下标差(Contains Duplicate II)

题目:Given an array of integers and an integer k, find out whether there are two distinct indices i and j in the array such that nums[i] = nums[j] and the difference between i and j is at most k.

2016-04-03 18:41:18 823

原创 LeetCode:有效变形词(Valid Anagram)

题目:Given two strings s and t, write a function to determine if t is an anagram of s.For example,s = "anagram", t = "nagaram", return true.s = "rat", t = "car", return false.Note:You may assu

2016-04-03 17:01:34 899

原创 LeetCode:最长公共前缀(Longest Common Prefix)

题目:Write a function to find the longest common prefix string amongst an array of strings.找一个字符串数组元素的最长公共前缀。思路:首先判断函数返回为空的条件(数组为空或存在空字符串)。随后求得子串的最小长度k,作为公共子串的长度上限。依次取第一个字符串的前k个字符,去与剩下的比较,不同则返

2016-04-03 16:38:20 617

原创 LeetCode:求阶乘后面的0的个数(Factorial Trailing Zeroes)

题目:原地址 Given an integer n, return the number of trailing zeroes in n!. Note: Your solution should be in logarithmic time complexity.思路:只有2和5相乘才会出现0,其中整十也可以看做是2和5相乘的结果,所以,可以在n之前看看有多少个2以及多少个5就行了。

2016-04-03 15:54:48 1430

转载 python中的operator库

这个模块提供了一系列的函数操作。比如,operator.add(x, y)等于x+y a = [1,2,3]b = [5,6,7]c = map(operator.mul, a, b)c的值就为[5, 12, 21] abs(...) abs(a) -- Same as abs(a). add(...) add(a, b)

2016-04-03 10:57:47 3532 1

原创 机器学习:贝叶斯网络入门

贝叶斯理论是处理不确定性信息的重要工具。作为一种基于概率的不确定性推理方法,贝叶斯网络在处理不确定信息的智能化系统中已得到了重要的应用,已成功地用于医疗诊断、统计决策、专家系统、学习预测等领域。它有几个特性1、贝叶斯网络本身是一种不定性因果关联模型。贝叶斯网络与其他决策模型不同,它本身是将多元知识图解可视化的一种概率知识表达与推理模型,更为贴切地蕴含了网络节点变量之间的因果关系及条件相关关

2016-04-02 16:57:46 3091 1

社交网络分析教程:使用 NodeXL 分析和绘制社交网络

Mapping Twitter Topic Networks-From Polarized Crowds to Community Clusters.pdf

2021-08-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除