paulsweet_M
码龄9年
求更新 关注
提问 私信
  • 博客:132,175
    132,175
    总访问量
  • 120
    原创
  • 10
    粉丝
  • 41
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
加入CSDN时间: 2016-08-03

个人简介:你不知道的事!

博客简介:

momo的博客

查看详细资料
个人成就
  • 获得19次点赞
  • 内容获得5次评论
  • 获得39次收藏
创作历程
  • 5篇
    2017年
  • 126篇
    2016年
成就勋章
TA的专栏
  • R
    1篇
  • R
    17篇
  • Linux
    5篇
  • Algorithm
    2篇
  • C
    30篇
  • Advanced Mathema
    2篇
  • Statistics
    2篇
  • game
    2篇
  • life
    2篇
  • python
    18篇
  • ENG
    1篇
  • mooc_python
    12篇
  • python2
    2篇
  • jieba
    1篇
  • python3
    9篇
  • JoinQuant
    2篇
  • Numpy
    6篇
  • PFDA-BOOK
    9篇
  • nltk
    1篇
  • 2Beaty-py
    1篇
  • 文本分类
    1篇
  • 文本预处理
    2篇
  • PAT
    2篇

TA关注的专栏 3

TA关注的收藏夹 0

TA关注的社区 1

TA参与的活动 0

  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

理解 Python 语言中的 defaultdict

转自http://kodango.com/understand-defaultdict-in-python众所周知,在Python中如果访问字典中不存在的键,会引发KeyError异常(JavaScript中如果对象中不存在某个属性,则返回undefined)。但是有时候,字典中的每个键都存在默认值是非常方便的。例如下面的例子:strings = ('puppy', 'kitten',
转载
发布博客 2017.04.27 ·
621 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

class--review python

通过学习Java与Python的类部分可以发现Java的一个类就写成一个文件,几个类合成一个package;而Python不同,一个文件看成一个module,即*.py的文件,一个module由多个类合成。 即:Java: project – package – class(文件级) Python: package – module (文件级)– class
原创
发布博客 2017.04.23 ·
391 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

def参数--review python

Python的函数定义中有两种特殊的情况,即出现*,**的形式其中 * 用来传递任意个无名字参数,这些参数会一个Tuple的形式访问。 **用来处理传递任意个有名字的参数,这些参数用dict来访问,键-值的形式。
原创
发布博客 2017.04.23 ·
421 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

while & list--review python

1.列表之间移动元素list1=[1,2,3]list2=[]while list1: temp = list1.pop() list2.append(temp)list2.reverse()2.删除list里特定元素list1=[1,2,3,1,3,2,1]while 1 in list1: list1.remove(1)list13.填充字典dict1 = {}p
原创
发布博客 2017.04.23 ·
396 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

dict--review python

dict工厂函数可以处理两种对象: dict(mapping obj) dict(iterable obj)a = dict(one=1, two=2, three=3) #第一种b = {'one': 1, 'two': 2, 'three': 3}c = dict(zip(['one', 'two', 'three'], [1, 2, 3])) #第二种d = dict([('two
原创
发布博客 2017.04.22 ·
304 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

特征工程

转载
发布博客 2016.11.30 ·
283 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

PAT (Basic Level 1001-python3)

卡拉兹(Callatz)猜想:对任何一个自然数n,如果它是偶数,那么把它砍掉一半;如果它是奇数,那么把(3n+1)砍掉一半。这样一直反复砍下去,最后一定在某一步得到n=1。卡拉兹在1950年的世界数学家大会上公布了这个猜想,传说当时耶鲁大学师生齐动员,拼命想证明这个貌似很傻很天真的命题,结果闹得学生们无心学业,一心只证(3n+1),以至于有人说这是一个阴谋,卡拉兹是在蓄意延缓美国数学界教学与科研的进
原创
发布博客 2016.11.25 ·
442 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

PAT (Basic Level 1002-python3)

卡拉兹(Callatz)猜想:对任何一个自然数n,如果它是偶数,那么把它砍掉一半;如果它是奇数,那么把(3n+1)砍掉一半。这样一直反复砍下去,最后一定在某一步得到n=1。卡拉兹在1950年的世界数学家大会上公布了这个猜想,传说当时耶鲁大学师生齐动员,拼命想证明这个貌似很傻很天真的命题,结果闹得学生们无心学业,一心只证(3n+1),以至于有人说这是一个阴谋,卡拉兹是在蓄意延缓美国数学界教学与科研的进
原创
发布博客 2016.11.25 ·
863 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python for Data Analysis (11)

### pandas知识罗列---#### Series1. series 是类似turple结构的一维数组对象,并可以通过turple来创建;索引在左边,值在右边;索引和值之间有link;2. series 是有name属性3. series 有检测缺失数据(NaN)的函数:isnull,notnull---#### DateFrame4. DateFrame 是
原创
发布博客 2016.11.22 ·
468 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python for Data Analysis (10)

numpy创建数组array,zero,arrange,ones,eye,思想可以是列表到ndarray,经过reshapedtype,注意astype方法数组提供了批量计算的方法,大小相等的数组之间大小不同的数组之间的运算比较特别叫“广播”切片!!!数组和列表不一样,数组切片是原始数组的视图,只有通过np.copy方法可以得到副本而非视图
原创
发布博客 2016.11.16 ·
358 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

distribution relationship

转载
发布博客 2016.11.13 ·
331 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

文本预处理学习(2)

R包之tm:文本挖掘包简介安装数据输入—文集(corpus)数据输出查看语料库(corpora)查看某几条信息查看单个文档元数据查看单个文档内容查看多个文档内容变换(transfo
转载
发布博客 2016.11.01 ·
1251 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

文本预处理学习(1)

nchar和length的字符统计nchar是向量元素的字符个数,而length是向量长度(向量元素的个数)x=c('hello world','1','12')nchar(x);length(x)length('');nchar('')字体大小写tolower,toupper,chartrDNA='AtGCtttACC'tolower(DNA);toupper(DNA)chartr(old
原创
发布博客 2016.10.28 ·
2134 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

文本分类的数据预处理流程介绍

在进行文本分类时,毫无疑问会涉及到对文本数据进行预处理,包括文档切分、文本分词、去停用词(包括标点、数字、单字和其它一些无意义的词)、文本特征提取、词频统计、文本向量化等操作。下面就这几方面作一个概括性的介绍,具体的实现还有待慢慢的研究。文档切分文档切分这个操作是可选的,取决于你获取到的文档集合的形式。如果你得到的文档集合本身就是一篇一篇文章分开的,那么这一步就可以省略了。反之,如果文档集合是一
转载
发布博客 2016.10.26 ·
25360 阅读 ·
5 点赞 ·
2 评论 ·
34 收藏

Transforming Code into Beautiful,Idiomatic Python(1)

原文位置:http://sssslide.com/speakerdeck.com/pyconslides/transforming-code-into-beautiful-idiomatic-python-by-raymond-hettinger-1When you see this, do that instead!Replace traditional index manipulation w
转载
发布博客 2016.09.21 ·
372 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

词频直方图

词频直方图算词频import nltk#加载Gutenberg语料库from nltk.corpus import gutenberggutenberg.fileids()['austen-emma.txt', 'austen-persuasion.txt', 'austen-sense.txt', 'bible-kjv.txt', 'blake-poems.txt', 'bryan
原创
发布博客 2016.09.20 ·
1474 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Python for Data Analysis (9)

魔法命令a=1;b=100a*b%timeit a*bThe slowest run took 15.46 times longer than the fastest. This could mean that an intermediate result is being cached.1000000 loops, best of 3: 201 ns per loopimport numpy
原创
发布博客 2016.09.19 ·
523 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python for Data Analysis (8)

字典#update方法,一个字典可以被合并到另一个字典中去:d1={1:'a',2:'b'}d1.update({3:'c',4:'d'})d1dict(zip(range(4),reversed(range(5))))d1.get(1)默认值!!1.一个常见的逻辑: if key in some_dict: value=some_dict[key] else:
原创
发布博客 2016.09.19 ·
468 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python for Data Analysis (7)

enumerate它可以逐个返回序列的(i,vlue)元组,可以用于映射其所在位置的字典#语法for i, value in enumerate(collection): #用value做一些事情list1=['foo','too','foor']for i,value in enumerate(list1): print i,value0 foo1 too2 foorma
原创
发布博客 2016.09.16 ·
353 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python for Data Analysis (6)

range和xrange两者区别,xrange多用于范围较大的情况,其参数与range是一样的,但它不会预先产生所有的值并将它保存在列表中,而是返回一个用于逐个产生整数的迭代器。注意!! 在python3中,range始终返回迭代器,因此也就没有xrange函数。sum=0for i in xrange(10000100): if i%3==0 & i%5==0: su
原创
发布博客 2016.09.13 ·
394 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多