- 博客(4)
- 资源 (10)
- 收藏
- 关注
原创 Introduction to Latent Dirichlet Allocation (LDA主题模型入门)
本文主要是《Introduction to Latent Dirichlet Allocation》的读书笔记 先概括一个最重要的过程: 1. LDA中其实最重要的是:一个单词w属于哪个主题t ! 2. 随机将某个单词wi赋给主题ti,这样我们就得到一个东西(这里先不提这个东西是什么) 3. 根据这个东西,我们能够重新将wi赋给一个新的更好的主题tj 4. 第2步和第3步重复即可
2016-08-24 09:50:45 543
原创 python字符串编码和转换
1. python内部以unicode编码存储字符串(和java类似),非unicdoe编码间转换需要经过unicode作为中间媒介 2. 如果字符串本身就是unicode,那么直接encode进行转换;如果字符串是utf-8,那么先转换为unicode(即decode过程),然后在转换为gb2312(即encode过程) #!/usr/bin/env python #coding=utf-8
2016-08-17 12:36:20 1372
原创 Python模拟C语言的三目运算
首先,python中没有C语言中的三目运算,即Python没有 a ? b : c 的语法。但是可以python模拟这种运算。 C语言: result = condition ? true_part : false_part python: result = condition and true_part or false_part
2016-08-17 09:56:48 423
原创 Python的一个坑
今天发现了Python一个坑。 我们知道Python中函数跟C++一样,可以设置默认参数,比如: def func(x, y=1): print(x, y) func(x=10) >> 10 1 y有一个默认值1,所以函数调用的结果是打印10 1 但是如果默认值是这样的: class Food: def __init__(self): self
2016-08-11 13:57:09 666
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人