自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (1)
  • 收藏
  • 关注

原创 用python分析微信朋友圈

1.朋友圈好友数据提取与存储这个功能可分为三步实现:模块一: 登录模块import itchatdef get_data(): itchat.auto_login() friends=itchat.get_friends(update=True) return friends模块二:数据提取模块​​​​​​​        将好友的姓名、备注、性别、省...

2019-02-13 19:06:29 808 1

原创 python正则表达式

正则表达式1.定义通用的字符串表达框架 简洁表达一组字符串的表达式 判断某字符串的特征归属2.正则表达式的使用 编译-------将符合正则表达式语法的字符串转换成正则表达式特征3.正则表达式的语法 正则表达式由字符和操作符组成                                 4. Re库的使用  re.search...

2019-02-12 21:06:30 161

原创 python的wordcloud库

wordcloud库1.定义wordcloud是优秀的词云展示的第三方库 2.基本使用        3.英文效果 import wordcloudc=wordcloud.WordCloud()c.generate("worldcloud by Python")c.to_file("pywordcloud.png")                 ...

2019-02-11 22:22:39 315

原创 python文件

文件1.文本文件由单一特定编码组成的文件,如UTF-8编码 被看成是存储着的长字符串 适用于.txt文件、.py文件等2.二进制文件直接由比特0和1组成,没有统一字符编码 一般存在二进制0和1的组织结构,即文件格式 适用于.png文件、.avi文件等 3.文件的使用文本文件vs二进制文件                 4.文件的打开文件处理...

2019-02-11 16:44:21 221

原创 python的time库

time库1.定义time库是python中处理时间的标准库2. time库的使用时间获取-------time() ctime() gmtime() 时间格式化-------strftime()  strptime() 程序计时-------sleep()  perf_counter()3.时间获取函数time()-------获取当前时间戳,浮点数形式 ...

2019-02-11 11:05:08 17803

原创 python字符串应用

python字符串1.定义字符串是由一对单引号或一对双引号表示 字符串是字符的有序序列,可以对其中的字符进行索引 字符串从0开始索引2. 表示方法单引号表示------‘abc’ 双引号表示------"中国" 字符串中含单引号或双引号-------'这里有个双引号(")' 或者 "这里有个单引号(')" 字符串中既有单引号又有双引号------''' 这里既有单引...

2019-02-10 22:39:06 322

原创 三国演义任务出现词频统计

使用jieba库将文本中的词汇进行提取,需要注意的是文本要存储为utf-8格式,否则会报错。代码import jiebatxt = open("threekingdoms.txt","r", encoding="utf-8").read()words = jieba.lcut(txt)counts = {}for word in words: if len(word...

2019-02-09 20:55:30 1291

原创 Hamlet词频统计实例

统计Hamlet中词频最高的十个词语,文章在https://python123.io/resources/pye/hamlet.txt思路获取Hamlet文章,对文章进行处理,将所有大写字母转换成小写,将所有特殊符号转换成空格 将所有单词以及出现的次数加到字典,转换成列表并进行排序 将排序后前十个输出,即为词频最高的词汇 将文章保存为TXT格式,并保存在代码所存的文件夹中代码...

2019-02-09 20:03:53 3708

原创 python的jieba库

jieba库1.jieba库安装命令行输入 pip install jieba 2. jieba分词的原理利用一个中文词库,确定汉子之间的关系概率 汉字间概率大的组成词组,形成分词结果 除了分词,用户还可以添加自定义的词组3.jieba库的使用 jieba库分为精确模式、全模式、搜索引擎模式4.jieba库的常用函数    ...

2019-02-09 18:59:52 2141

PAT乙级1022 D进制的A+B

PAT乙级1022源代码 codeblocks 输入两个非负10进制整数A和B(<=230-1),输出A+B的D (1 < D <= 10)进制数。

2018-06-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除