
python学习
文章平均质量分 88
程序员bigsai
坚持分享学习,写了一本原创数据结构与算法pdf分享给大家。
展开
-
python 学习笔记(基础输入输出,字符串,循环,三种数组)
学习python发现这门语言和其他语言有很多不同之处,比如python的变量不需要要声明类型,python是解释性语言所以要注意函数定义的位置,python注重代码格式而不注重符号。python方便得数组元组和强大的内置爬虫库。写的可能不够详细不够好但是主要想通过文章以后看的时候回想知识点。 python的输入输出:python输入默认为String类型,如果需要int或其他类型需要转换。...原创 2018-10-23 23:41:32 · 8183 阅读 · 0 评论 -
python3爬虫入门(urllib和requests简单使用)
知道python有强大的的爬虫库,但是对于我们普通小白来说,写一个完整的爬虫需要知道什么甚至了解什么都是很重要的。掌握了这些基本点,才能够熟悉爬虫的构成和获取有用的信息。 编写一个小爬虫个人感觉可以分为三个阶段: 1:请求,这个就是使用urlib2或者requests发送http请求。要掌握期中一些用法以及一些常用的请求方式。 2:解析,当得到一个网页的html,我们要用一些工具解析文...原创 2018-10-24 23:56:43 · 7063 阅读 · 3 评论 -
python正则group()的用法—正则提取括号内以及其他符号内内容
python正则提取括号内以及其他符号内内容,我以前学过一点点正则,但是学的不深,用的正则也是最笨的正则方法,只会group(0). 然而,我今天又看了下正则,发现正则的提取确实好用。无论爬虫还是文本分析都很方便。可以 解决特定的需求。 举个例子,在以前我提取dsgs(gad)gdagda的时候,正常有两种方式:一个是字符串分割,分割几次就能找到想要的内容一般,第二是正则...原创 2018-12-12 16:29:56 · 8256 阅读 · 6 评论 -
python可视化文本分析(2)—snownlp jieba分析QQ群成员发言情况
今天花时间吧第二个情感分析写出来,主要通过python实现qq群消息分析,分析群成员发言总次数,群成员情绪对比,单个群成员的发言词云状况以及单个同学的发言情感走势。 用到一下库: re正则,matplotlib,wordcloud,numpy,jieba分词,snownlp情感分析。 上述库的用法很简单,安装也很简单,所以不需要担心门槛。 最好结合第一篇或者先看第一篇 详细说一下...原创 2018-12-28 19:12:57 · 5844 阅读 · 5 评论 -
matplotlib关于坐标轴数据显示的几个重要参数
在使用matplotlib显示数据的过程中,我在显示的时候一直达不到满意的效果,经过很多的百度和查询,先整理了这些知识点,留备以后再继续扩充。 plt.rcParams[‘font.sans-serif’] = [‘SimHei’] # 用来正常显示中文标签 plt.subplots_adjust(bottom=0.2)底层比例 plt.xticks(range(0,24,1),...原创 2018-12-23 17:23:35 · 17690 阅读 · 2 评论 -
python可视化文本分析(1)—分析QQ班群聊天记录宏观
前一段时间就想做简单的可视化文本分析玩,今天就花点时间先对整体班级的QQ群聊天信息做一个简单的分析。 打算分两步做,本文是最简单的第一步过程 1:分析整个聊天记录的时间分配。并且用matplotlib展示出来。并把整个聊天的关键词做成词云。 2:融入snownlp情感分析,分析每个同学的词云分布,每个同学的发言次数情况,以及每个同学文本的情绪走势以及展示。 等等 总的来说就是先试...原创 2018-12-23 21:42:34 · 5873 阅读 · 0 评论 -
python使用matplotlib制作条形图添加数据标签
在使用matplotlib展示数据的时候,当我们用到条形图的时候南面会遇到一些问题: 水平条形和竖直的条形问题: 解决方法就是更改下函数名,plt.bar()是默认竖直,而plt.barh()是默认水平,只不过坐标轴需要改动。 数据展示的时候光秃秃的数据也不知道是多少,总想添加个数据标签在头上能够清楚的看到数据。 经过百度的一些查找找到一些解决方案。也认清了一些规则,至于标...原创 2018-12-24 22:00:45 · 29342 阅读 · 5 评论