自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (1)
  • 收藏
  • 关注

原创 centos7 离线环境下配置yum本地源——以python3为例

文章目录前言一、准备工作二、yum本地源搭建三、配置python3各种包前言yum install 是使用centos时都肯定会用到的命令,而在使用yum时国内大部分也肯定配过镜像源比如清华、网易、人大的等等。这一切都建立在一个前提下——服务器能上外网。但假如你突然被派到一个公司做外包,他们公司的服务器只能是离线环境,且服务器是一个清清白白的纯天然无污染centos,该如何部署你所需要的各种开发环境呢?一种解决方案是自己先配置一个yum本地源带过去,就可以直接在那边离线安装了。一、准备工作网

2021-06-29 22:33:09 1020

原创 SQLite_src_全套编译流程

〇、版本信息ToolVersionSQLite3.7.14tcl8.5.9ActiveTcl8.5msys1.0一、安装所需环境本次编译所依据的流程是Sqlite源码文件夹中自带的ReadMe文件:能看出来是在linux环境下的指令,所以我先去配置了一下环境,具体所需如下:1. 安装mingw64mingw64为windows提供了GCC编译器。如果你使用IDE是Clion,那么在一开始配置ToolChains的时候你应该已经下过它了(反正

2020-11-15 09:33:40 947

原创 运行Kettle中spoon.bat 闪退报错“a fatal exception has occurred.“

问题描述:可以保证java环境都配置完成了,kettle_path 变量也配置完了,然鹅运行spoon.bat还是报错:查这个错,会有人告诉你说把spoon.bat里面的1024 2048 改小一点,改成512甚至256…我改了,该报错接着报==OK,具体问题具体分析,还是得看报错日志解决过程:运行SpoonDebug.bat,得到日志文件SpoonDebug.txt获取报错原因:原因并不是space不够什么的。。搜了一下“ndorsed is not supported. En

2020-08-09 00:13:09 4278 2

原创 修复ThinkPad或Lenovo电脑“已插入,未充电”无法充电问题

问题描述:昨天把原配充电线落自习室了,所以在家里我用Lenovo其他型号电脑的充电器给我的ThinkPad New S1 充电,本来没报多大希望,结果居然真能充上!我自然大喜过望,以为一切太平。哪知充满后过了一段时间我把电量耗得差不多打算再充时,发现充不进去了。。插进电源但是接口旁边的指示灯没亮,鼠标悬停在电池角标上也显示“已插入,未充电”。检查电池设置,一切无恙。更可怕的是第二天我用原配充电器插上时,依然是无法充电。。解决方法:把电源拔掉,关机;启动时进入BIOS(不同型号电脑进入的按键不

2020-07-13 13:53:59 47900 16

原创 pyecharts丨页面布局工具——Page 和 Grid

让多张图表展示在同一页面一、 令图表垂直布局——Page二、 令图表水平布局——GridP.S. 如何让两个饼图平行排列?P.P.S. 如何让两张纯图片平行排列?P.P.P.S 如何让两个词云水平排列?比如我想达到的效果图是这样:就要用到pyecharts中的page和grid布局。其中page帮助我们将多个模块垂直组合到一个页面中,grid帮助我们将多个单元素(图、表、overlap、图片)水平或垂直并列布局。先从相对简单的page说起。一、 令图表垂直布局——Page首先import类

2020-07-06 17:12:42 23255 9

原创 LDA模型中文文本主题提取丨可视化工具pyLDAvis的使用

主题模型LDA的实现及其可视化pyLDAvis1. 无监督提取文档主题——LDA模型1.1 准备工作1.2 调用api实现模型2. LDA的可视化交互分析——pyLDAvis2.1 安装pyLDAvis2.2 结合gensim调用api实现可视化p.s. 保存结果为独立网页p.p.s. 加快prepare速度?2.3 如何分析pyLDAvis可视化结果2.3.1. **每个主题表示什么意义?**2.3.2 每个主题有多么普遍?2.3.3 主题之间有什么关联?1. 无监督提取文档主题——LDA模型这个模型

2020-07-05 17:04:16 53926 96

原创 pyecharts丨页面布局工具——grid注意事项和overlap的使用

grid使用注意事项使用grid时,一般情况下,永远不要先给grid加入一个没有x y轴的图,比如饼图、地图等等。当然,两个饼图如何用grid设置为平行我前面也写过了。这里想注意的是一个饼图、一个柱状图平行放置时的情况。比如,你想实现左边饼图,右边柱状图,而如果你先把饼图加进来:# c1是个pie,c9是个bargrid3_1.add(c1, grid_opts=opts.GridOpts(pos_right="55%"))grid3_1.add(c9, grid_opts=opts.GridO

2020-07-04 13:14:43 16077 6

原创 pyecharts丨将主题的演变嵌入时间长河中——主题河流图

主题河流图终于是好像比较高级的图了hhhh但其实早在2008年都有比较出色的运用了,2008年2月,《纽约时报》发布了一个最典型、最著名的河流图的例子《电影的衰退和流动:过去20年的电影票房收入》,描述了从1986年1月到2008年2月期间,所有电影的上映时间以及期间的周票房变化。在这个河流图中,流形状的宽度代表了某部电影的周票房,流形状的起始是由电影的上映时间决定的。颜色由电影的总票房决定,票房就是电影的“附加定量”,颜色越深代表了电影最终票房越高。那么应该怎么去看这个看上去花里胡哨的河流图呢

2020-07-03 20:14:08 9201 2

原创 pyecharts丨关于热力图Heatmap

首先说明本篇讲述的是这个Heatmap。情景描述: 将用户行为放到与周几和具体几点挂钩的层面上展示。具体的讲解放注释里了。codedef heatTime_mi(): from pyecharts.charts import HeatMap import numpy as np # 关于时间格式的数据预处理这些放到另一篇文章里详述了 data = pd.read_csv('data/mi10_user_weibo_time_list.txt', encoding=

2020-07-03 12:59:30 10703 3

原创 python使用pandas和datetime处理时间格式

问题场景:爬虫爬取用户微博的发布时间,保存在csv中。保存格式为2020-01-01 10:10现需要分别提取 年 月 日 时间 做分析;同时已知年月日,希望得到该日是周几。codeimport pandas as pdfrom datetime import datetimet = pd.read_csv('mi10_user_publish_time.txt', encoding='utf-8')# txt中第一行有表头pubtime,所以才有下一行。若文件中每行为纯数据,则直接

2020-07-03 09:53:30 796

原创 中文文本分类_特征选择算法初探

中文文本分类之特征选择0 数据集回顾一点更改1 特征选择_谁更重要?1.1 预处理1.2 三种特征选择方法互信息(Mutual Information)文档频率(Document Frequency)卡方检验(CHI)集成函数1.3 主函调用2 运行结果MI_result3 Reference0 数据集回顾一点更改看过我上篇文章的同学可能还记得我们最后处理得到的训练集,是每个分类一个大txt...

2020-04-07 23:32:25 1367 2

原创 中文文本分类_预处理

中文文本分类之数据预处理0 前期准备语料库停用词其他1 正则匹配* 针对搜狗语料的xml正则匹配出内容和类别2 分训练集和测试集3 合并训练集4 jieba分词收尾0 前期准备语料库我做的是中文新闻分类,新闻分类现有的较流行的语料库包括搜狗新闻语料库、T大的数据、复旦的数据等等。论文看得不算多,找数据的话随便看几篇就知道啦。链接不放了,随便一搜就找得到。对了,吐槽一下搜狗新闻的语料。如果你...

2020-04-07 00:36:29 2424

原创 Python_批量遍历多级文件操作

目的:有多个文件夹,想将每个文件夹中的txt合并到一个txt中,即每个文件夹对应一个txt。保存到根目录即可。注:该方法适用于多级目录下的文件合并原数据文件结构:每个文件夹中有数千条txt文件;预期文件结构:方法:使用 os.walk() 函数,非常方便。函数介绍(懒得读文档,感谢大佬的精彩解释codeimport osimport os.pathimport ti...

2020-04-02 20:37:21 1190

原创 PyCharm_一键pythonic

Pycharm快捷键很多,但个人觉得最好用的是一键PEP8的 Ctrl+Alt+L(注意使用时要设置好与Tim或QQ快捷键的冲突。。)另附Pycharm快捷键大全

2020-04-02 18:18:16 151

原创 2019_SCU_计科笔试_编程

- 完成函数输入一个4位数,求4位数组成的新的最大的4位数和最小的4位数的差。 unsigned DifferFromMaxMin(unsigned num)思路: 很简单,将各位分开 排序,逆序最大-顺序最小code://19 输入一个4位数,求4位数组成的新的最大的4位数和最小的4位数的差。unsigned DifferFromMaxMin(unsigned num) { ...

2020-03-22 20:19:21 258

中文文本分类_新闻语料库.zip

做毕设自用的中文新闻文本分类语料库,整理自搜狗新闻和清华新闻语料,共八个类别,每类已分好4000条训练集和1000条测试集。附赠一份停用词表,综合了哈工大停用词及川大停用词。

2020-04-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除