自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Python读取json文件,并将其写入excel

需要对一批谣言数据进行处理,该数据集是由清华大学自然语言处理与社会人文计算实验室整理的与疫情相关的谣言数据。数据集的整体构成如下,共有324个文件,皆放在rumor_weibo文件夹下:每个文件中存储着一个字典类型的数据(注意:字典并非放在列表中),该字典共由11个键值对对构成,如下:对每个键值对的详细描述可参看该数据集的官网,这里就不多说了,主要包括谣言的内容、发布时间、处理结果等。笔者想将这324个文件中的数据存储到一个excel中。1.Python读取json文件(1)首先以读取一个文

2021-04-18 20:25:17 6782 3

原创 Python之使用argparse在命令行读取文件

关于argparse之parser.add_argument()的用法,这篇文章有较为详细的讲解。因为作业需要,我需要在命令行读入txt文件,网上看了不少博客,都没有直接介绍,而小白在自己尝试的过程中踩了不少坑,尽管做法很简单。这里记在这里。1.在Python的shell中写一个 ArgparseTry.py 文件,其中的代码如下:import argparsedef readfile(path): with open(path,'r',encoding='utf-8-sig') as f:

2021-04-12 20:57:35 3828 1

原创 基于维基百科英文语料的Word2Vec模型使用

关于这方面的知识还没有弄透彻模型使用的常用方法有(见博文):另外还可参看gensim.Word2Vec的官方文档记在这里,以免后面忘掉了

2021-04-02 10:17:30 197

李宏毅机器学习学习笔记

李宏毅机器学习学习笔记

2023-08-05

Python安装第三方库笔记

学习python过程中经常需要安装各种第三方库,如beautifulSoup等,把安装过程记在这里,以免忘记了。

2023-04-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除