ArcGIS 10.8 帮助文件词频统计

11 篇文章 4 订阅
9 篇文章 1 订阅

对 ArcGIS 10.8 本地帮助文件(chm)做了统计。结果显示,帮助文件合计10398个页面(比想象中大好多),14358147个字,词频统计来看,出现最多的词是 ‘数据’ ,出现了48998次,其次是 ‘要素’,’使用’,和 ‘工具’。
具体词频(出现10000次以上)是:
数据 48998次
要素 48818次
使用 47706次
工具 28835次
如果 25669次
创建 25529次
属性 24679次
地理 24554次
单击 24165次
ArcGIS 23419次
图层 23060次
数据库 22460次
可以 22016次
输入 20546次
进行 17893次
主题 16601次
栅格 16161次
一个 15798次
显示 15614次
输出 15291次
选择 15149次
指定 15107次
文件 15049次
设置 14433次
参数 14121次
arcpy 14106次
用于 13542次
地图 13055次
添加 12829次
通过 12484次
逻辑 12434次
空间 12358次
位置 11863次
示意图 11847次
需要 11678次
Esri 11395次
包含 11307次
类型 11196次
版本 11115次
定位 10900次
所有 10800次
编辑 10448次
10.8 10325次
All 10271次
然后 10256次
1995 10240次
2019 10225次
Copyright 10220次
rights 10219次
reserved 10217次
时间 10117次

流程是先把chm解编译成htm,再用beautifulsoup读取,用jieba分词。

import os
import requests
from bs4 import BeautifulSoup
import jieba
from collections import Counter


path ='E:\\jby'
def get_filelist(dir):
    Filelist = []
    for home, dirs, files in os.walk(path):
        for filename in files:
            if(filename[-3:]=="htm"):
                Filelist.append(os.path.join(home, filename))
    return Filelist
if __name__ =="__main__":
    text=""
    count=0
    Filelist = get_filelist(dir)
    print(len(Filelist))
    for file in  Filelist :
        File=open(file,'r')
        soup=BeautifulSoup(open(file),features='html.parser')
        text=text+soup.text
        if(count%100==0):
            print(count)
        count=count+1
    print("总文本长度"+str(len(text)))
    seg_list = jieba.cut(txt)
    c = Counter()
    for x in seg_list:
        if len(x)>1 and x != '\r\n':
            c[x] += 1
    print('常用词频度统计结果')
    for (k,v) in c.most_common(100):
        print('%s%s  %d' % ('  '*(5-len(k)), k,  v))
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: ArcGIS 10.8投影文件位置可能会根据不同的系统和用户设置而有所不同。一般而言,在安装ArcGIS 10.8时,该软件会提供一些默认的投影文件,这些文件一般存储在以下路径中: C:\Program Files\ArcGIS\Desktop10.8\Coordinate Systems\ 在这个路径下,用户可以找到各种经典的地理坐标系和投影坐标系。同时,这个路径下也会包含一些特殊的投影文件,比如来自不同国家和机构的投影文件。用户可以根据需要选择特定的投影文件,以支持自己的地图制图和分析要求。 除了默认的投影文件,用户也可以从网络上下载其他的投影文件,或者手动制作自己的投影文件。这些投影文件可以存储在任何位置,但是在使用的时候,需要将这些文件添加到ArcGIS的投影库中。用户可以通过在ArcCatalog的“坐标系统”节点下右键选择“添加/移除文件夹”,来添加新的投影文件夹。 需要注意的是,投影文件是ArcGIS进行地图制图和分析的基础,因此用户应该选择合适的投影文件来支持自己的工作。如果选择不当,可能会导致地图失真、分析错误等问题。因此,在使用投影文件时,用户需要仔细研究和了解各个投影坐标系的特点。 ### 回答2: ArcGIS 10.8是一款机载GIS软件,它提供了很多便利的功能。在使用ArcGIS 10.8进行地理信息处理时,投影文件是一个非常重要的概念,它主要用于确定地图数据的坐标系统和投影方式,能够确保数据在地图上的正确显示。 ArcGIS 10.8的投影文件通常位于ArcGIS安装目录下的“Coordinate Systems”文件夹中。具体位置为“C:\Program Files\ArcGIS\Desktop10.x\Coordinate Systems”。这个文件夹包含了许多不同投影文件,每个文件都有一个唯一的文件名和文件扩展名,例如“WGS 1984 UTM Zone 18N.prj”。 投影文件本质上是一个文本文件,它包含了定义地图数据坐标系统和投影方式的信息。如果用户想要修改投影文件,可以使用文本编辑器打开该文件,然后按照需要修改其中的内容。 为了使用投影文件,在ArcGIS 10.8中,用户可以添加坐标系。这可以通过使用工具栏上的“添加数据”按钮来实现。选择需要使用的数据文件后,转到属性对话框中的“坐标系统”选项卡,在这里用户可以选择特定的投影文件,或者创建一个自定义的投影文件。 总之,ArcGIS 10.8的投影文件位置是在“Coordinate Systems”文件夹中,用户可以通过该文件夹中的投影文件来定义地图数据的坐标系统和投影方式。当然,如果用户需要更改投影文件,只需要打开它并按照需要进行修改即可。 ### 回答3: ArcGIS 10.8投影文件所在位置是在“C:\Program Files (x86)\ArcGIS\Desktop10.8\Coordinate Systems\Projected Coordinate Systems”文件夹下。 在该文件夹下包含了众多的投影文件,并按照国家,地区,以及针对不同使用场景分类。用户可以通过文件夹内的目录结构查找到所需的投影文件。 对于不在文件夹中的投影文件,可以通过在 ArcGIS Desktop 中的“工具”菜单根据需求手动添加。 在使用 ArcGIS 进行数据处理和分析时,保证数据投影一致性对于结果的准确性至关重要。因此,了解并正确使用投影文件是使用 ArcGIS 中的一个重要步骤。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值