操作系统软定制
文章平均质量分 81
。
九阈
进厂了
展开
-
搜索引擎技术
搜索引擎的基础知识概况从系统的角度看搜索引擎。需要哪些东西?●硬件●软件●数据从科学的角度看搜索引擎。怎样才能做到?●数据结构- – -倒排索引●核心算法- – 相关度●必备工具一一 文本处理研究搜索引擎的科学一信息检索(1)例子从全部网页中,根据用户输入的词或语句,找出对应的网页(2)具体从大规模非结构化文档集合中,找出用户需要的文档资料(3)抽象从一个信息集合中,找出满足用户信息需求的信息内容信息检索的地基硬件基础:计算机系统架构和网络软件基础:系统软件和工具软原创 2022-04-18 16:09:24 · 1664 阅读 · 0 评论 -
ME(最大熵模型)和HMM (隐马尔可夫模型)
什么是熵(Entropy)简单来说,熵是表示物质系统状态的一种度量,用它老表征系统的无序程度。熵越大,系统越无序,意味着系统结构和运动的不确定和无规则;反之,,熵越小,系统越有序,意味着具有确定和有规则的运动状态。熵的中文意思是热量被温度除的商。负熵是物质系统有序化,组织化,复杂化状态的一种度量。熵最早来原于物理学. 德国物理学家鲁道夫·克劳修斯首次提出熵的概念,用来表示任何一种能量在空间中分布的均匀程度,能量分布得越均匀,熵就越大。一滴墨水滴在清水中,部成了一杯淡蓝色溶液热水晾在空气中,热量会传转载 2022-04-07 19:33:11 · 917 阅读 · 0 评论 -
2.2中文分词和新词识别
为什么需要中文分词?●与英文为代表的拉丁语系语言相比,英文以空格作为天然的分隔符,而中文由于继承自古代汉语的传统,词语之间没有分隔。●古代汉语中除了连绵词和人名地名等,词通常就是单个汉字,所以当时没有分词书写的必要。而现代汉语中双字或多字词居多,一个字不再等同于一个词。分词作用互联网绝大多数应用都需要分词,典型应用实例➢汉字处理:拼音输入法、手写识别、简繁转换➢信息检索: Google、 Baidu➢内容分析:机器翻译、广告推荐、内容监控➢语音处理:语音识别、语音合成举例中文的语义.原创 2022-04-06 09:50:51 · 1523 阅读 · 0 评论 -
2.1计算机输入法
输入方式(1)键盘输入熟悉键盘布局(2)非键盘输入(自动输入)手写输入通过笔尖或指尖实时识别扫描输入基于图像像素●语音输入怎样在计算机中输入中文?(1)用键盘输入中文需要熟悉键盘布局掌握一定的输入方法:拼音,五笔等(2)手写输入中文需要不大常用的输入设备:手写板或者支持手写输入的笔等:正确书写中文;(3)语音输入(4)扫描输入等用户输入过程统共分几步?应用程序(记事本,浏览…能接收输入信息(键盘,语音… ;将接收的信息通知给输入法进行分析处理:输入法能原创 2022-04-05 22:21:39 · 2946 阅读 · 0 评论 -
ubuntu下安装Python
ubuntu14.10系统下默认安装了python2.7.8和python3.4.2, 她们在/usr/bin/下可以找到, 默认用python2.7.8xx@ada:~$ python --versionPython 2.7.8xx@ada:~$ python3.4 --versionPython 3.4.2xx@ada:~$ python2.7 --versionPython 2.7.8xx@ada:~$ which python/usr/bin/pythonxx@ada:~$ whi转载 2022-03-29 20:46:34 · 43975 阅读 · 0 评论 -
第一章:编程语言文字处理相关功能调研
C语言C语言标准C语言一 字符表示C语言一文件读写C语言一 编码字符集检测原创 2022-03-27 21:25:36 · 882 阅读 · 0 评论 -
第一章中文信息处理概述
1、为什么学习中文信息处理(1)汉语成为一种新的强势语言而被世人瞩目,汉语里解所涉及的科学问题让国际计算语言学界无法回避。(2)汉语使用者拥有的巨大市场令国际企业界不敢轻视。(3)中文信息处理所面临的困难时其他任何--种自然语言处理都会遇到的共性问题,但也有其个性问题,因此中文信息处理更具挑战性。2、什么是“中文信息处理中文信息处理是用计算机对汉语的音、形、义等语言文字信息进行的加工和操作,包括对字、词、短语、句、篇章的输入、输出、识别、转换、压缩、存储、检索、分析、理解和生成等各方面的处理技术原创 2022-03-21 20:06:31 · 5502 阅读 · 1 评论