LaTeX刘海洋学习20240725

1.LaTeX起步

1.1文档的开始与中文

 test.tex 为例

\documentclass{article}

\begin{document}

This is my first document

Happy \TeX ing!

\end{document}

以上是一个英文文档的开始方式,但是在中文字符的加入过程,有着明显的缺陷

这时就要引入编码,这里用的是UTF-8下一节将简单的分析几种编码

在撰写中文论文,文档时,引用如下格式,以 chinese test.tex为例

\documentclass[UTF8]{ctexart}
\begin{document}
\section{文字}
特可爱排版
\section{数学}
\[
    a^2+b^2=c^2
\]
\end{document}

\documentclass[UTF8]{ctexart}是固有的决定文档性质的模版

\section 作为章节进行分区

\[

\]大概是将中间行的内容在下一行单独呈现,与后面的列表公式有区别

1.2编码简单学习与整理

ASCII码

ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是一种常见的字符编码系统,定义了128个数字编码,包括字母、数字、标点符号和控制字符等。每个字符用一个7位的二进制数表示。
ASCII码表中的字符从0到127,其中0到31为控制字符(如回车、换行等),32到127为可显示字符(如大写字母、小写字母、数字和标点符号)。

Unicode

Unicode(统一码、万国码)是一种字符编码标准,它的目标是为世界上所有的字符提供唯一的标识和编码。Unicode定义了一个庞大的字符集,包括了绝大部分的语言中所使用的字符、符号、标点以及各种专用符号。

Unicode的编码范围非常广泛,目前已经定义了超过1.1万个平面(Plane),其中第0平面(Basic Multilingual Plane,BMP)是最常用的,包含了大部分常用字符。除了BMP之外,还有一些辅助平面(Supplementary Planes)用于存储较不常用的字符。

Unicode采用了一种独立于平台和语言的编码方案,每个字符都分配了一个唯一的编号,称为码点(Code Point)。Unicode的码点表示为十六进制形式,通常前面加上"U+"前缀,例如U+0041表示拉丁字母"A"的码点。

由于Unicode字符集非常庞大,不能直接用一个字节来表示所有的字符,因此引入了不同的编码方案来实现Unicode字符的存储和传输。常用的编码方案包括UTF-8、UTF-16和UTF-32。

  • UTF-8(Unicode Transformation Format-8)是一种变长编码方式,可用1至4个字节来表示一个Unicode字符。对于ASCII字符,UTF-8使用1个字节表示,与ASCII编码兼容,这样就保证了向后兼容性。
  • UTF-16(Unicode Transformation Format-16)是一种定长或变长的编码方式,最常见的是使用2个字节表示一个Unicode字符。对于BMP中的字符,UTF-16使用2个字节表示,而辅助平面中的字符则需要4个字节来表示。
  • UTF-32(Unicode Transformation Format-32)是一种定长编码方式,每个Unicode字符使用4个字节来表示,无论字符是否在BMP中。

Unicode(统一码、万国码)是当前最广泛使用的字符编码标准,它为世界上各种语言中的每个字符都分配了一个唯一的数字编号,包括字母、数字、符号、标点以及各种语言中的汉字、阿拉伯字母等。

UTF-8

UTF-8(Unicode Transformation Format-8)是一种Unicode字符编码方案,它是目前最常用的字符编码方式之一。UTF-8使用可变长度的字节序列来表示Unicode字符,能够覆盖Unicode字符集的所有字符。

UTF-8的设计基于以下几个原则:

  1. 向后兼容:UTF-8能够完美兼容ASCII字符集,即保证ASCII字符与传统的ASCII编码一致,使用一个字节表示,这使得已有的ASCII文本无需转换即可直接作为UTF-8文本使用。
  2. 可变长度编码:UTF-8使用1至4个字节来表示不同范围的字符,根据Unicode字符的码点范围决定所需的字节数量。较常用的字符使用较少的字节,而较少使用的字符使用较多的字节表示,这样可以节省存储空间和传输带宽。
  3. 易于处理:UTF-8编码中,每个字节的高位会指示该字节是否为一个字符的起始字节,因此对UTF-8编码进行解码时,很容易找到每个字符的边界位置。 

GB2312

GB2312编码是中国国家标准简体中文字符集的一种字符编码方案。它是在1980年代初制定的,主要用于表示汉字字符。

GB2312编码采用双字节编码方案,每个字节由高位和低位组成,,包括6,763个简体汉字和682个其它字符。它使用两个字节表示一个汉字,每个字节最高位都为0。每位都占用8个比特。这样,GB2312共定义了7489个常用简体中文汉字和拉丁字母、数字、标点等其他字符

GB2312编码的优势在于提供了针对简体中文的统一编码方案,使得不同计算机系统和软件能够正确识别和显示简体中文字符。在GB2312之前,中国国内存在多种不兼容的字符编码方案,给信息交流和文字处理带来了很大困扰。

然而,GB2312编码的缺点在于它只包含有限数量的字符,无法表示繁体中文、其他语言字符以及一些特殊符号。为了解决这个问题,后来又出现了GBK和GB18030等更为完善的字符编码方案,它们能够支持更多的字符和字符集。

需要注意的是,这里的编码值是十六进制表示的。在实际应用中,计算机会使用对应的比特位来表示这些编码值,并根据编码表进行解释和显示,以正确呈现相应的汉字。

Base64编码

Base64是一种将二进制数据编码为可打印字符的编码方案。它常用于在网络传输中传递二进制数据或存储二进制数据到文本文件中,因为文本文件只接受可打印字符。

Base64编码使用64个可打印字符来表示二进制数据,包括大写字母 A-Z、小写字母 a-z、数字 0-9,以及两个特殊字符 “+” 和 “/”。根据需要,可能还会添加一个填充字符 “=”。

经过Base64编码后,原始字符串被转换为了一串可打印字符。解码时,只需对这些Base64字符进行逆操作,即可还原原始的二进制数据。

1.3基本思路

一.确定目标

以科普短文为例,大致分为几点流程

  1. 标题
  2. 摘要
  3. 目录
  4. 正文
  5. 参考文献

二.提纲

在文章开始前,用%列出提纲提醒自己,称之为注释这部分不参与最后的编译

这里提供一个提纲的思路:

  • %-coding:UTF-8
  • %名称.tex
  • %主题

……

三.具体部分的部分代码介绍

在\begin之前,有一部分对于整个文档的情况的说明,成为导言区

\title{题目名}
\author{作者名}
\date{\today}

\bibliographystyle{plain}

其中\biliographystyle与参考文献有关

在正文中也有相应的指令落实上面的前景

\maketitle 
\tableofcontents

\bibliography{数据库名}

\tableofcontents即table of content,用于生成目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值