【学习笔记】HTML字符实体|语言代码、JS正则表达式参考手册

12 篇文章 0 订阅
10 篇文章 0 订阅

HTML字符实体

  • 字符实体(character entities)
    1、在 HTML 中,某些字符是预留的;
    2、在 HTML 中不能使用小于号 < 和大于号 > ,这是因为浏览器会误认为它们是标签;
    3、如果希望正确地显示预留字符,我们必须在 HTML 源代码中使用字符实体。

  • 不间断空格(non-breaking space)
    1、HTML 中的常用字符实体是不间断空格 &nbsp;
    2、浏览器会截短 HTML 页面中的连续空格,总是只显示一个,如需在页面中增加空格的数量,您需要使用 &nbsp; 字符实体。

HTML ISO-8859-1 参考手册

HTML 4.01 支持 ISO 8859-1 (Latin-1) 字符集,这些符号中的大多数都可以在不进行实体引用的情况下使用,但是实体名称或实体编号为那些不容易通过键盘键入的符号提供了表达的方法:

实体名称对大小写敏感

显示描述实体名称实体编号
"quotation mark(双引号)&quot;&#34;
&ampersand(与)&amp;&#38;
'apostrophe(撇号)&apos;&#39;
<less-than(小于)&lt;&#60;
>greater-than(大于)&gt;&#62;
 non-breaking space(空格)&nbsp;&#160;
¡inverted exclamation mark(倒置感叹号)&iexcl;&#161;
¢cent(美分)&cent;&#162;
£pound(英镑)&pound;&#163;
¤currency(货币)&curren;&#164;
¥yen(日元)/yuan(人民币)&yen;&#165;
¦broken vertical bar(间断的竖杠)&brvbar;&#166;
§section(分节符)&sect;&#167;
¨diaeresis(分音符号)&uml;&#168;
©copyright(版权所有)&copy;&#169;
ªfeminine ordinal indicator(阴性序数记号)&ordf;&#170;
«left angle quotation mark(左双角引号)&laquo;&#171;
¬not sign(否定)&not;&#172;
­soft hyphen(软连字符)&shy;&#173;
®registered trademark(注册商标)&reg;&#174;
¯macron(长音符号)&macr;&#175;
°degree(度)&deg;&#176;
±plus-or-minus(正负号)&plusmn;&#177;
²superscript 2(上标2)&sup2;&#178;
³superscript 3(上标3)&sup3;&#179;
´acute accent(尖音符号)&acute;&#180;
µmicro(微米)&micro;&#181;
paragraph(分段符号)&para;&#182;
·middle dot(中间点)&middot;&#183;
¸cedilla(变音符号)&cedil;&#184;
¹superscript 1(上标1)&sup1;&#185;
ºmasculine ordinal indicator(阳性序数记号)&ordm;&#186;
»right angle quotation mark (右双角引号)&raquo;&#187;
¼fraction 1/4(四分之一)&frac14;&#188;
½fraction 1/2(二分之一)&frac12;&#189;
¾fraction 3/4(四分之三)&frac34;&#190;
¿inverted question mark(倒置问号)&iquest;&#191;
Àcapital A, grave accent&Agrave;&#192;
Ácapital A, acute accent&Aacute;&#193;
Âcapital A, circumflex accent&Acirc;&#194;
Ãcapital A, tilde&Atilde;&#195;
Äcapital A, umlaut mark&Auml;&#196;
Åcapital A, ring&Aring;&#197;
Æcapital AE&AElig;&#198;
Çcapital C, cedilla&Ccedil;&#199;
Ècapital E, grave accent&Egrave;&#200;
Écapital E, acute accent&Eacute;&#201;
Êcapital E, circumflex accent&Ecirc;&#202;
Ëcapital E, umlaut mark&Euml;&#203;
Ìcapital I, grave accent&Igrave;&#204;
Ícapital I, acute accent&Iacute;&#205;
Îcapital I, circumflex accent&Icirc;&#206;
Ïcapital I, umlaut mark&Iuml;&#207;
Ðcapital ETH, Icelandic&ETH;&#208;
Ñcapital N, tilde&Ntilde;&#209;
Òcapital O, grave accent&Ograve;&#210;
Ócapital O, acute accent&Oacute;&#211;
Ôcapital O, circumflex accent&Ocirc;&#212;
Õcapital O, tilde&Otilde;&#213;
Öcapital O, umlaut mark&Ouml;&#214;
×multiplication(乘号)&times;&#215;
Øcapital O, slash&Oslash;&#216;
Ùcapital U, grave accent&Ugrave;&#217;
Úcapital U, acute accent&Uacute;&#218;
Ûcapital U, circumflex accent&Ucirc;&#219;
Ücapital U, umlaut mark&Uuml;&#220;
Ýcapital Y, acute accent&Yacute;&#221;
Þcapital THORN, Icelandic&THORN;&#222;
ßsmall sharp s, German&szlig;&#223;
àsmall a, grave accent&agrave;&#224;
ásmall a, acute accent&aacute;&#225;
âsmall a, circumflex accent&acirc;&#226;
ãsmall a, tilde&atilde;&#227;
äsmall a, umlaut mark&auml;&#228;
åsmall a, ring&aring;&#229;
æsmall ae&aelig;&#230;
çsmall c, cedilla&ccedil;&#231;
èsmall e, grave accent&egrave;&#232;
ésmall e, acute accent&eacute;&#233;
êsmall e, circumflex accent&ecirc;&#234;
ësmall e, umlaut mark&euml;&#235;
ìsmall i, grave accent&igrave;&#236;
ísmall i, acute accent&iacute;&#237;
îsmall i, circumflex accent&icirc;&#238;
ïsmall i, umlaut mark&iuml;&#239;
ðsmall eth, Icelandic&eth;&#240;
ñsmall n, tilde&ntilde;&#241;
òsmall o, grave accent&ograve;&#242;
ósmall o, acute accent&oacute;&#243;
ôsmall o, circumflex accent&ocirc;&#244;
õsmall o, tilde&otilde;&#245;
ösmall o, umlaut mark&ouml;&#246;
÷division(除号)&divide;&#247;
øsmall o, slash&oslash;&#248;
ùsmall u, grave accent&ugrave;&#249;
úsmall u, acute accent&uacute;&#250;
ûsmall u, circumflex accent&ucirc;&#251;
üsmall u, umlaut mark&uuml;&#252;
ýsmall y, acute accent&yacute;&#253;
þsmall thorn, Icelandic&thorn;&#254;
ÿsmall y, umlaut mark&yuml;&#255;
euro(欧元)&euro;&#8364;
trademark(商标)&trade;&#8482;

HTML语言代码

  • ISO 语言代码
    1、HTML 的 lang 属性可用于网页或部分网页的语言,这对搜索引擎和浏览器是有帮助的;
    2、根据 W3C 推荐标准,需要通过 html 标签中的 lang 属性对每张页面中的主要语言进行声明:
<!-- HTML 中 -->
<html lang="en">
    ……
</html>

<!-- XHTML 中 -->
<html xmlns="http://www.w3.org/1999/xhtml" lang="en" xml:lang="en">
    ……
</html>

ISO 639-1 语言代码

ISO 639-1 为各种语言定义了缩略词,可以在 HTML 和 XHTML 中的 lang 和 xml:lang 属性中使用它们:

语言ISO 代码
Abkhazianab
Afaraa
Afrikaansaf
Albaniansq
Amharicam
Arabicar
Aragonesean
Armenianhy
Assameseas
Aymaraay
Azerbaijaniaz
Bashkirba
Basqueeu
Bengali (Bangla)bn
Bhutanidz
Biharibh
Bislamabi
Bretonbr
Bulgarianbg
Burmesemy
Byelorussian (Belarusian)be
Cambodiankm
Catalanca
Cherokee 
Chewa 
Chinese (简体)zh
Chinese (繁体)zh
Corsicanco
Croatianhr
Czechcs
Danishda
Divehi 
Dutchnl
Edo 
Englishen
Esperantoeo
Estonianet
Faeroesefo
Farsifa
Fijifj
Finnishfi
Flemish 
Frenchfr
Frisianfy
Fulfulde 
Galiciangl
Gaelic (Scottish)gd
Gaelic (Manx)gv
Georgianka
Germande
Greekel
Greenlandickl
Guaranign
Gujaratigu
Haitian Creoleht
Hausaha
Hawaiian 
Hebrewhe, iw
Hindihi
Hungarianhu
Ibibio 
Icelandicis
Idoio
Igbo 
Indonesianid, in
Interlinguaia
Interlingueie
Inuktitutiu
Inupiakik
Irishga
Italianit
Japaneseja
Javanesejv
Kannadakn
Kanuri 
Kashmiriks
Kazakhkk
Kinyarwanda (Ruanda)rw
Kirghizky
Kirundi (Rundi)rn
Konkani 
Koreanko
Kurdishku
Laothianlo
Latinla
Latvian (Lettish)lv
Limburgish ( Limburger)li
Lingalaln
Lithuanianlt
Macedonianmk
Malagasymg
Malayms
Malayalamml
  
Maltesemt
Maorimi
Marathimr
Moldavianmo
Mongolianmn
Nauruna
Nepaline
Norwegianno
Occitanoc
Oriyaor
Oromo (Afaan Oromo)om
Papiamentu 
Pashto (Pushto)ps
Polishpl
Portuguesept
Punjabipa
Quechuaqu
Rhaeto-Romancerm
Romanianro
Russianru
Sami (Lappish) 
Samoansm
Sangrosg
Sanskritsa
Serbiansr
Serbo-Croatiansh
Sesothost
Setswanatn
Shonasn
Sichuan Yiii
Sindhisd
Sinhalesesi
Siswatiss
Slovaksk
Sloveniansl
Somaliso
Spanishes
Sundanesesu
Swahili (Kiswahili)sw
Swedishsv
Syriac 
Tagalogtl
Tajiktg
Tamazight 
Tamilta
Tatartt
Telugute
Thaith
Tibetanbo
Tigrinyati
Tongato
Tsongats
Turkishtr
Turkmentk
Twitw
Uighurug
Ukrainianuk
Urduur
Uzbekuz
Venda 
Vietnamesevi
Volapükvo
Wallonwa
Welshcy
Wolofwo
Xhosaxh
Yi 
Yiddishyi, ji
Yorubayo
Zuluzu

JS正则表达式

1、语法

/RegularExpression/modifier    // modifier:修饰符(可选)

2、模式

• 普通字符:包括所有大写和小写字母、所有数字、所有标点符号和一些其他符号
/\N/    // \N 对前面至少 N 个的匹配结果再引用一次

/\NNN/    // \NNN 匹配为八进制转义值的3个数字 NNN

/\cX/    // \cX 匹配由X指明的控制字符(X的值必须为 A-Z 或 a-z 之一)

/\d/    // \d 匹配一个数字

/\D/    // \D 匹配一个非数字字符

/\f/    // \f 匹配一个换页符

/\n/    // \n 匹配一个换行符

/\r/    // \r 匹配一个回车符

/\s/    // \s 匹配任何空白字符(空格、制表符、换页符等)

/\S/    // \S 匹配任何非空白字符

/\t/    // \t 匹配一个制表符

/\v/    // \v 匹配一个垂直制表符

/\w/    // \w 匹配字母、数字、下划线

/\W/    // \W 匹配非字母、非数字、非下划线

/\xNN/    // \xNN 匹配为十六进制转义值的2个数字 NN

/\uNNNN/    // \uNNNN 匹配以十六进制数 NNNN 规定的 Unicode 字符
• 特殊字符:一些有特殊含义的字符,需使用\转义来匹配特殊字符本身
/\x/    // \ 将特殊字符标记为原义字符/向后引用/八进制转义符

/./    // . 匹配除换行符之外的任何单字符

/x|y/    // (|) 匹配 x 或 y 

/[xyz]/    // [] 匹配方括号内的任意字符

/[^xyz]/    // [^] 匹配不在方括号内的任意字符

/[x-y]/    // [-] 匹配指定范围内的任意单个字符

/[^x-y]/    // [^-] 匹配指定范围外的任意单个字符

/(pattern)/    // () 标记一个子表达式的开始和结束位置

/(?:pattern)/    // (?:) 非获取匹配,匹配但不获取结果
• 限定符:指定正则表达式的一个给定组件必须要出现多少次才能满足匹配
/pattern?/    // ? 包含0个/1个指定项(限定符后跟?将匹配限定范围内最少个)

/pattern+/    // + 包含1个/多个指定项

/pattern*/    // * 包含0个/1个/多个指定项

/pattern{N}/    // {N} 包含 N 个指定项

/pattern{N,}/    // {N,} 包含连续至少 M 个指定项

/pattern{M,N}/    // {M,N} 包含连续至少 M 个、至多 N 个指定项
• 定位符:将正则表达式固定到行首或行尾
/\b/    // \b 匹配单词边界(空格前后)

/\B/    // \B 匹配非单词边界

/^pattern/    // ^ 以指定项为行首

/pattern$/    // $ 以指定项为行尾

/(?=pattern)/    // (?=) 非获取匹配,从任何匹配指定项的字符串开始处查找

/(?!pattern)/    // (?!) 非获取匹配,从任何不匹配指定项的字符串开始处查找

/(?<=pattern)/    // (?!) 非获取匹配,从任何匹配指定项的字符串结尾处查找

/(?<!pattern)/    // (?!) 非获取匹配,从任何不匹配指定项的字符串结尾处查找
• 运算符优先级:相同优先级的从左到右进行运算,不同优先级的运算先高后低
运算符优先级
\1
() (?:) (?=) []2
* + ? {N} {N,} {M,N}3
^ $ \……4
|5
• 字符簇:一个表示所有匹配字符的范围的组合
[a-z]    // 匹配所有的小写字母中的单个字符

[A-Z]    // 匹配所有的大写字母中的单个字符

[a-zA-Z]    // 匹配所有的字母中的单个字符

[0-9]    // 匹配所有的数字中的单个字符

[ \f\r\t\n]    // 匹配所有的白字符中的单个字符

^[1-9][0-9]*$    // 匹配所有的正整数 

^\-?[0-9]+$    // 匹配所有的整数 

^[-]?[0-9]+(\.[0-9]+)?$    // 匹配所有的浮点数

3、修饰符

/RegExp/i    // i:执行对大小写不敏感的匹配

/RegExp/g    // g:执行全局匹配

/RegExp/m    // m:执行多行匹配

4、相关方法

exec():检索字符串中的正则表达式的匹配(返回匹配值/null)
RegExpObject.exec(string)

// *string:要检测的字符串
test():检测一个字符串是否匹配某个模式(返回true/false)
RegExpObject.test(string)

// *string:要检测的字符串
toString():返回正则表达式的字符串值
RegExpObject.toString()
match():在字符串内检索指定的值,或找到一个或多个正则表达式的匹配
stringObject.match(regexp)

// *regexp:规定要匹配的模式的 RegExp 对象
replace():在字符串中用一些字符替换另一些字符,或替换一个与正则表达式匹配的子串
stringObject.replace(searchvalue,newvalue)

// *searchvalue:规定子字符串或要替换的模式的 RegExp 对象
// *newvalue:一个字符串值,规定了替换文本或生成替换文本的函数
search():检索字符串中指定的子字符串,或检索与正则表达式相匹配的子字符串
stringObject.search(searchvalue)

// *searchvalue:查找的字符串或者正则表达式
split():把一个字符串分割成字符串数组
stringObject.split(separator,limit)
*separator  字符串或正则表达式,从该参数指定的地方分割 string Object
*limit  该参数可指定返回的数组的最大长度。如果设置了该参数,返回的子串不会多于这个参数指定的数组。如果没有设置该参数,整个字符串都会被分割,不考虑它的长度

5、相关属性

constructor:返回对象的构造函数
RegExpObject.constructor
global:判断正则表达式是否有修饰符 g
RegExpObject.global
ignoreCase:判断正则表达式是否有修饰符 i
RegExpObject.ignoreCase
lastIndex:规定下次匹配的起始位置(g环境下)
RegExpObject.lastIndex
multiline:判断正则表达式是否有修饰符 m
RegExpObject.multiline
source:返回模式匹配所用的文本
RegExpObject.source
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值