用PCA算法分析十二个“一”

用PCA算法分析十二个“一”

Part One背景:

上学期,我们对十二个“一”进行了大量实验,还进行多种形式的拓展创作。有鉴于此,本主题将从多学科交叉方式去探讨十二个”一“的实验,探讨以艺工交叉的思维去认识艺术。

Part Two 理论知识:

什么是书法:
书法,是中国及深受中国文化影响过的周边国家和地区特有的一种文字美的艺术表现形式。包括汉字书法、蒙古文书法、阿拉伯书法和英文书法等。其“中国书法”,是中国汉字特有的一种传统艺术。
从广义讲,书法是指文字符号的书写法则。换言之,书法是指按照文字特点及其含义,以其书体笔法、结构和章法书写,使之成为富有美感的艺术作品。汉字书法为汉族独创的表现艺术,被誉为:无言的诗,无行的舞;无图的画,无声的乐等。 ——百度百科
汉字是书法的载体,书法是借助于汉字的书写形式,以表达作者精神美的艺术。
汉字起源于新石器时代,距今约6千余年历史。从仰韶文化、大汶口文化陶器上的符号到殷代的甲骨卜辞、西周铜器铭文、秦代小篆,是汉字发展而渐趋完美的过程。兹后随着时代的需要,文字的形制也由篆而隶、而草、楷、行书,递相演进。
书法原指作字记事之技艺,随着书体的增多技法日精,文字的书写点画篇章之间,气韵蕴藉,风神荟萃,足以表达出作者的性格、感情、趣味、素养、气质等精神因素。至此,书写不仅是为了记录语言,而且是为了抒发感情,表现作者的精神美,遂与汉字的实用性分道扬镳,形成一门独立艺术。
人们有意识地追求书法艺术始于春秋战国,此后,名家辈出,秦代李斯的篆书已达登峰造极的境界;两汉为隶书的黄金时代,书法风格也呈多样化;魏晋南北朝真、草、隶、篆、行五大书体基本形成,各有名家;唐代书学鼎盛,五种书体竞相媲美;宋元时代书法继承晋唐,崇尚意趣,行、草成就最高;明清至近代,书学承前启后,日趋昌盛,从而形成了我国辉煌灿烂的书法艺术史。
在书法艺术的长河中,圣贤迭起,灿若繁星,出现了无计其数的书法家。他们为书法艺术的繁荣发展作出了巨大贡献,他们所遗留下来的书法艺术作品是人类文化艺术的瑰宝,无论是碑刻墓志,书札简牍,还是遗书遗文、条幅卷册,或墨迹、或刻本、或单帖、或丛帖,均是中华艺术宝库的重要组成部分。这些书法作品风格各异、流派纷呈,浩如烟海。通过这些书法作品,我们可以窥见中国书法艺术的发展情况,并可从中得到学习和借鉴的楷模。
从书法形成之日起,人们即对其成长予以关注,为之谱、为之序,进行介绍、评论、研究,一些书法家也通过实践活动,总结经验,提出立论,从而形成了专门的书学理论,产生了大量书学理论著作。这些都是我们研究书法艺术、考证书法发展的重要资料。 ——中华国粹大辞典
中国书法分为两个层次: 实用的书法与艺术的书法。实用的书法指运用纸墨笔砚这些工具材料书写汉字的技巧和法则。包括执笔、用笔、点画、结构、分布等方法,
执笔要指实掌虚, 五指齐力; 用笔要中锋铺毫; 点画要圆满周到; 结构要横直相安,意思呼应;分布要错综变化,疏密得宜,全章贯气。艺术的书法是中国特有的造型艺术之一,
是书法家以艺术的手法借助汉字形体来表达情感志趣的艺术。书法按字体的不同有行书、草书、隶书、篆书之分。中国书法历史悠久、源远流长,有3000多年的历史。商朝的甲骨文标志着汉字书法的最初阶段,此后经过金文(大篆)、小篆、隶书等3个阶段, 便形成了今天通用的楷书。中国历史上历代都留下了珍贵的书法作品,
如秦篆、汉隶、魏碑、唐楷、宋行、明人小楷等。中国书法历代名家辈出, 东晋王羲之父子是中国古代最伟大的书法家,唐代的欧(阳询)、褚(遂良)、颜(真卿)、柳(公权) 四大家及怀素、张旭, 宋代的苏 (轼)、黄 (庭坚)、米(芾)、蔡 (襄、一说蔡京) 四大家,
清代的郑板桥、现代的于右任、沈尹默等都是杰出的书法家。中国书法对日本、朝鲜等影响极大。中国书法与中国画同源异流, 用笔有相通之处。
——中国成人教育百科全书·文学·艺术
原指汉字的书写法则,是中国传统的、独特艺术形式。泛指运用毛笔 书写汉字的方法或作品,有时是讲技法上的执笔、用笔、用墨、点画、结
构、分布等。执笔要指实掌虚,五指 齐力; 用笔要中锋铺毫,用力劲遒; 点画要圆满周到,优雅端正; 结构要 横直相安,意思呼应; 分布要疏密得 当。全篇贯气等。有时是指有一定水
平的汉字作品。我国的书法艺术已有 3000多年的历史,具有多采的形体和 丰富的内涵,几乎要达到可畏可奇、 至善至美的境地。
—— 简明中国手工纸(书画纸)及书画常识辞典
什么是笔法:
所谓笔法,写字作画用笔的方法,即中国画特有的用线方法。中国书画主要都以线条表现,所用工具都是尖锋毛笔,要使书画的线条点画富有变化,必先讲究执笔,在运笔时掌握轻重、快慢、偏正、曲直等方法,称为“笔法”。
——百度百科
书写绘画的用笔方法。中国书画以毛笔为主要工具,以线条为主要表现形式,为使书画的点划线条具有抑扬顿挫,圆满攲侧等等变化,必须讲究执笔、运笔方法,称为笔法。——中国古典文艺实用辞典
篆刻印章时篆文的用笔方法。要求丰神流动、庄重典雅的印文,用笔应有轻有重、有屈有伸、有俯有仰、有去有住、有粗有细、有强有弱、有疏有密。
——中国古典文艺实用辞典
写字、作画用笔的方法。中国书画均以毛笔为工具,以线条为主要表现形式。为使书画线条、点画具有抑扬顿挫等变化,在运用笔毫时轻重、徐疾、偏正、曲直等方法谓之“笔法”。
——简明美术词典
中国书法和绘画的用笔方法。如“ 一波三折”、 “逆入平出”、 “中锋”、 “侧锋”等,掌握笔法能使笔划线条圆润厚重,富于变化而具有表现力。
——文艺创作知识辞典
书法美学术语,专指写字时点、划、转折之用笔方法,与史学中用以称谓史笔的术语比如“《春秋》笔法”有别。
笔法是历代书家根据创作实践总结出的执笔、运笔时指、 掌、腕、肘的生理动作和毛笔相配合、相适应的方法。从广义上说,笔法包括执笔中的指法、掌法、腕法;狭义地说,即指用笔时的执、使、转、用,亦即落笔时的轻、重、提、按、转、折等的运笔技法。
历来有关笔法的论述颇多,但所指亦各不同。比如,清冯武《书法正传·纂言上》载有“笔法十门”所述内容为:啮镞、阴阳、君臣、向背、偏枯孤露、五指玲珑、停笔迟涩、通气、顾答。是以论述结构与章法为主,不专论运笔。
唐颜真卿有《述张长史笔法十二意》,包括:平谓横、直谓纵、均谓间、密谓际、锋谓末、力谓骨体、轻谓曲折、决谓牵掣、补谓不足、损谓有余、巧谓布置、称谓大小。以分析笔划与笔意为主,亦非专论笔法者。
较为明确剖析笔法者当以唐初孙过庭《书谱·序》中所云: “执为长短浅深,使为纵横牵掣,转为钩环盘纡,用为点划向背”。即是说“执”指执笔, “使”指运笔,“转”指行笔时的转折呼应,“用”指点划的结构安排。此说为对笔法之专论。 ——文艺美学辞典

笔法是毛笔写字的方法、法则。有一般规律,同时也有难度,也是判断作品是否具备专业性的标志。尝评某人书,谓其“离书法远”,是在说明书写者未经系统训练,笔法不精,甚至不具备笔法意识。
从一般意义上说,有笔才有法。如篆书在便捷的书写中,尤其在出土的春秋战国时期的简犊、帛书、盟书中,笔法得以充分体现。又如,在西汉简犊墨迹中,也可见其中丰富的笔法。我们在取法钟鼎、碑刻书法时,会从同时期的墨迹中去寻找其本来面目,力图使其“文人化”“墨迹化”,尽量将损耗的笔法还原。
每种书体都有其自身的笔法体系,笔法是有规律可循的。当然,寻找这一规律是有难度的,既有难度就要通过练去解决,使其变成自己的笔法语舀,而笔法语舀也是风格的组成部分。
将笔法单列出来探讨,不能忽视与技法、风格等关联性。笔法支撑着风格。我们还要关注每种风格之间的共同性以及构成固化风格之间的差异性。书体有别,则笔法不一。相对来说,篆书用笔是内敛的,是含蓄、凝练的;“二王”笔法是外拓的、潇洒的。当然,内敛和外露两者之间可对比,也可交融。颜鲁公、黄鲁直、张长史笔法中,两者兼而有之,可证得风格与笔法之间的共通性和融通性。
至王羲之书,笔法的丰富性达到了顶峰。“二王”书是笔法的集大成者。后世学王字,也只能取其一二而已。八大、弘一书取笔法而至平和、平淡,甚至笔法皆无。丰富和平淡是风格的两极,两者皆因风格而起,他们都做到了极致,两者都是高级的。换而舀之,将笔法与自身风格做到一致,就是高级的。
因其重要性,历代书论中关十笔势的论述很多。“势”是生命的姿态,体现了力量和运动。笔势是书法的生命,与气势相关。笔法与字法以及字行、间关系相互支撑,是非独立的,是依附十线条的。线条两端的形态和运动的过程,方、圆、尖,藏、露、出锋,中、侧锋及中侧锋两者兼用等,是在书法的势态之中的,也包括在笔法的范畴之中。因此,临习时要关注笔势,它是运动的,是有姿态的。线与线之间也是有关联的,非孤立的。
笔性,即在书写的过程中充分体现用笔的灵性。这种灵性是笔法中特别要关注的,跟书写工具有关。书写工具与笔性、笔法相互依存。用软毫或硬毫,表现十生宣或熟宣,因笔性不同,笔法也会呈现不同的效果。常去巴考前人的笔画为何如此挺拔、干净,如若还原场景,我们是否还能够将其充分表达出来。
决慢、疾涩、提按,锋的调整,都是节奏变化。在“二王”尺犊中可充分体现这一点,“二王”体系下的历代代表书家如孙过庭、颜真卿、苏轼、米带等,笔法的节奏感也是非常强烈的。
总之,关注点要回归“势”,线条的“势”,要形成一种习惯,在创作中变为习惯性的书写。线条在运动中随势而调整。要体会线与线之间是如何关联的,多组线条之间是如何连接的,要做到向古代贤者一般体察人微。线条之间的内在关系是存在的,非断的,眼睛要跟上,笔意也要跟上,倘一断,笔势便不畅,气韵自然不通。如写楷书,笔画间是断的,但势已隐十运动之中。
在运用中,不断找到自己的笔法语舀。自我的笔法语舀是具有排他性的,当然也不可能有那么多的差异性,要辩证地看。惟在共性中存有一点不同,就是可贵的。
凡书家之所以能立足十书法史,必是笔法与人不同。林散之就是将绘画中的笔法语舀运用十书法之中,将隶法人草,便是对书法史中笔法的补充,这一点足以支撑林氏笔法语舀的排他比。再如,历代书家篆法多用圆笔,赵之谦因使方笔书篆旋即脱颖而出。
笔法之变很难。大数据时代有挑战更有机遇,我们要学会综合,若试着从绘画或其他艺术门类中寻找突破口,化为自己的书法用笔语舀,或可成功。
周星莲说过:“书法在用笔,用笔贵用锋。”米带说他人写字只有一笔,我独有八面。王%}f有“八面出锋”之说。他们都在强调用锋、调锋的重要。
用笔不能纯用笔尖,也不能尽用笔根,要用到以有灵性为准,用多,不活;用少,就浪费了。用多少,应适风格而变。如苏轼、米带之书,纯用笔尖是无法做到的,贵在用锋。再如弘一书,虽笔法近无,或者换种思考,他有自己的独特笔法,不管怎么样,他的厚实的线条是非使笔尖而能为的,在十运用笔锋。我们要把毛笔的笔锋发挥到功能最大化。
“结字因时相传,用笔千古不易”,字法结构可随时代、书家而改变,但书写的基本法贝怯口是百古不易的。从这点出发,赵孟倾看中用笔,强调把用笔的规律性继承下去保持不变。
笔法与结构应当是一致的,二者是紧密相联的。至十笔法和结构,南北有认识上的差异,对碑帖有认识上的差异,十取法有认识上的差异,分别适宜十远、近观赏的作品也有不同的表达方式,这些差异是应该被尊重和理解的。当代不同十任何时代,我们应当协调笔法和结构之间的平衡,不能将其任一孤立。线条是结构的组成要素,线条有姿态,或说是有态势形状的,是不同笔锋的表达。简而舀之,线条是笔法的表达,结构是线条的构成,笔法和结构应当是紧密相联的。

书法作用之表情达意:
“夫书肇于自然;自然既立,阴阳生焉;阴阳既生,形势出焉”——蔡邕《九势》蔡邕的九势是古代书论中最早对书法形势美进行研究的著作、它启发我们:书法形式美。美丽除去其造型特点外,打动人心的根本原因在于“肇于自然”的“阴阳”,即相反相成的黑白对比。书法中的阴阳——黑白的相互对立,牵制,衬托,消长等,这一对矛盾的发展变化,构成了书法艺术美的基础。蔡邕的“书肇自然”说,又是从哲学的角度,支出客观自然是书法的本源,同书艺“发于心源”说相对应,至今仍在中国艺术和美术史上闪耀着光彩。“书者,散也。……为书之体,须入其形,若坐若行,若飞若动,若往若来,若卧若起,若愁若喜,若虫食木叶,若利剑长戈,若强弓硬矢,若水火,若云雾,若日月;纵横有可象者,方得谓之书也”——蔡邕《笔论》蔡邕给书法下了个定义——“散”,即“不自检束”。“不自检束”则可进入抒情状态。书法具有抒情的功能,这是书法作为艺术的先决条件之一。同时,由于书法艺术以来自自然形象却又远离了自然形象的字体造型,抽象线条作为艺术材料,所以:“为书之体,须入其形”,每一个字或笔画似乎都成了有生命的个体,“若左若行”、“若愁若喜”,他们被赋予作者的生命和情感。于是,那些“纵横有象”的线条、图案。变作了一种容纳作书者丰富感情并向欣赏者传递某种情感的艺术形式。“往时张旭善草书,不治他技。喜怒窘穷,忧悲、愉佚、怨恨、思慕、酣醉、无聊、不平,有动于心,必于草书焉发之。观于物,见山水崖谷,鸟兽虫鱼,草木之花实,日月列星,风雨水火,雷霆霹雳,歌舞战斗,天地事物之变,可喜可愕,一寓于书。固张旭之书,变动犹鬼神,不可端倪。”
韩愈《送高闲上人序》书法一方面表达的是书写者的“喜怒窘穷,忧悲,愉佚,怨恨,思慕,酣醉,无聊,不平……”,它可以是创作者有意识和无意识的内心秩序的全部展露;另一方面,它又是“观于物,见山水崖谷,鸟兽虫鱼,草木之花实,日月列星,风雨水火,雷霆霹雳,歌舞战斗,天地事物之变,可喜可愕,一寓于书。”它可以是宇宙普遍性形式和规律的感受同构。书法艺术所表现所传达的,正是这种人与自然,情绪与感受,内在心理程序结构与外在宇宙(包括社会)秩序结构直接相碰撞,相斗争,相调节,相协奏的伟大生命之歌。书法艺术是审美领域内人的自然化与自然的人化的直接统一的一种典型代表。

Part Three PCA算法:

一、原理:
PCA算法主要用于降维,就是将样本数据从高维空间投影到低维空间中,并尽可能的在低维空间中表示原始数据。PCA的几何意义可简单解释为:
0维-PCA:将所有样本信息都投影到一个点,因此无法反应样本之间的差异;要想用一个点来尽可能的表示所有样本数据,则这个点必定是样本的均值。
1维-PCA:相当于将所有样本信息向样本均值的直线投影;
2维-PCA:将样本的平面分布看作椭圆形分布,求出椭圆形的长短轴方向,然后将样本信息投影到这两条长短轴方向上,就是二维PCA。(投影方向就是平面上椭圆的长短轴方向);
3维-PCA:样本的平面分布看作椭圆形分布,投影方法分别是椭圆球的赤道半径a和b,以及是极半径c(沿着z轴);
二、算法步骤:
设有m条n维数据。
1)将原始数据按列组成n行m列矩阵X
2)将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值
3)求出协方差矩阵
4)求出协方差矩阵的特征值及对应的特征向量
5)将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P
6)即为降维到k维后的数据
三、运用PCA算法分析十二个“一”的大五人格以及情感
从拟物化感受、大五人格、情感评测、风格评测、活跃度、阳性、性格倾向、选美与社会主义价值观匹配中选出两类进行代码分析,其他过程类似。
(一) 大五人格

简介
近年来,心理学家通过词汇学方法,发现约有五种特质可以涵盖人格描述的所有方面,由此提出了人格的大五模型(OCEAN),俗称人格的海洋。美国知名心理学家Goldberg称之为人格心理学中的一场革命。
开放性(openness):具有想象、审美、情感丰富、求异、创造、智能等特质。
责任心(conscientiousness):显示胜任、公正、条理、尽职、成就、自律、谨慎、克制等特点。
外倾性(extroversion):表现出热情、社交、果断、活跃、冒险、乐观等特质。
宜人性(agreeableness):具有信任、利他、直率、依从、谦虚、移情等特质。
神经质性(neuroticism):难以平衡焦虑、敌对、压抑、自我意识、冲动、脆弱等情绪的特质,即不具有保持情绪稳定的能力。——百度百科
整体人格结构模型的一种。研究证实,有五项人格因 素是最核心、最稳定的人格特质,称为“大五”,即外倾性 (善于言谈、社会交往和自信的程度)、随和性(随和、合作 和可信任的程度)、责任性(对工作的责任感、可靠性、坚持不懈和成就导向)、情绪稳定性(平静、热情和安全的程 度)和开明(好奇的、智慧的、有想象力和创造性的、有艺术细胞的)。责任性被视为预测工作绩效的最重要的人格 特征,其他人格维度与工作绩效的关系受职业特征的 影响。——管理学大辞典
亦称“人格大五理论”。人格结构模型之一。该模型基于词汇学假设和因素分析适用性假设,通过对自然语言的分析,将人格结构分为五个因素,即外向性或热情、随和性、责任感、情绪稳定性和文化或智慧。因素的顺序反映了因素的重要性。这五个因素被称为“大五”,强调每一因素的广泛性。其中前两个因素基本上包含了有关人际方面的特质,因素三主要描述的是工作行为以及对冲动的控制能力,因素四描述安静放松与紧张焦虑的对立,因素五描述个体深层的心理和经验生活的性质及其复杂性。该模型在人格研究和临床中得到相当广泛的使用。——心理学辞典
算法实现(Matlab实现)
实现PCA的方法有三种:
1、 直接调用Matlab工具箱pca( )函数实现
参数说明:
1)COEFF 是主成分分量,即样本协方差矩阵的特征向量;
2)SCORE主成分,是样本X在低维空间的表示形式,即样本X在主成份分量COEFF上的投影 ,若需要降k维,则只需要取前k列主成分分量即可
3)latent:一个包含样本协方差矩阵特征值的向量;
在这里插入图片描述
2、自己实现PCA的过程
PCA的算法过程,用一句话来说,就是“将所有样本X减去样本均值m,再乘以样本的协方差矩阵C的特征向量V,即为PCA主成分分析”,其计算过程如下:
1)将原始数据按行组成m行n列样本矩阵X(每行一个样本,每列为一维特征)
2)求出样本X的协方差矩阵C和样本均值m;(Matlab可使用cov()函数求样本的协方差矩阵C,均值用mean函数)
3)求出协方差矩阵的特征值D及对应的特征向量V;(Matlab可使用eigs()函数求矩阵的特征值D和特征向量V)
4)将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P;(eigs()返回特征值构成的向量本身就是从大到小排序的) [5].Y=(X-m)×P即为降维到k维后的数据;
在这里插入图片描述
3、 使用快速PCA算法的方法。
PCA的计算中最主要的工作量是计算样本协方差矩阵的本征值和本征向量。假设样本矩阵X的大小为n ×d (n个d 维样本特征向量),则样本散布矩阵(协方差矩阵) S 将是一个d×d的方阵,故当维数d较大时计算复杂度会非常高。例如当维数d=10000,S是一个10000 ×10000的矩阵,此时如果采用上面的pca函数计算主成份,Matlab通常会出现内存耗尽的问题, 即使有足够多的内存,要得到S的全部本征值可能也要花费数小时的时间。fastPCA函数用来对样本矩阵A进行快速主成分分析和降维(降至k维),其输出pcaA为维后的k维样本特征向量组成的矩阵,每行一个样本,列数k为降维后的样本特征维数,相当于pca函数中的输出SCORE, 而输出V为主成分分量,相当于pca函数中的输出COEFF。
在这里插入图片描述
实验结果
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
结果分析
在这里插入图片描述
通过上图数据可视化的二维图像可以发现,3号点与12号点的距离最近。

(二) 情感评测

简介
快乐、激活、愤怒、厌恶、恐惧、高兴、悲伤、惊讶
算法实现
同上,只需修改其中的样本矩阵X
实验结果
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
结果分析
在这里插入图片描述
通过上图数据可视化的二维图像可以发现,2号点与11号点最为相近。

参考资料:
源数据样本:https://shimo.im/docs/8vxVD8PwvPQQyxQr/read
中国书论学习笔记(一)
http://www.360doc.com/content/20/0402/20/7948171_903455589.shtml
PCA原理分析和Matlab实现方法(三)
https://blog.csdn.net/guyuealian/article/details/68487833
PCA算法理解及代码实现
https://www.cnblogs.com/lliuye/p/9156763.html
【中字】主成分分析法(PCA)| 分步步骤解析
看完你就懂了!
https://www.bilibili.com/video/av90308355/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值