自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

原创 NLU --- 新的研究成果

呃,貌似又要推翻之前关于词汇分类的研究成果了。这次是完全按照抽象的方式进行分类: 并集抽象,交集抽象,特征提取抽象,统计特征抽象。

2020-12-15 10:31:46 196

原创 LaTex --文字加颜色背景(高亮,反显)

将以下代码加入需要高亮显示的文字即可。\colorbox {yellow}{A-DRM}

2020-11-06 13:52:03 13935 1

原创 高定感想

随着工业化的发展,而高度发达的成衣制衣,无可否认的为人类带来了性价比超级高的物质享受。 而专注于手工艺的顶级高定品牌或者时尚品牌,是传承了人类的技艺没有错。但是,工业化制衣后的结果,确实对手工制衣行业带来了毁灭性的打击。此二者间的冲突像极了业已固化的阶层中,old money们和崛起中产间的竞争。 old money极力想维护现有的阶层关系,从而维护自己的统治地位。 要知道人类是非常善于赋予意义,创造意义的族群。 而old money们正是高定产品的主要消费群体,而给与高定技术所赋予的额外的意义,也可.

2020-07-13 13:38:56 334

原创 关于学习

教育应注重知识体系的构建,而并非只是知识点的记忆。有了完整的知识体系,知识点放在其中会更容易被理解和记忆。 就算记不住也没有关系,可以查阅。...

2020-04-12 10:12:31 154

原创 大脑与比特 -- 随想

我们可以想象成巨量的信息通过大脑这个系统。 因为大脑所具有的结构上的灵活性,同类的信息,渐渐聚集在一起,并形成了一个稳定的小系统,从而提高了这一类别信息的处理效率。无数的小系统又组成更大的系统,逐渐的巨量的混乱的信息,开始慢慢分化,最终形成一个相对稳定的系统。 这种从混沌到秩序的演化过程,同宇宙的演化过程是否有相似之处??...

2020-04-09 11:13:17 143

原创 自然语言理解 -- 模型假设解剖学上的证实

暂时性的放下论文,而花了一个多月来阅读下面这本书,收获颇丰。而今天阅读的有关记忆的章节,其中在大鼠脑的解剖学上证实了,大鼠脑中空间记忆(space memory),联系记忆(relational memory), 工作记忆(working memory)特定皮层处理区域的存在。 这完全证实了我之前的模型,关于特定的空间属性信息,关系属性信息。 还有在分析区域内所产生的过程信息不需要被存储在长期记...

2020-01-22 12:21:08 204

原创 何为信息处理? -- 写在新年初始

最近一直在看神经脑科学的书籍。 论文的写作暂时被搁置。刚才由看了些在顶刊上发表论文的一些写作要求, 让正在写作论文中的我感到有些沮丧,觉得自己的论文好像归在那个类里都有些奇怪,而且本人的计算机编程能力只是入门级别的,这很是为论文能否得到接纳和发表而深感担心。就刚刚看书的过程中,突然有了新的一些想法,又让我的心情明媚起来。就在此做个记录吧。人类每天要处理大量的信息,古代有书籍帮我们记录信息。现...

2020-01-21 22:42:03 210

原创 Anaconda python tensorflow 安装

Anaconda , python 和 tensorflow 的安装一定要注意版本问题。Anaconda 清华镜像源文件路径:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Tensorflow 清华镜像源文件路径:https://pypi.tuna.tsinghua.edu.cn/simple/tensorflow/下载是请对照一...

2019-12-30 20:46:10 161

原创 自然语言理解 -- 何为语言?

1.2.2 何为语言?人类所特有的用来表达意思、交流思想的工具,是 一种特殊的社会现象,由语音、词汇和语法构成一定的系统。--商务印书馆,《现代汉语词典》, 1996例2可以看出,相同的信息集合可以具有不同的表征形式。汉语“狗”和英语‘dog’表征的是同一个信息集合。由此可看出,同一种信息集合可以由不同的形式(语言)来进行表征。下面让我们通过一个客厅里的玩具狗的例子来探索语言表征指代下的信...

2019-11-25 16:02:18 217

原创 自然语言理解 -- 真假苹果

前面文章里提到过,语言本身是大脑对所接收到的信息的高度抽象和概括的表示。人们在用语言进行交流时,引起的是大脑中信息群的反应,而词汇就是这些信息群的高度概括和抽象,不同词汇之间也存在不同结构层次的概括和抽象。其中,所涵盖信息最为丰富的体词(名词和代词等)这里,就用真假苹果的例子,来进一步说明。我们把真“苹果”和‘假苹果’,用之前的体词分析结构进行展开。属性分类苹果1苹果2...

2019-11-14 11:25:36 255

原创 自然语言理解 -- 时间属性分析

感觉时间属性分析,做的还不是特别到位。先放到这里来吧。具体使用,容我再想想,可能需要其他维度来辅助定位。

2019-10-31 17:24:56 238

原创 自然语言理解 -- 维度框架

经过这段时间的研究和调整,昨天大致定下了一个维度框架草稿。今天在这个框架内把数量属性部分大致整理了出来,也算是检验一下框架的合理性,结果还好。现在把这部分内容,整理了放上来,下午争取把空间属性分析部分也整理出来。体词定义框架:属性分类层次子类0维1维2维3维度量类属性基础类时间/空间/数量抽象类关系/结构描述类属性基础类视觉...

2019-10-31 12:50:31 353

原创 自然语言理解 -- 浅悟

今天在进行语言理解抽象层次的分析建模,发现语言才真正是一个综合的学科啊。语言的本质是传递信息,而这些信息是多种多样的,包括基础的输入信息(视觉,听觉,嗅觉,触觉等),基础的加工信息(空间,时间,数量,变化,情绪等),其他加工信息(这里就丰富了,什么植物学,医学,文学,物理,数学等等一切人类的知识等等。)。个人理解,之所以这么长时间以来,语言学的研究发展非常缓慢,和大家对语言的误解有关。语言本身...

2019-10-30 10:09:54 211

原创 自然语言理解 -- 量词

这两天本来是研究抽象名词的,而且进展很大。一不小心拐到了量词分析上。 量词的工作量和复杂程度原低于名词的结构和层次。 所以,先把量词的一些小发现放到这里。总的来说,量词是辅助我们识别基础维度变化的。另一个重要发现是,就算是基础维度,也是可以进行再次抽象的。下面的表主要反映了量词与基础维度变化描述的关系基础维度量词用法量词作用1空间维度河:一条河; 阳光:一缕阳光...

2019-10-29 12:14:41 387 1

原创 强人工智能的突破点

这两天看认知科学的书,了解到人类大脑的主要功能是记忆,分析和联想。而记忆和分析功能,是目前计算机已经具备,而且其计算能力可能已经超过人类的功能。我暂且大胆的假设,联想功能是强人工智能的关键,是人之之所以为人,区别于机器的关键!!!...

2019-10-27 12:07:29 253

原创 现代汉语动词分析 -- 部分

Up主,正在找工作,有机会可以联系我呀。今天打算听听课,把昨天的作业发上来把。

2019-10-12 09:38:38 335

原创 自然语言理解模型 - 维度的建立

在NLP领域知识的学习过程中,对目前主流的NLP研究非常失望。我认为,目前NLP的绝大多数的研究方向简直错的离谱。原因如下:如我前述文章所言,自然语言,作为生命演化后期,高等生物所特有的进化产物,并不是凭空出现的,而是一个搭载在生命演化过程中,各个完整单一模块整体系统上的。 某种程度上是一个系统各部分输出的整合后的部分输出过程。而系统的整合,其实就是人类思维的过程。 语言则是人类思维过程中对外...

2019-10-07 13:20:28 570

原创 关于人工智慧的思考

虽然,目前我对让机器理解人类语言,基本已经信心十足了。坐等我的工作结果把。刚才,又想到。让机器能够真正理解人类语言,和让机器拥有自己的思维。 他们之间的联系和区别在哪里?在让机器理解语言的模型里,随着新的语言行为的发生,和新的语言信息的输入,机器需要不断重新确认模型中的(因变量,参变量等信息)各个模型组成部分的计算结果,结合新的输入,不断的重新计算。所以这是一个不断接受新信息,根据新信息调整...

2019-10-05 13:57:13 150

原创 自然语言的定义

这几天在B站上听宗成庆老师的《自然语言处理》的课程。其中宗老师介绍了一些关于语言的定义,如下:人类所特有的用来表达意思、交流思想的工具,是 一种特殊的社会现象,由语音、词汇和语法构成一定 的系统。 -商务印书馆,《现代汉语词典》, 1996 了语言可以被看成一个抽象的数学...

2019-10-05 13:41:57 1322

原创 关于基础知识学习重要性的思考 -- 1

我是在家里自学人工智能,机器学习的相关知识。所以,难免过程中会走一些的弯路。在目前整个社会学习人工智能热情高涨的情况下,很多人加入了学习队伍。但也感觉到,大家都在追时髦,追流行。比赛谁学会了新的什么模型,有什么新的调参技巧。 而忽视了基础知识的学习。很可笑的,目前很多做NLP的人,其实并没有自然语言的基础知识。比如(语法理论,语法分析,词法分析,词性标注等)。个人认为如果对语言本身的组成...

2019-10-04 11:30:01 564

原创 关于人工智能的零碎思考 --1

目前绝大多数的人工智能都是伪人工智能。或者说没有进行跨系统整合的人工智能,都是伪人工智能。充其量只是一个小工具而已。并不具备智能的特性。 — 绝大多数人都没有看到这一点, 而整个社会都在假象中自High....

2019-10-04 11:02:12 123

原创 梯度与方向导数的本质,及理解上的坑。

关于梯度和方向导数这两个基础概念,浪费了我挺多时间,概念其实不难。但是,发现我之前一直没有理清楚一些基本概念,所以一直在坑里,不是特别明白。这里把我之前的坑分享给大家。要想理解梯度,和方向导数的本质。必须要搞清楚以下概念。几乎所有的老师都不提这块,我也是醉了。曲面上过 P0P_{0}P0​ 点的:方向 ⊂\subset⊂ 曲面定义域平面(超平面); 方向是矢量。方向导数 ⊂\subs...

2019-06-20 13:52:39 4056 1

原创 超平面详解

学习SVM绕不开超平面的概念。先复习一些基础的概念(平面方程),帮助理解。1. 平面及其方程:因为平面与空间直线分别是曲面与空间曲线的特例,所以在讨论平面与空间直线以前,先引入有关曲面方程与空间曲线方程的概念。在空间解析几何中,任何曲面或曲线都可以看做点的集合轨迹,在这样的意义下,如果曲面S与三元方程: F(x, y, z) = 0 ...

2019-06-12 12:59:32 7472 2

原创 距离,范数,线性结构,空间。

机器学习必须要搞懂的一些基础数学概念,我一边学习,一遍在这里做笔记记录。什么是数学的空间:研究工作的对象和遵循的规则元素和结构(线性结构:加法和数乘; 拓扑结构:距离,范数,开集)是很多工程学甚至社会科学的语言。关于上面这段,我理解数学空间,就像你手机里装的游戏:连连看,斗地主,俄罗斯方块。那么每一个游戏里(空间里),都有不同的元素和结构,有不同的游戏规则。此次是上海交大《数学之旅...

2019-04-26 17:20:01 849

原创 信息量和熵 - 总结

总结一下离散变量:离散变量非平均自信息量平均自信息量 - 熵自信息I(xk)=log1q(xk)=−logq(xk)I(x_{k}) = log\frac{1}{q(x_{k})} = - log q(x_{k})I(xk​)=logq(xk​)1​=−logq(xk​){X,q(x)}\{X, q(x)\}{X,q(x)} : H(x)=∑q(x)...

2019-04-11 16:25:09 1674

转载 正则表达式 re.findall 用法

正则 re.findall 的简单用法(返回string中所有与pattern相匹配的全部字串,返回形式为数组)语法:findall(pattern, string, flags=0)import rePython 正则表达式 re findall 方法能够以列表的形式返回能匹配的子串print (help(re.findall))print (dir(re.findall))fi...

2019-04-10 15:25:07 2380

转载 NumPy与ndarray简介(转)

一、NumPy简介NumPy的全名为Numeric Python,是一个开源的Python科学计算库,它包括:一个强大的N维数组对象ndrray;比较成熟的(广播)函数库;用于整合C/C++和Fortran代码的工具包;实用的线性代数、傅里叶变换和随机数生成函数NumPy的优点:对于同样的数值计算任务,使用NumPy要比直接编写Python代码便捷得多;NumPy中的数组的存...

2019-04-02 23:07:43 825

原创 随机森林分类做出精确度是100%

呃,一定是哪里错了。各位大侠有空帮忙看看,这是不太可能的结果啊。我把码贴下面了啊。data_test_target = pd.read_csv(r"C:\Database\Titanic_Machine Learning from Disaster\gender_submission.csv")data_test_m = pd.merge(data_test, data_test_target...

2019-04-01 23:12:58 6467 10

原创 机器学习模型评估与选择

模型搭建的要素(A数据,任务需求,算法)通常我们拿到数据,先要对数据进行分析,理解任务需求,然后选择相应的算法。有的时候算法不是唯一的。那么,我们就需要按照以下流程对不同的算法进行比较和选择。A. 方法:(留出法,交叉验证法,自助采样)B. 评估标准:(错误率与精度;查准率,查全率与F1;ROC与AUC;代价敏感错误率与代价曲线)C. 比较检验:(假设检验;交叉验证t检验;McNemar检...

2019-04-01 15:04:23 146

转载 人工智能数学基础知识

**线性代数:**如何将研究对象形式化?概率论: 如何描述统计规律?**数理统计:**如何以小见大**最优化理论:**如何找到最优解?信息论: 如何定量度量不确定性?形式逻辑: 如何实现 抽象推理?**线性代数:**如何将研究对象形式化?事实上,线性代数不仅仅是人工智能的基础,更是现代数学和以现代数学作为主要分析方法的众多学科的基础。从量子力学到图像处理都离不开向量和矩阵的使用。 而...

2018-12-25 17:45:02 3831

转载 拉普拉斯分布

Laplace分布的概率密度函数的形式是这样的:p(x)=12λe−|x–μ|λp(x)=12λe−|x–μ|λ 一般μμ的取值为0,所以形式如下:p(x)=12λe−|x|λp(x)=12λe−|x|λ它是由两个指数函数组成的,所以又叫做双指数函数分布(double exponential distribution)均值和方差均值的求解,若X的概率密度函数为f(X),那么X的均值为...

2018-12-19 11:22:50 2756

原创 Python-关键字与循环控制 02

基本变量类型整数浮点数字符串布尔值空值函数模块类型*自定义类型变量和类型变量定义:变量存储在内存中的值,这就意味着在常见变量时会在内存中开辟一个空间。基于变量的数类型,解释器会分配指定内存,并决定什么数据可以被存储在内存中。变量可以制定不同的数据类型,这些变量可以存储整数,小数或字符(弱类型)堆:是一块公共的内存空间,谁分配谁回收。生命周期是全局的。栈:函数调用完后...

2018-12-19 09:58:39 165

原创 Python入门基础 01

常用关键字:常量 – True False None对象和容器 – class import from del判断:ifelifelseisinassert循环:forwhilecontinue – 跳出当前循环breakpass – 后面什么都不做,尤其是语法有歧义的地方丛填充。异常: raise, try, except, finally,算数运...

2018-12-18 13:33:00 129

转载 Bagging 和Boosting 概念和区别

Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个性能更加强大的分类器,更准确的说这是一种分类算法的组装方法。即将弱分类器组装成强分类器的方法。首先介绍Bootstraping,即自助法:它是一种有放回的抽样方法(可能抽到重复的样本)。1、Bagging (bootstrap aggregating)Bagging即套袋法,其算法过程如下:A)从原始样...

2018-12-10 11:44:03 209

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除