自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(58)
  • 收藏
  • 关注

原创 python 天数间隔计算

python 天数间隔计算

2022-05-14 15:59:23 443

原创 python 画折线图、柱状图、正负柱状图、堆叠图

折线图、柱状图、正负柱状图、堆叠图

2022-04-29 21:52:42 2333

原创 python 解析json数据

python 解析json数据

2022-04-28 22:50:00 842

原创 Hive sql解析json格式

hive sql解析json格式

2022-04-27 22:00:41 1791

原创 Python数据处理记录--总结

最近工作中使用Python处理数据遇到的一些知识点记录下来

2022-04-19 22:24:15 665

原创 读取路径存入excel表

# -*- coding: utf-8 -*-import osfile_dir = "D:\\SHU-results-20190401"def file_name(file_dir): for root, dirs, files in os.walk(file_dir): print("root is ",root) # 当前目录路径 pr...

2019-04-02 11:44:20 152

原创 xgboost model 处理 MNIST handwritten digits

参考博客:https://blog.csdn.net/sb19931201/article/details/52577592根据该博客内容,本博主运行的结果如下:

2019-01-21 12:29:34 721

原创 xgboost

学习xgboost   github地址:https://github.com/dmlc/xgboost/tree/master/demoimport xgboost as xgbimport numpy as npimport pandas as pdnp.set_printoptions(threshold=np.inf) # 将数组数据全部输出# read in data...

2019-01-17 21:28:46 160

原创 python3 爬表格数据

数据网址:http://gaokao.xdf.cn/201812/10838484.htmlhttps://www.maigoo.com/news/509088.html代码段:from bs4 import BeautifulSoupimport requestsimport csv#检查url地址  def check_link(url): try: ...

2019-01-17 16:10:44 380

原创 人工智能(Artificial Intelligence)

今天一个完全不懂人工智能和计算机的小伙伴问我自然语言处理的工作怎么样?我说这个是属于人工智能的一部分,他就搞不清楚这个人工智能和计算机是什么关系?我告诉他计算机是工具,人工智能一般是有落地产品的,细节上的我也说不好,因此,我就对具体的人工智能重新认识了下。人工智能是一门基于计算机科学,生物学,心理学,神经科学,数学和哲学等学科的科学和技术。人工智能的一个主要推动力要开发与人类智能相关的计算机功...

2018-12-26 10:34:16 2563 2

原创 卷积神经网络 CNN

1、feature_map=[(原图片尺寸 - 卷积核尺寸)/ 步长] + 1卷积核卷积运算是两个卷积核大小的矩阵的内积运算 卷积核的公式有很多,卷积核也称为滤波器:均值滤波器、高斯滤波器、拉普拉斯滤波器 每一层的卷积核大小和个数可以自己定义,不过一般情况下,根据实验得到的经验来看,会在越靠近输入层的卷积层设定少量的卷积核,越往后,卷积层设定的卷积核数目就越多池化层     池化层方...

2018-12-17 22:23:20 1415

原创 最短路径算法 Floyd算法 Dijkstra算法

1、Floyd算法解决的是所有成对的最短路径问题对于图中的每一个顶点,该算法都会找出从某个顶点到该顶点所能达到的任何其他顶点的最短路径构建的一个初始的距离矩阵,其单元格中包含了连接每一个顶点及其邻居节点的边的权重。当两个顶点之间没有直接的边的时候,我们会在矩阵的单元格中放置一个表示无限的值。Floyd算法的伪代码:for i from 0 to n-1       for r ...

2018-11-28 15:34:13 340

原创 数据结构 图

图的常用的两种表示:相邻矩阵和邻接表。 图是由顶点集V和边集E构成。 路径是从图中一个顶点到达另一个顶点的边的序列   路径的长度就是路径上的边的数目。 从图中的每一个顶点到其他的每一个顶点都有一条路径的话,这个图就是连通的;如果从每个顶点到其他的每一个顶点都有一条边的话,这个图就是完全的。 一个顶点的度数等于连接到它的边的数目。 连通区域是一个子图,包含了从给定的顶点所能到达的节点的集...

2018-11-27 22:30:59 170

原创 python 决策与控制

词汇比较运算符 函数 含义 s.startswith(t) 测试s是否以t开头 s.endswith(t) 测试s是否以t结尾 t in s  测试s是否包含t s.islower() 测试s中所有字符是否都是小写字母 s.isupper() 测试s中所有字符是否都是大写字母 s.isalpha() 测试s中所有字符是否都是字母...

2018-11-27 14:43:08 344

原创 NLP 简单统计

1、变量名必须以字母开头,可以包含数字和下划线,名称是区分大小写的,变量名不能游空格,可以 用下划线 ( _ ) 把单词分开2、利用FreqDist寻找文本中最常见的50个词:第89行 计算whale出现的次数累积频率图计算文本中每个词的长度:fdist.keys() 只有20个不同的元素(说明只有20种不同的词长)fdist.freq(3) 表示 词长...

2018-11-26 22:14:39 264

原创 NLP 搜索文本 计数词汇

基于上一篇博客,已经得到各文本的数据,现在开始对这些数据进行处理:搜索文本1、利用concordance函数来查找文本中的词:如monstrous、affection、lived2、利用similar函数查找相似文本3、common_contexts函数研究共用两个或两个以上词汇的上下文4、利用dispersion_plot函数绘制离散图计数词汇:使用len...

2018-11-26 20:04:09 279

原创 NLTK入门

1、下载NLTK,http://www.nltk.org/  或者用 pip install nltk 下载2、安装完成,启动Python解释器,在提示符后面输入下面两行命令行来安装数据>>> import nltk>>> nltk.download()3、加载文本:from nltk.book import *在这个过程中遇到了很多...

2018-11-26 16:31:26 262

原创 正则表达式 匹配日期和时间

1、正则表达式匹配字符串,注意位数

2018-09-10 14:17:14 20259 1

原创 读取文件 problem

读取的原文:读取的代码遇到问题:1、转义字符:改成这样就好:2、编码可以改成:还可以写成:结果图参考:https://blog.csdn.net/xiaotao_1/article/details/79642399...

2018-09-05 14:03:10 165

原创 SQL实践

1、SQL基础教程  增删改查 2、第2行、第3行表示将city表中的数据备份到一张新表第4行创建一个新的数据库第5行创建一个新的视图,包括id 和population同时满足population>100000第5行更新视图,数据表具体展示如下图 3、对表中属性的增加和删除约束第12行表示获取当前的时间    ...

2018-08-08 16:38:55 434

原创 类和对象

1、定义一个类  类名为Point  第110行和111行  使用句点表示法赋值,x,y称为属性2、print_point 接收一个点作为形参3、定义一个矩形类   属性有width、height及corner是一个Point对象,用来指定左下角的顶点第125行-130行 实例化一个 Rectangle对象 ,并对其属性赋值4、对象是可变的    修改矩...

2018-07-24 17:48:41 168

原创 文件

1、要写入一个文件,需要使用‘w’模式作为第二个实参来打开它,write方法是把数据写入到文件中,返回值是写入的字符数目,如果你再次调用write,它会在文件的结尾处添加新的数据,当写入完毕时,应该关闭文件,第8行写入的数据存储在output.txt记事本中,如下图2、在写入的内容后面加上\n,在记事本中会换行显示,如下图所示3、格式操作符%  第一个操作对象是格式字符...

2018-07-24 15:02:27 157

原创 python爬虫基础

1、爬虫就是一个自动从网络中获取数据的程序2、爬虫用处:新闻数据(今日头条)、机器学习(股票数据获取及分析)、网络搜索引擎的一个部件(谷歌、百度有集群搜索)3、推荐:https://learnxinyminutes.com/docs/python/4、python标准库里对HTTP的实现及其用法、正则表达式(用来解析爬取出来的数据初步分析)、多线程(提高爬虫的执行效率,分布式爬虫)、实...

2018-07-19 18:18:14 226

原创 元组

1、元组是值的一个序列,其中的值可以是任何类型,并且按照整数下标索引,但元组不可变元组是用逗号分隔,用括号括起来的,若新建元组,需在后面加一个逗号,第1行括号括起来的单独的值并不是元组,第3行;第5行为新建一个空元组2、第8行 是一个包含序列的元素的元组(序列包括字符串、列表或元组)。利用方括号操作符(下标)取得元素,第10行;第11行为切片操作元组是不可变的,所以不能修改它的元素,可以将一个元组...

2018-07-11 22:07:25 313

原创 字典

1、字典是一种映射:包含下标(键)和值,每一个键都和一个值相关联,键和值之间的关联称为键值对第1行:新建一个不包含任何项的字典;第2行:花括号表示一个空的字典。给字典添加新项,可以使用方括号操作符,如第3-6行;第7行为打印这个字典的结果,以冒号分隔***字典中键值对的顺序可能并不相同***,字典是利用键查找对应的值如果一个键不存在字典之中,会得到一个异常,如第8行2、len函数返回键值对的数量i...

2018-07-11 15:47:40 485

原创 列表

1、列表 是值的序列  列表中的值称为元素,且可以列表可以嵌套2、列表是可变的,和字符串不同3、使用for循环遍历列表元素4、嵌套的列表被看作一个单独的元素5、列表的拼接操作符:+6、列表的切片   115行-117行7.118行 append可以在列表尾部添加新的元素sort() 将列表中的元素从低到高重新排列extend 方法接收一个列表作为参数,将其所有的元素附加到列表中8、想要把列表中所有...

2018-07-10 23:23:34 364

原创 字符串

1、字符串是一个序列2、使用for循环进行遍历3、字符串切片4、字符串是不可改变的,不能修改一个已经存在的字符串,可以新建一个字符串5、根据一个字符查找其出现在字符串中的下标6、循环和技术 第40行和44行字符串方法:upper()接收一个字符串,并返回一个全部字母都是大写的字符串操作符in : 看第一个是否是第二个的子串7、打印出word1中出现且出现在word2中的所有字母...

2018-07-10 10:40:31 836

原创 迭代

1、while循环2、利用循环实现“条件与递归”中递归部分的代码3、break语句:尖括号('>')来提示用户的输入,如果用户输入done,则退出循环4、平方根使用循环来尽心数值计算,以一个近似值开始,并迭代地优化计算结果。abs是计算差值的绝对值(量级)若测试float的相等,利用80行;大多数的a值,利用81行,效果是很好的...

2018-07-09 22:01:10 279

原创 有返回值的函数

1、求圆的面积2、求绝对值3、比较两个数的大小4、计算两点之间的距离5、已知圆心和圆周上的一点,计算圆的面积6、布尔函数返回布尔值7、检查类型通过42-45行的测试,能确保知道n是正数或08、调试将一个大程序分解为小函数,自然而然地引入了调试的检查点。如果一个函数不能正常工作,可以考虑三种情况:(1)函数获得的实参有问题,某个前置条件没有达到(2)函数本身有问题,某个后置条件没有达到(3)函数的返...

2018-07-09 20:45:46 2806

原创 条件和递归

1、向下取整除法操作符(//)    % 求余2、布尔表达式3、条件执行4、选择执行5、条件链6、嵌套条件7、递归8、键盘输入

2018-07-09 18:25:19 156

原创 Python note

1.初识python3

2018-07-09 10:47:13 173

原创 接口设计

1、检查python中是否安装了turtle模块,turtle模块中提供了一个Turtle函数2、打印3、创建好一个乌龟(Turtle)之后,调用其方法,在窗口中来回移动fd的参数是移动的距离,以像素(pixel) 为单位,所以实际移动的距离依赖于显示器的分辨率Turtle对象的其他的方法包括bk(用于前进和后退)、lt和rt(用于左转和右转)、lt和rt的参数是旋转的角度,单位是度。4、封装5、...

2018-07-09 10:45:29 364

原创 Python 语言精要

1. b=a 将a赋值给一个新变量b,此时a、b同时指向同一个对象,则对a进行添加一个元素,b同时也会增加赋值操作也叫做绑定(binding),实际上是将一个名称和一个对象绑定到一起2. 定义个函数如下图,按引用传递3. 动态引用,强类型语言,了解对象的类型4. isinstance可以接受由类型组成的元组,用来检查一个对象是否是某个特定类型及检查某个对象的类型

2018-01-22 22:39:00 234

原创 JavaScript 收获

(1) 在编写JS代码时,通常将函数放入部分中,或者放在页面的底部。目的:这样可以将中的函数放在一块,不会干扰页面内容的加载。   (2) 在JS中,alert()函数并不常使用,但是它对于代码测试非常方便。   (3) document.write()仅仅向文档输出内容,如果在文档已完成加载后执行该函数,整个HTML页面将被覆盖。(4)Javascript对大小写敏感

2018-01-08 20:55:19 387

原创 React初识

{}var myStyle={fontSize:50,  {}{注释需要写在花括号中}color:'#203014'}ReactDOM.render({}  Hello, world!  Hello,Oda{camelCase 语法(}  回望10年前,中国高铁列车还需要在外国制造商的帮助下进行组装。现在中国已成为世界公认的高铁大国,德国《世界报》曾在去年报

2017-08-21 15:33:52 969

原创 命令行查询数据库

2017-08-17 09:45:17 591

原创 Sweet alert

Try me   function foo(){swal({    title: "Success!",  text: "Here's my error message!",  type: "success",  confirmButtonText: "Cool"}); }        Try m

2017-08-17 09:16:22 380 1

转载 .equals ==

public class StringDemo { public static void main(String[] args) { String str1 = "hello"; String str5=str1; String str6 = "hello"; String str2 = null; Strin

2017-08-16 22:57:19 229

转载 类 对象 属性 方法 类的成员

类:具体同种属性的对象             狗对象:类的实例化                       泰迪属性:静态   具体某个对象的特征                         棕色的毛方法:每个对象有他们自己的行为或方法              会叫、会跑类的成员:属性和方法   构成一个对象的主要部分//Dog类Class Dog{/

2017-08-09 09:52:38 239

原创 LPP代码及其注释

function [eigvector, eigvalue] = LPP(W, options, data)% LPP: Locality Preserving Projections%%       [eigvector, eigvalue] = LPP(W, options, data)% %             Input:%               data

2017-08-01 21:58:30 4464

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除