- 博客(412)
- 收藏
- 关注
转载 见过的最好的PCA解析
1.概述 PCA:主成分分析,一种常用的数据分析方法,不管是在机器学习还是数据挖掘中都会用到。PCA主要通过求数据集的协方差矩阵最大的特征值对应的特征向量,由此找到数据方差最大的几个方向,对数据达到降维的效果,将一个n维的向量降低到d维,其中d<n。本文主要从方差最大化理论解释PCA的实现过程。 首先来看这样几个实际问题,比如那到一个汽车的样本,里面既有千米每小时度量...
2018-06-20 15:00:51 1893
转载 Dictionary Learning(字典学习、稀疏表示以及其他)
第一部分 字典学习以及稀疏表示的概要字典学习(Dictionary Learning)和稀疏表示(Sparse Representation)在学术界的正式称谓应该是稀疏字典学习(Sparse Dictionary Learning)。该算法理论包含两个阶段:字典构建阶段(Dictionary Generate)和利用字典(稀疏的)表示样本阶段(Sparse coding with a preco...
2018-04-23 18:12:54 5481 2
原创 pascalvoc xml 转 label studio json
import os"value": {"x": xmin,"y": ymin,},"data": {},# 使用示例。
2024-08-26 16:00:18 333
原创 中文ict行业关键词
"TypeScript", "Go", "R语言", "Perl", "Scala", "Rust", "MATLAB", "Django", "Flask", "Angular","IPv6", "以太网", "5G技术", "Wi-Fi", "蓝牙", "近场通信", "Zigbee", "软件定义网络", "VoIP","二极管", "电容器", "电感器", "电阻", "示波器", "万用表", "焊接", "面包板", "电源", "内存",
2024-08-22 15:00:16 345
原创 ict行业重要关键词
2. **C++**6. **CSS**8. **PHP**11. **C#**13. **Go**14. **R**32. **5G**
2024-08-22 14:17:02 599
原创 hhhhh
search_bar = driver.find_element(By.XPATH, '//input[@name="q"]') # 根据实际情况调整 XPath。driver = webdriver.Chrome() # 或者使用其他浏览器的驱动程序,如 webdriver.Firefox()driver = webdriver.Chrome() # 或者使用其他浏览器的驱动程序,如 webdriver.Firefox()search_bar.send_keys("你的搜索字符串")
2024-08-05 19:38:42 381
原创 把js里面的值显示到html上的办法
如果你使用的是现代前端框架(如 React, Vue, Angular),它们有自己的机制来更新 DOM 和显示数据。: 这个方法会向 HTML 文档写入内容,但通常不推荐使用,因为它会重写整个 HTML 页面。: 在现代浏览器中,你可以使用模板字面量来构造 HTML 字符串,然后将其插入到 DOM 中。: 这两个属性也可以用来修改元素的内容,但不会解析 HTML 标签。: 你可以创建新的 HTML 元素,并将其添加到 DOM 中。属性,可以将内容插入到指定的元素中。: 通过改变 HTML 元素的。
2023-11-08 20:37:57 2776
原创 Python 常用写法
1.时间import datetimenow=datetime.now()nowStr=now.strftime(now,"%Y%m%d%H%M%S")2.数组,加索引enumerate(arr)3.数组,去除空arr=[x for x in arr if x !=""]arr=filter(None, arr)4.去重复arr=list(set(arr))
2022-01-17 12:03:48 585
原创 [Shell] 常用写法
常识awk 'condition{move1;move2}' 文件名1 文件名2NR 行数,索引NF 列数,一般写在{}内部-F"dfd" 重新确认分隔符A~B 是否包含 - 也可以-gt 大于等于// 正则去重| awk '!a[$0]++'| sort -u | uniq大写字母[root@localhost ~]# test='ab'[root@localhost ~]# echo $testab[root@localhost ~]#
2021-07-09 10:04:34 354
原创 [JetBrain] 快捷键 @2021-07-08
最重要的快捷键 ctrl+shift+A:万能命令行 shift两次:查看资源文件 ctrl + q 查看数据类型 新建工程第一步操作 module设置把空包分层去掉,compact empty middle package 设置当前的工程是utf-8,设置的Editor-->File Encodings-->全部改成utf-8, 注释1. ctrl+/:单行注释2. ctrl + shift + /: 部分注释光标操作 ctr
2021-07-08 09:47:19 211
原创 SQL 优化的经验
查询语句无论是使用哪种判断条件等于、小于、大于,WHERE左侧的条件查询字段不要使用函数或者表达式 使用EXPLAIN命令优化你的 SELECT 查询,对于复杂、效率低的 sql 语句,我们通常是使用 explain sql 来分析这条 sql 语句,这样方便我们分析,进行优化。 当你的 SELECT 查询语句只需要使用一条记录时,要使用LIMIT 1 不要直接使用SELECT *,而应该使用具体需要查询的表字段,SELECT * 使用的是全表扫描,type = all。 为每一张表...
2021-07-05 15:55:28 197
原创 [Mysql] 创建函数 function
通过操作,先删除,再创建:Drop+ Createdelimiter $$DROP FUNCTION IF EXISTS `show_ngd` $$CREATE FUNCTION `show_ngd`(MEMEID varchar(50)) RETURNS varchar(300)BEGIN DECLARE str varchar(50) DEFAULT ''; RETURN (SELECT CONCAT(MATCHED_FNAME,MATCHED_LNAME, GENDER,DOB
2021-07-01 09:37:19 329
转载 scala中跳出循环的3种方法
1、scala中跳出循环语句的3种方法 1)基于Boolean类型的控制变量// while循环var flag = truevar result = 0var n = 0while(flag) { res += n n += 1 println("res = "+ res) println("n = "+ n) if (n == 10) { flag = false }}// for循环var flag = truevar res =
2021-01-05 09:19:21 2239
原创 2020-12-21
$$Shell本身的PID(ProcessID)$!Shell最后运行的后台Process的PID$?最后运行的命令的结束代码(返回值)$-使用Set命令设定的Flag一览$*所有参数列表。如"$*"用「"」括起来的情况、以"$1 $2 … $n"的形式输出所有参数。$@所有参数列表。如"$@"用「"」括起来的情况、以"$1" "$2" … "$n" 的形式输出所有参数。$#添加到Shell的参数个数$0Shell本身的文件名$1~$n添加到Shell的各参数值。$1是第1
2020-12-21 11:19:13 159
转载 2020-11-18
太关注于所得的结果是否正确,而忽略了不同的实现方法之间可能存在的性能差异,这种性能差异在大型的或是复杂的数据库环境中(如联机事务处理OLTP或决策支持系统DSS)中表现得尤为明显。笔者在工作实践中发现,不良的SQL往往来自于:不恰当的索引设计 不充份的连接条件 不可优化的where子句测试环境主机:HP LH II----主频:330MHZ----内存:128兆----操作系统:Operserver5.0.4----数据库:...
2020-11-18 22:16:36 206
转载 SQL 索引 index
建立索引的原则1) 定义主键的数据列一定要建立索引。 2) 定义有外键的数据列一定要建立索引。 3) 对于经常查询的数据列最好建立索引。 4) 对于需要在指定范围内的快速或频繁查询的数据列; 5) 经常用在WHERE子句中的数据列。 6) 经常出现在关键字order by、group by、distinct后面的字段,建立索引。如果建立的是复合索引,索引的字段顺序要和这些关键字后面的字段顺序一致,否则索引不会被使用。 7) 对于那些查询中很少涉及的列,重复值比较多的列不要建立索引。 8)
2020-11-18 21:40:49 1467
原创 Pandas 优秀文章
Fast, Flexible, Easy and Intuitive: How to Speed Up Your Pandas Projectshttps://realpython.com/fast-flexible-pandas/
2020-11-18 19:55:49 175
转载 Pandas 面试
迭代器使用itertuples() 和iterrows() 循环实际上可以通过pandas引入itertuples和iterrows方法可以使效率更快。这些都是一次产生一行的生成器方法,类似scrapy中使用的yield用法。.itertuples为每一行产生一个namedtuple,并且行的索引值作为元组的第一个元素。nametuple是Python的collections模块中的一种数据结构,其行为类似于Python元组,但具有可通过属性查找访问的字段。.iterrows为DataFr...
2020-11-18 19:33:31 1079
原创 【Power BI】【Power pivot】【DAX】练习题2
在 2008 年和 2009 年都购买过手机类别产品的客户列表:EVALUATECALCULATETABLE ( VALUES ( Customer[Customer Code] ), INTERSECT ( CALCULATETABLE ( SUMMARIZE ( Sales, Customer[CustomerKey], Product[P...
2020-10-19 23:56:29 1599 1
原创 【Power BI】【Power pivot】【DAC】练习题
数据代码源头为微软官方教程:contoso.xlsb题目:两件组合产品一起卖,如何分别表示他们各自的属性呢?分析:典型的笛卡尔积,但是不能自己积自己,为了避免完全限定名称产生重复,必须提前重命名该列。例如,以下查询返回产品库存类型与其自身的所有组合:EVALUATECROSSJOIN ( VALUES ( Product[Stock Type] ), SELECTCOLUMNS ( VALUES ( Product[Stock Type] ),
2020-10-19 18:01:06 1509
原创 beautifulsoup4 bs4 find_all & find 函数解析
假定soup是我们下载下来的网页的对象了soup = BeautifulSoup(a, "html.parser")# 第一种,直接将属性名作为参数名,但是有些属性不行,比如像a-b这样的属性soup.find_all('p', id = 'p1') # 一般情况soup.find_all('p', class_='p3') # class是保留字比较特殊,需要后面加一个_# ...
2019-07-28 20:00:16 6495 1
原创 上传git
什么是git?git是一个开源的分布式版本控制系统,可以有效、高速地处理从很小到非常大的项目版本管理。git是一种工具,它能更好的让我们管理代码。很多时候如果我们需要保持本地代码和github代码版本一致,那么我们就会用到git这个工具。git工具不仅可以让我们克隆别人的或者自己的远程代码,还可以实现本次存储远程仓库。下面小编给大家讲讲如何使用git把本地代码上传(更新)到github上第一步...
2019-07-22 17:27:53 220
原创 【Python】PIL模块
Python自建库,在爬虫等基础应用中更加简单好记,做整理以备自查。目录Image模块open类、Save类、format类、Mode类、convert类、Size类、Info类、new类、Copy类、Crop类、Paste类、Filter类、Blend类、Split类、Composite类、Eval类、Merge类、Draft类、Getbands类、Getbbox类、Getda...
2019-06-19 03:48:24 715
原创 【Python】bs4库
from bs4 import BeautifulSoupimport rehtml_doc = """<html><head><title>The Dormouse's story</title></head><body><p class="title"><b>The...
2019-06-15 15:06:03 731
原创 No module named 'cookielib'或No module named 'urllib2'或raw_input
1.ModuleNotFoundError: No module named 'cookielib'Python3中,importcookielib改成 importhttp.cookiejar,然后方法里cookielib也改成http.cookiejar。2.ModuleNotFoundError: No module named 'urllib2'...
2019-06-12 23:50:24 1135
原创 【Python】常用字符串处理
第一步,打开eclipse开发工具,新建一个py文件;定义一个变量a1,赋值为字符串,然后调用endswith方法,判断问号是不是这个字符串结尾,如下图所示: 第二步,修改第一步的代码,判断name字符串是不是a1的结尾,返回结果为False,说明不是,如下图所示: 第三步,再次修改变量和变量值,判断变量a2是否以问号开头;返回值为False,说明不是以问号结尾...
2019-06-11 21:52:17 232
原创 【python】 os库——查看、修改文件属性
In [132]:import os# 查看文件属性In [133]: os.stat('package-lock.json')Out[133]: os.stat_result(st_mode=33206, st_ino=7036874417947173, st_dev=651824810, st_nlink=1, st_uid=0, st_gid=0, st_size=304, st_...
2019-06-11 21:50:49 2053
原创 【Python】os库——批处理
注:字符串常见函数1.提取目录:在批处理中时常会用到文件夹的相互转换-------主要是通过os模块实现path=os.getcwd() #path就是当前的工作目录print(path) # '/ZC/Download/data'2.更改当前目录os.chdir( ‘ZC/Download/data’)#将工作路径改为了‘ZC/Download/data’3...
2019-06-11 19:19:41 559
原创 特征脸——PCA应用
一、特征脸特征脸EigenFace从思想上其实挺简单。就相当于把人脸从像素空间变换到另一个空间,在另一个空间中做相似性的计算。这么说,其实图像识别的基本思想都是一样的,首先选择一个合适的子空间,将所有的图像变换到这个子空间上,然后再在这个子空间上衡量相似性或者进行分类学习。那为什么要变换到另一个空间呢?当然是为了更好的做识别或者分类了。那为什么变换到一个空间就好识别或者分类了呢?...
2019-06-01 01:34:31 736
原创 【数学基础】 线性代数以及符号编总
1基本概念和符号线性代数可以对一组线性方程进行简洁地表示和运算。例如,对于这个方程组:这里有两个方程和两个变量,如果你学过高中代数的话,你肯定知道,可以为x1 和x2找到一组唯一的解 (除非方程可以进一步简化,例如,如果第二个方程只是第一个方程的倍数形式。但是显然上面的例子不可简化,是有唯一解的)。在矩阵表达中,我们可以简洁的写作:其中:很快我们将会看到,咱们把方程表示...
2019-05-24 20:36:01 46700 3
转载 加速神经网络训练 (机器学习)
包括以下几种模式:Stochastic Gradient Descent (SGD) Momentum AdaGrad RMSProp Adam越复杂的神经网络 , 越多的数据 , 我们需要在训练神经网络的过程上花费的时间也就越多. 原因很简单, 就是因为计算量太大了. 可是往往有时候为了解决复杂的问题, 复杂的结构和大数据又是不能避免的, 所以我们需要寻找一些方法, 让神经...
2019-05-20 20:13:00 303
原创 【Pandas】DataFrame 速查
基本操作>1.查看前5个值和后三个值>df2.head()>df2.tail(3)>2.查看列名,值,以及索引>df2.columns>df2.values>df2.index>3.查看统计数据>df2.describe()>4.转置操作>df2.T>5.通过标签查询>df2['ag...
2019-05-20 01:00:22 379
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人