Validator.nu 本地实例搭建过程

 

Validator.nu是一个验证HTML5文件是否符合标准和规范的一个在线服务,基本上和 W3C Validator 提供的服务类似。W3C的验证期在Ubuntu的软件库中已经有现成可用的(w3c-markup-validator),但是这个现成的验证器如果要验证HTML5的话,还是需要使用Validator.nu。

由于我们只需要验证HTML5的代码,所以计划直接在本地搭建一个Validator.NU的实例。如果要验证的文件比较少,那么可以直接去使用在线服务。如果要验证大量的HTML5页面,在本地搭建一个实例是最合适的了,主要是为了能够快速的得到验证的结果。

在Validator.nu的官方站点上,有一个简单的关于搭建Validator.nu本地实例的说明

mkdir checker
cd checker
hg clone https://bitbucket.org/validator/build build
python build/build.py all
python build/build.py all

但是由于Validator.nu的源代码托管服务bitbucket在国内无法直接访问,所以需要手动的做一些工作才能够完成这个本地实例的搭建。

首先你的机器上应该安装了Java SDK、Tortoise、Python。如果是Windows的机器,还有设置相关的环境变量,保证能够在命令行工具运行javacjavapythonhg命令。

要想从bitbucket上检出Validator.nu的代码,需要使用VPN或者代理的手段翻出去。由于我使用的是Ubuntu Server,在Ubuntu Server上配置VPN比较啰嗦,所以干脆在自己的Mac机器上拨VPN,检出代码后再去Ubuntu Server上build。但是在文档中我是直接截取的在Mac机器上build的代码。

如果你的机器上没有hg命令,请去下载TortoiseHG (这个站竟然是可以访问的!)

yuanyq@yuanyq-mac:~ $ cd apps
yuanyq@yuanyq-mac:~ $ mkdir checker
yuanyq@yuanyq-mac:apps $ cd checker
yuanyq@yuanyq-mac:checker $ hg clone https://bitbucket.org/validator/build build
yuanyq@yuanyq-mac:checker $ python build/build.py checkout

检出源代码之后,就会在checker目录下生成build文件夹,该文件夹下有一个主要的文件就是build.py

源代码检出之后,就可以下载依赖包了,此时无需拨VPN了,以加快下载速度。但是在实际操作中发现,下载jetty-6.1.26.zip依赖包时,速度太慢,甚至最后报出了MD5校验无法通过的错误(难道是因为jetty的新版本被Eclipse项目组收编了之后老版本的服务器不维护了?)。所以,这里我们先使用其他下载工具下载jetty-6.1.26(http://dist.codehaus.org/jetty/jetty-6.1.26/jetty-6.1.26.zip),然后在本地搭建一个HTTP的服务器,把jetty-6.1.26.zip放置到本地HTTP服务器的根目录,然后修改一下build/build.py脚本,指向本地下载。

修改build.py脚本,找到第92行,将

http://dist.codehaus.org/jetty/jetty-6.1.26/jetty-6.1.26.zip

替换为

http://localhost/jetty-6.1.26.zip

保存修改后的build.py,然后执行依赖包的下载。下载依赖包的时候可以不用VPN,因为依赖包所在的网址都是可以直接访问到的:

yuanyq@yuanyq-mac:~$ cd apps/checker
yuanyq@yuanyq-mac:~/apps/checker$ python build/build.py --no-self-update dldeps

其中--no-self-update参数是告诉脚本不要尝试去bitbucket上下载源文件。 等到依赖包下载完毕之后,就可以build了。build之前要确认JAVA_HOME环境变量设置正确。在我的机器上的.bash_profile中环境变量设置如下:

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64
export PATH=${JAVA_HOME}/bin:${PATH}

执行build命令:

yuanyq@yuanyq-mac:~/apps/checker$ python build/build.py --no-self-update build

build命令执行成功之后,再重复执行build命令一次,否则在启动服务的时候会发生如下错误:

nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/html5.rnc
Error:
Syntax error.
File: http://s.validator.nu/html5/html5full.rnc
Line: 1 Col: 0

Error:
Reference to undefined pattern “common.elem.flow”.
File: http://s.validator.nu/html5-svg-mathml.rnc
Line: 22 Col: 17

两次build命令完成之后,进入nu-validator-site文件夹,修改startit.sh脚本,注释掉JAVA_HOMEPATH的设置,因为在bash环境上已经设置了相关的环境变量了。然后修改脚本中的cd /usr/local/validator.nu一行,设置为在检出代码之前创建的checker目录。最终startit.sh脚本看起来是这样的:

#!/bin/sh

#JAVA_HOME=/usr/local/java
#export JAVA_HOME

#PATH=$JAVA_HOME/bin/:$PATH
#export PATH

cd /some/path/to/apps/checker

if [ "$1" != "" ]
then
    args=$@
else
    args="--no-self-update run"
fi
python build/build.py \
  --w3cbranding \
  --heap=512 \
  --connection-timeout=3 \
  --socket-timeout=3 \
  --html5link=http://www.w3.org/html/wg/drafts/html/master/single-page.html \
  --user-agent=Validator.nu/LV\ http://validator.w3.org/services \
  --name="Ready to validate" \
  $args

最后,就可以通过执行startit.sh来启动服务了。默认的监听端口是8888。

yuanyq@yuanyq-mac:~/apps/checker/nu-validator-site$ nohup ./startit.sh &
[1] 21556
yuanyq@yuanyq-mac:~/apps/checker/nu-validator-site$ nohup: ignoring input and appending output to ‘nohup.out’

yuanyq@yuanyq-mac:~/apps/checker/nu-validator-site$

查看一下nohup.out中的输出:

yuanyq@yuanyq-mac:~/apps/checker/nu-validator-site$ cat nohup.out
2013-05-24 11:07:13.437:INFO::Logging to STDERR via org.mortbay.log.StdErrLog
nu.validator.servlet.VerifierServletTransaction - Starting static initializer.
nu.validator.servlet.VerifierServletTransaction - Starting to loop over config file lines.
nu.validator.servlet.VerifierServletTransaction - Finished reading config.
nu.validator.servlet.VerifierServletTransaction - Converted config to arrays.
nu.validator.servlet.VerifierServletTransaction - Prepared namespace array.
nu.validator.servlet.VerifierServletTransaction - Parsed doctype numbers into ints.
nu.validator.servlet.VerifierServletTransaction - The cache path prefix is: null
nu.validator.servlet.VerifierServletTransaction - Parsing set up. Starting to read schemas.
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/html5.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/html5-its.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/html5-rdfalite.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml10/xhtml-strict.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml10/xhtml-transitional.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml10/xhtml-frameset.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml5.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml5-rdfalite.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml1-ruby-rdf-svg-mathml.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/svg-xhtml5-rdf-mathml.rnc
nu.validator.servlet.VerifierServletTransaction - Schemas read.
nu.validator.servlet.VerifierServletTransaction - Reading spec.
nu.validator.servlet.VerifierServletTransaction - Spec read.
nu.validator.servlet.VerifierServletTransaction - Initialization complete.
2013-05-24 11:07:16.593:INFO::jetty-6.1.26
2013-05-24 11:07:16.614:INFO::Started SocketConnector@0.0.0.0:8888
Exception in thread "main" java.io.IOException: Bad file descriptor
    at java.io.FileInputStream.readBytes(Native Method)
    at java.io.FileInputStream.read(FileInputStream.java:242)
    at java.io.BufferedInputStream.fill(BufferedInputStream.java:235)
    at java.io.BufferedInputStream.read(BufferedInputStream.java:254)
    at nu.validator.servlet.Main.main(Main.java:120)

最后的一个异常信息不影响应用工作,可以不用管他。

打开浏览器访问http://localhost:8888

至此,Validator.nu本地实例搭建完毕。

转载于:https://www.cnblogs.com/yuanyq/archive/2013/05/28/3103013.html

深度学习是机器学习的一个子领域,它基于人工神经网络的研究,特别是利用多层次的神经网络来进行学习和模式识别。深度学习模型能够学习数据的高层次特征,这些特征对于图像和语音识别、自然语言处理、医学图像分析等应用至关重要。以下是深度学习的一些关键概念和组成部分: 1. **神经网络(Neural Networks)**:深度学习的基础是人工神经网络,它是由多个层组成的网络结构,包括输入层、隐藏层和输出层。每个层由多个神经元组成,神经元之间通过权重连接。 2. **前馈神经网络(Feedforward Neural Networks)**:这是最常见的神经网络类型,信息从输入层流向隐藏层,最终到达输出层。 3. **卷积神经网络(Convolutional Neural Networks, CNNs)**:这种网络特别适合处理具有网格结构的数据,如图像。它们使用卷积层来提取图像的特征。 4. **循环神经网络(Recurrent Neural Networks, RNNs)**:这种网络能够处理序列数据,如时间序列或自然语言,因为它们具有记忆功能,能够捕捉数据中的时间依赖性。 5. **长短期记忆网络(Long Short-Term Memory, LSTM)**:LSTM 是一种特殊的 RNN,它能够学习长期依赖关系,非常适合复杂的序列预测任务。 6. **生成对抗网络(Generative Adversarial Networks, GANs)**:由两个网络组成,一个生成器和一个判别器,它们相互竞争,生成器生成数据,判别器评估数据的真实性。 7. **深度学习框架**:如 TensorFlow、Keras、PyTorch 等,这些框架提供了构建、训练和部署深度学习模型的工具和库。 8. **激活函数(Activation Functions)**:如 ReLU、Sigmoid、Tanh 等,它们在神经网络中用于添加非线性,使得网络能够学习复杂的函数。 9. **损失函数(Loss Functions)**:用于评估模型的预测与真实值之间的差异,常见的损失函数包括均方误差(MSE)、交叉熵(Cross-Entropy)等。 10. **优化算法(Optimization Algorithms)**:如梯度下降(Gradient Descent)、随机梯度下降(SGD)、Adam 等,用于更新网络权重,以最小化损失函数。 11. **正则化(Regularization)**:技术如 Dropout、L1/L2 正则化等,用于防止模型过拟合。 12. **迁移学习(Transfer Learning)**:利用在一个任务上训练好的模型来提高另一个相关任务的性能。 深度学习在许多领域都取得了显著的成就,但它也面临着一些挑战,如对大量数据的依赖、模型的解释性差、计算资源消耗大等。研究人员正在不断探索新的方法来解决这些问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值