关于互联网的隐私与用户友善

关于互联网的隐私与用户友善

互联网文化的要旨是自助与合作,而不是集中管理。例如,即时通信(如腾讯QQ)的内容包含大量的隐私信息,不应集中管理。实际上,私人之间不经过服务器(P2P)的即时通信不难实现,Unix就自带了文本即时通信工具talk。需要指出,各种公开版本的Unix都缺少优雅性,或者说好的技术只在同等级别的社区之间交流,而社区有自己的隐私。开源的Unix版本就象版权声明中常说的那样,“甚至不包含适用于商业的隐含承诺”(without even the implied warranty of MERCHANTABILITY),因而鼓励社区开发自己的独立版本。与之相似,HTTP或即时通信只是公共协议,如何管理浏览过的文档或通信记录,完全由社区自己的软件独立选择。例如,KDE桌面就自带志愿者开发的浏览器Konquerer,作为Netscape商业浏览器继任者的Firefox浏览器也是由社区开发。如果我们的社区不跟进这些技术就已经落后。

"I Accept"

隐私是人的自然需要,但需求因人而异,中国人因对隐私的过分侵犯(收集)而被西方嘲笑。《Node.js实战》(人民邮电出版社)一书的第一章最后一节名为“默认DIRT”,似乎暗示中国人对不受控制的自然行为的反感(而麻烦的app结构也确实令人生厌);第二章则介绍聊天室服务器的实现,支持创建用户、开房间、发送信息等,功能与即时通信相似,该示例复杂而未能讲清要点,难以学习。正如前面指出,聊天的隐私应被保护,即时通信一开始就应由热衷者自助实现。不依赖服务器的MP3共享服务Napster就是在西方很热的一个例子。

另一个隐私问题是互联网视频。视频播放过程中的回放点,常常透露出观看者的视角。Flash播放软件能够收集用户的这些操作。新的HTML5的<video>标签试图统一视频播放形式,使之都采用HTTP协议下的视频文件。实际上,较早的HTML版本就能播放HTTP协议下的视频文件。这样,回放时仅重播已缓存的视频内容而不会通知服务器。采用视频文件的另一个优点是方便用户保存视频,用户能够保存浏览过的内容便于以后使用,是Internet隐含赋予用户的权力。与视频相似,javascript也可能将用户的滚页操作、甚至更为细微的操作发回服务器,这些构成对隐私的侵犯而应被抵制。实际上,浏览器应能方便地搜索查看保存的内容而无须报告网站;网页都应该有简洁的HTML编码,方便保存与分析;网页都应该支持无Javascript浏览,更好的页面效果应当由扩展的HTML标签而不是javascript来支持。(HTML5的其他新功能主要用来支持网页应用程序,如在浏览器中编写Word文档。)

互联网服务的目标是方便用户,而不是采集数据。例如,学习或者使用软件时查看文档没有必要向网站报告,而应能使用本地下载的文档。作为基准,无论Linux、Java、还是微软的MSDN都允许将开发文档安装到本地,并且Java平台与MSDN都有教程与示例。但是,我使用的另一些软件,如jQuery,则无法下载文档。必须指出,与公开软件相似,多数公开文档质量很差,需要社区补充。再如,微软的Office软件以及很多游戏软件在中国只有网络版(Office 365),而网络版(云服务)严重侵犯个人与企业的隐私。

与技术交流相似,社交或博客向来有特定的圈子,因为真正的分享是有隐私的。商业数据也能透露敏感的个人信息,而中国是外国超市份额最大、同时又是超市会员卡使用最多的国家。很多互联网巨头的盈利可能来自数据采集,以及与之相关的数据分析技术的研发。中国作为“大数据”的提供者,完全牺牲了社区的隐私性与独立性,丧失了与世界竞争的可能性。这也意味者民众丧失了很好的工作机会(Steve Jobs的名字暗示)。我注意到中国科技大学的教室都在显著位置装有摄像头。

Weblog

不过,与公开的隐私侵犯相比,暗中的侵犯与操控更为可怕。例如,文本编辑器记录用户的一举一动并发给服务器用于分析,又如在网上看到的内容完全受控制、由用户ID决定。(无论在北京的图书馆或网吧上网都需要实名,而在美国的公共图书馆(大学图书馆也对外开放)使用电脑无须登录。)下面的漫画中提到的PICO文本编辑器是Linux下的早期(简易)文本编辑器,发音与peeker(偷窥者)或pickle(泡菜)相似。与即时通信软件相似,编辑器一开始就应由社区开发,且应便于自定义扩展。

Collectable UNIX Text Editor

几幅漫画都来自UserFriendly.org。User Friend曾经是用友软件公司的英文名,似乎暗示出卖自己与同伴讨好上级以求获取好处的性格(user也指“利用者”)。我认为由于无所不在的摄像头、网络等监控记录已足够保障安全,私人电脑应受保护不得被政府随意侵入。(美国有一个寻找外星人的SETI项目,由志愿者在自己的计算机上安装SETI@home屏幕保护程序,用于分析天文观测资料寻找外星人。)(美国影片《独立日》中反击外星人的多国部队唯独没有中国。)

我认为隐私问题应适用下述两条原则:

  1. 国家或者社区不得通过降低人权水准(包括侵犯隐私)取得竞争优势;
  2. 个人交往或商业来往(包括雇主与员工之间)应依靠信用,不得采取强迫手段确保(攫取)利益,其中包括暗中的监控。如正常工作环境下雇主不得用摄像头暗中监视员工的举动,摄像头记录仅在查案时使用;又如雇主不得收集员工的私人隐私,包括上网记录。

隐私问题的另一个极端例子,是个人或公司无权管理自己的数字资料。无论Windows还是Linux都会为用户创建“文档”、“音乐”、“视频”、“图片”等目录,用于保存管理个人拥有的数字资料。但是,多数用户不会(无力)购买收藏音乐CD或电影DVD,而是按照倾销价格在网上听歌或观看电影视频,因而自动出卖隐私。(这也是民众收入不足、国家滥用补贴,破坏商业秩序的例子。)用户只能使用固定的网上用户界面,而没有机会想象创新,如在朋友间分享或在数字杂志中嵌入一段电影视频。我也没有见到帮助建立家庭网络、在家庭内共享音乐视频的文档,以及好的音乐视频的管理工具(Windows Media Player是一款封闭的管理软件)。公司学校使用由他人开发的软件平台、数字资料不放在本地计算机上则更愚不可及。作自己的管理是很享受的工作,并且为不断尝试新技术带来机会。固定的操作流程破坏正当的享受、扼杀自主选择与创新、剥夺有价值的技术职位,它并不对用户友善,而仅对数据采集者与操控者友善。

软件的用户友善也反映在文档与书籍的质量上。而我们的技术文档与书籍的质量低劣,象是在有意捉弄考试,这是不可容忍的。缺少清晰文档的软件是不值得学习使用的。学习与创新的竞争不应由个人承担,而必须在集体(工作环境)之中,在相互交流中完成;公司必须提供充足的学习与研发机会(也是公司自己积累知识的机会)。文档与书籍必须由社区补充完善。O’Reilly出版的书籍一致的醒目易认的封面,象是强烈提醒中国的好的出版社应带头提高技术书籍质量。不仅如此,社区或组织应有权在圈内发行书刊、建立网站;社区有权选择自己的教材与教育方式。社区间的成果交流是自愿的。我在国家图书馆看到可以统一查阅全国各高校的本科生与研究生的毕业论文,这是严重的隐私侵犯。教育不能过度追求考试分数,学生应当在学校自行选择的多样的活动中展现自己的亮点,并且这些活动不仅成为大学申请的一部分,同时也帮助学生相互认识交往。

社会应当提升个体的尊严感与信用度,这既需要有良好的受尊重的教育,又必须有足够的收入。为了使社会正常运作,年轻人工作以后应当能经济自立,并且能较快地具备购房能力。增加的收入也为他人带来工作机会与经济繁荣。

深度学习是机器学习的一个子领域,它基于人工神经网络的研究,特别是利用多层次的神经网络来进行学习和模式识别。深度学习模型能够学习数据的高层次特征,这些特征对于图像和语音识别、自然语言处理、医学图像分析等应用至关重要。以下是深度学习的一些关键概念和组成部分: 1. **神经网络(Neural Networks)**:深度学习的基础是人工神经网络,它是由多个层组成的网络结构,包括输入层、隐藏层和输出层。每个层由多个神经元组成,神经元之间通过权重连接。 2. **前馈神经网络(Feedforward Neural Networks)**:这是最常见的神经网络类型,信息从输入层流向隐藏层,最终到达输出层。 3. **卷积神经网络(Convolutional Neural Networks, CNNs)**:这种网络特别适合处理具有网格结构的数据,如图像。它们使用卷积层来提取图像的特征。 4. **循环神经网络(Recurrent Neural Networks, RNNs)**:这种网络能够处理序列数据,如时间序列或自然语言,因为它们具有记忆功能,能够捕捉数据中的时间依赖性。 5. **长短期记忆网络(Long Short-Term Memory, LSTM)**:LSTM 是一种特殊的 RNN,它能够学习长期依赖关系,非常适合复杂的序列预测任务。 6. **生成对抗网络(Generative Adversarial Networks, GANs)**:由两个网络组成,一个生成器和一个判别器,它们相互竞争,生成器生成数据,判别器评估数据的真实性。 7. **深度学习框架**:如 TensorFlow、Keras、PyTorch 等,这些框架提供了构建、训练和部署深度学习模型的工具和库。 8. **激活函数(Activation Functions)**:如 ReLU、Sigmoid、Tanh 等,它们在神经网络中用于添加非线性,使得网络能够学习复杂的函数。 9. **损失函数(Loss Functions)**:用于评估模型的预测与真实值之间的差异,常见的损失函数包括均方误差(MSE)、交叉熵(Cross-Entropy)等。 10. **优化算法(Optimization Algorithms)**:如梯度下降(Gradient Descent)、随机梯度下降(SGD)、Adam 等,用于更新网络权重,以最小化损失函数。 11. **正则化(Regularization)**:技术如 Dropout、L1/L2 正则化等,用于防止模型过拟合。 12. **迁移学习(Transfer Learning)**:利用在一个任务上训练好的模型来提高另一个相关任务的性能。 深度学习在许多领域都取得了显著的成就,但它也面临着一些挑战,如对大量数据的依赖、模型的解释性差、计算资源消耗大等。研究人员正在不断探索新的方法来解决这些问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值