自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 资源 (4)
  • 收藏
  • 关注

原创 第三期书生大模型实战营——基础岛

【书生·浦语大模型全链路开源开放体系】 https://www.bilibili.com/video/BV18142187g5/?视频里介绍了书生浦语大模型的开源开放体系,包括了其的技术发展、模型架构、开源生态等。其核心技术思路包括:- 模型能力飞轮:广泛使用模型参与自身迭代,加速能力提升;- 高质量合成数据:包括基于规则的数据构造、基于模型的数据扩充、基于反馈的数据生成。融合了多种数据合成方案,提升合成数据质量;

2024-08-09 14:17:10 391

原创 第三期书生大模型实战营——入门岛

1. Linux 基础知识创建开发机ssh链接服务器端口映射创建hello_world.py文件运行程序,访问网页2. Python基础知识任务1任务2设置断点,运行debug模式运行到断点处,查看函数中的变量运行到下一个断点处,可以看到此时txt中没有标点符号了3.Git基础知识fork项目仓库,提交自我介绍提交PR创建仓库

2024-08-08 23:36:36 209

原创 虚拟机配置spark

虚拟机配置spark

2022-09-16 22:47:46 2336

原创 A Semantic Framework for Data Analysis in Networked Systems语义笔记

《A Semantic Framework for Data Analysis in Networked Systems》的行为模型的第三节Behavior Model的3.3Syntax和3.4Semantic部分的阅读总结

2022-09-16 22:18:17 209

原创 SparkSQL的Join的实现方式

SparkSql笔记

2022-09-16 22:09:07 1405

原创 西工大软件学院专业课复习资料

具体见gitee仓库https://gitee.com/zhou-wenbo/NWPU-A?_from=gitee_search

2021-12-01 02:18:42 278

原创 2021-11-13 《网络与分布式》分布式系统通信 习题4.1

4.1在水平时间轴上表示阻塞发送/接收和非阻塞发送/接收进程与操作系统内核之间操作的时间关系。以下是我的理解,不一定对,仅供参考:

2021-11-13 10:24:02 716

原创 《Python源码剖析》笔记 11.4 函数参数的实现

在11.4中,作者做了一个输出na,nk,n的实验,由于我对c语言的不熟悉,导致了一个可笑的错误:红框里面是我一开始写的代码,下面的是查资料以后写的,看起来这两个都一样,但结果却是差的很多,都以为这个括号“()”,和python的格式化输出不一样,c语言的printf提供变量不需要加括号,输出如下:出现上下输出不一样的原因就是,printf会把括号里面的赋给一个%d,如果是括号,就会赋值括号里面最后一个元素,而后面的两个%d,因为没有变量赋值,导致出现了随机数。...

2021-08-11 09:20:48 108

原创 《Python源码剖析》笔记 10.2Python虚拟机中的for循环控制流

在原书中,作者只给出了修改源代码的运行结果,没有给出修改的代码,在网上搜索,基本上都是来自这个博客:https://www.cnblogs.com/beiluowuzheng/p/9496410.html但是,这个博客的作者的实现和原书中作者的现实效果有些不同,没有实现用654321来控制输出,这里给出我的代码:(ceval.c,星号注释部分是我添加的代码,版本为Python2.7.13)PyObject *PyEval_EvalFrameEx(PyFrameObject *f, int throwf

2021-07-23 14:23:07 187

原创 《Python源码剖析》笔记 9.3其他一般表达式

在9.3节的实验中,BINARY_ADD的修改没有给出源代码,这里给出我的源代码:星号注释里面是增加的代码首先在虚拟机主循环部分先声明我们需要的变量,因为C必须在开头声明变量,不然会报错 // 虚拟机主循环 for (;;) { /************************BINARY_ADD***************************/ PyObject* target = PySys_GetObject("stdout"); char temp[256]

2021-07-21 11:23:36 90

原创 《Python源码剖析》笔记 SmallPython

书中的代码没有给完整,而且有一些bug,可能是版本的不同,我的编译环境是VS2010。文件目录:SmallPython.cpp的代码:// SmallPython.cpp : 定义控制台应用程序的入口点。//#include "stdafx.h"#include <stdlib.h>#include <string>#include <map>#include <iostream>using namespace std;/

2021-07-17 11:49:38 96

原创 《Python源码剖析》笔记Hack PyDictObject(2)

在5.5节中,第二个实验中,我使用的是Python2.7.13,由于书中没有提供源代码,我尝试修改了几次,结果和书中差别很大,不知道怎么解决:static voiddict_dealloc(register PyDictObject *mp){ register PyDictEntry *ep; Py_ssize_t fill = mp->ma_fill; PyObject_GC_UnTrack(mp); Py_TRASHCAN_SAFE_BEGIN(mp)

2021-07-16 15:42:57 85

原创 《Python源码剖析》笔记Hack PyDictObject(1)

在5.5节中,第一个实验中,我使用的是Python2.7.13,和书中的一些类型的定义有些不同:/*****************Test Func*********************/// dictobject.c 自定义的函数static void ShowDictObject(PyDictObject* dictObject){ PyDictEntry* entry = dictObject->ma_table; int count = dictObject->ma

2021-07-16 14:58:08 83

原创 《Python源码剖析》笔记insertdict()

在第五章Python中的Dict对象中,5.3.3插入与删除的insertdict代码段,作者给出的注释有些问题:这里实际上是对应ep的几个状态,在python2.7中,加入了判断搜索失败的条件语句:ep = mp->ma_lookup(mp, key, hash); if (ep == NULL) { // 搜索失败,收回传入参数的引用计数 ...}而书中的几个状态对应如下:if (ep->me_value != NULL) { // active态

2021-07-16 11:25:37 209

原创 《Python源码剖析》笔记list_print()

目前学习到第三章PyListObject的内容,在最后一小节Hack PyListObject操作的时候,作者并没有给源代码,这里是我的修改。static intlist_print(PyListObject *op, FILE *fp, int flags){ int rc; Py_ssize_t i; PyObject *item; rc = Py_ReprEnter((PyObject*)op); if (rc != 0) { if (r

2021-04-05 20:59:09 1550 8

原创 《Python源码剖析》笔记ShowCharacter()

目前学习到第三章PyStringObject的内容,在最后一小节Hack PyStringObject操作的时候,作者并没有给源代码,或者说没有直接说明如何修改源代码,这里是我的一些探索。运行环境:window10vs2010python2.7.13,编译的是PC目录里面的VS9.0的项目这是原文中的描述:作者说是通过在string_ength中添加代码,而这个函数实际上是这样的:static Py_ssize_tstring_length(PyStringObject *a){

2021-04-04 15:36:20 1003 12

原创 《Python源码剖析》笔记int_repr()

在原书中,作者使用vs2003运行python2.5的项目,而现在配置这样的环境比较复杂,所以我尽量在配置环境上时间相差小一点,刚配置好,编译成功源文件,希望按照书上说的。修改int_repr()函数,结果变化有点大,弄了很久最后失败了,但把过程记录下来,以供以后考证。运行环境:window10vs2010python2.7.13,编译的是PC目录里面的VS9.0的项目先看看原书的写法:作者在源代码中修改了int_repr()这个函数,但是我在python2.7.13版中,没有找到这个函数,作

2021-03-24 20:43:22 795 6

原创 《Python源码剖析》笔记 int_print()

在原书中,作者使用vs2003运行python2.5的项目,而现在配置这样的环境比较复杂,所以我尽量在配置环境上时间相差小一点,刚配置好,编译成功源文件,希望按照书上说的,修改int_print()函数,结果变化有点大,弄了很久才成功。

2021-03-24 17:49:06 685 10

原创 《流畅的Python》读书笔记 键的次序取决于添加顺序

我在学习《流畅的Python》的时候,对第三章的3.9.3的4.键的次序取决于添加顺序这一部分始终无法理解,在网上寻找资料,大部分都是简单的摘抄,并不能回答我的疑惑。下面是我个人的理解,如果有不正确的地方,欢迎大佬指正: 根据示例3-17,作者想表达的是:虽然这三个字典的键的次序是乱的,但python仍然将他们视作相等的。所以我觉得可以这么理解这一部分: 键的次序取决于添加顺序,不会影响字典之间是否相等的判断。也就是说,这个部分其实想说明字典中键的次序对字典之间是否相等是没有影响的。

2021-02-25 18:29:30 214 1

原创 Matlab线性规划规范

matlab规定了线性规划的标准形式为:min cTx (求最大值用-c)s.t.{Ax≤b(不等式约束条件)(当出现>时,把对应行系数乘以负号即可)Aeqx=beq(等式约束条件)lb≤x≤ub(x上下界)s.t.\begin{cases}Ax \leq b (不等式约束条件)(当出现>时,把对应行系数乘以负号即可)\\Aeqx = beq (等式约束条件)\\lb \leq x \leq ub (x上下界)\end{cases}s.t.⎩⎪⎨⎪⎧​Ax≤b(不等式约束条件

2020-09-20 22:25:58 1020

原创 线性规划建模实战1

投资收益和风险1问题题出:市场上有n种资产si(i=1,2,L,n)可以选择,现用数额为M的相当大的资金作一个时期的投资。这n种资产在这一时期内购买si的平均收益率为ri,风险损失率为qi,投资越分散,总的风险越小,总体风险可用投资的si中最大的一个风险来度量。购买si时要付交易费,费率为pi,当购买额不超过给定值ui时,交易费按购买ui计算。另外,假定同期银行存款利率是r0,既无交易费又无风险(r0=5%)。已知n=4时相关数据如表1.1。表1.1 投资的相关数据siri(%)qi

2020-09-20 22:22:30 3707

原创 阿里云Linux学习笔记5

我在阿里云学习Linux,下面是我的笔记:umask权限:用来设置默认创建文件的权限umask权限+文件default权限=666(Linux默认新建文件最大权限是666,不是777,缺少x权限,但是可以人为改成777)(如果umask值是123,那么新建文件默认值就是543,但实际新建文件默认值为644)umask原理:umask值转换成二进制时,其中的0表示不关心对应文件default权限(110110110),其中是1则表示对应default权限为0。110 110 110 defau.

2020-09-14 18:14:41 133

原创 阿里云Linux学习笔记4

我在阿里云学习Linux,下面是我的学习笔记:cat > f1 会把每行输入的内容写入f1,称为单行重定向cat > f2 << ? 多行重定向(就地文本),?为任意字符(建议用EOF,end of file),当单独输入? 时,系统才会把之前写的所有内容重定向到f2多行重定向常用于创建文件管道:command1 | command2 把第一个命令的输出传给第二个命令,作为第二个命令的输入command1 | command2 | command3... 是可以这样连续.

2020-09-09 16:58:54 173

原创 阿里云Linux学习笔记3

我在阿里云学习Linux,下面是我的学习笔记:区不区分大小写和文件系统有关,和操作系统无关。标准的Linux文件系统(如ext4),对大小写敏感。文件有两个类型的数据:元数据 metadata (文件属性)数据 data (文件数据)文件名filename最多255字节touch filename 建立新文件filenameLinux文件类型:(不完全固定,可以根据后缀改变,)蓝色:目录 绿色:可执行文件红色:压缩文件浅蓝色:链接文件(快捷方式)灰色:其他文件普通文件d 目录.

2020-09-09 16:44:40 123

原创 阿里云Linux学习笔记2

我在阿里云学习Linux,下面是我的学习笔记:echo $LANG 查看系统使用的默认语音和编码表{}扩展,如:echo file{1,2,3}>file1 file2 file3echo file{1,2}.{txt,log}>file1.txt file1.log file2.txt file2.logecho file{1,2}{txt,log}>file1txt file1log file2txt file2logecho {1..4}>1 2 3 4e.

2020-09-07 00:21:51 153

原创 阿里云Linux学习笔记1

我在阿里云上面学习这个免费的Linux课程,以下是我的笔记:ifconifg 查看网络连接状态init 3 关掉图形界面切换到纯字符界面free -h 查看内存的使用量(当我们在用图形界面时,内存会被占用很多,用纯字符就会少很多占用量)init 5 切换到图形界面runlevel 查看运行模式startx 可以开启图形界面,和 init 5 相比,startx不需要登录,且startx不认为是模式切换,而被认为是开启了一个软件init 6 == reboot 重启init 0 , halt,

2020-09-07 00:13:43 279

原创 安装Scrapy时遇到timeout的错误该怎么办

今天学习到了使用Scrapy框架写网络爬虫,需要安装这个包,但是因为这个包太大了,很容易出现Timeout的错误导致pip安装失败,我看的教材里面建议使用Anaconda来安装这个包,但是因为我比较懒,不想安装Anaconda,所以在网上查了一些资料,成功用pip安装了Scrapy。首先,我们登上pypi官网,搜索Scrapy的说明,找到最新版本,可以看到这个包用pip安装的代码:pip install Scrapy3但是,直接这样安装也可能出现问题,因为这个包要求安装其他一系列的包,要求安装的一般

2020-08-31 22:58:39 974

原创 Excel筛选之后的复制粘贴小技巧

最近在做一个企业信息的汇总,涉及到十几个不同地区的表格的汇总,有几千家企业要复制粘贴,但是因为一些格式原因,我不能直接复制粘贴,经过各种搜索,我找到了几个比较好用的粘贴方法。首先,汇总这些表格肯定是要用到筛选,但是筛选完以后,再复制粘贴就会粘贴到隐藏格,就像下面这个情况一样:需要填写的原表格。这是要粘贴进去的筛选过后的表格。这是直接复制粘贴以后的产生的错误。...

2020-08-20 12:16:49 14650 1

原创 网络爬虫urllib.error.HTTPError: HTTP Error 403: Forbidden的问题方法

今天学习《Python网络爬虫权威指南》第三章的时候,在写爬取wiki网站的代码时遇到了问题:urllib.error.HTTPError: HTTP Error 403: Forbidden。通过在网上查阅资料,问题出在了我们直接urlopen提出访问申请是非正常的申请,缺少网站需要的信息,会被拒接访问:之所以出现上面的异常,是因为如果用 urllib.request.urlopen 方式打开一个URL,服务器端只会收到一个单纯的对于该页面访问的请求,但是服务器并不知道发送这个请求使用的浏览器,操作系

2020-08-16 00:12:48 12314

原创 BeautifulSoup的find_all()函数的attributes参数的小发现

我在学习《Python网络爬虫权威指南》的时候,学习到关于介绍find_all()函数的参数的内容,里面介绍到属性参数attributes时介绍了其中一种用法:.find_all('span', {'class':{'green', 'red'}})这个函数会返回HTML文档里面红色和绿色两种颜色的span标签。我就想试试不用大括号是否有同样的结果:原本代码...

2020-08-15 17:02:07 1238 1

原创 2020-8-11 leetcode刷题 Two Sum 两数之和

Two Sum 两数之和今天是我第一次写leetcode的题目,首先leetcode的代码格式就和普通的c++格式不同,它不需要加入头文件和main函数,只要把可运行的内容放到他给的类里面即可,对于初学者需要适应一段时间。这个题目很简单,暴力求解直接遍历相加即可,但是实际写的时候,我发现我不会求给定的数列的长度,后来查阅资料得知,可以通过下面的方法求出数组长度:int nums[], n;//给定了一个大小未知的数组n =sizeof(nums)/sizeof(nums[0]);//求出数组大小但

2020-08-11 17:41:13 143 1

Vmware的Centos7中的Spark虚拟机配置

在Vmware的Centos7中配置Spark的笔记吗,注意版本对照

2022-09-16

A Semantic Framework for Data Analysis in Networked Systems行为模型

A Semantic Framework for Data Analysis in Networked Systems论文的行为模型笔记

2022-09-16

《网络与分布式》书后题答案.rar

西北工业大学,软件学院,网络与分布式课后题部分答案,个人写的,有问题请在评论区指出

2021-11-14

西北工业大学概率论笔记.docx

西工大概率论复习笔记,个人整理的笔记,每年考试内容相差不大,最后的区间估计如果不会推,直接背表就行,多刷题考试很简单。

2021-06-17

计算机组成原理复习.docx

面向西工大,软件学院的机组复习整理,每年考点不同,根据需要查看,考试多考的是书上题目。

2021-06-17

PySide2实战项目——登录界面.rar

PySide2的实战项目,运行文件为是main.py,里面发行版.zip是使用pyinstaller打包的exe文件,直接运行exe文件即可(不要改动路径),第一次运行会比较慢,可以通过资源管理器看一下程序是否开始运行。

2021-02-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除