- 博客(13)
- 资源 (1)
- 收藏
- 关注
原创 Python爬虫学习-正则表达式
一直感觉正则表达式挺难得,今日学习果然不同凡响,是真的难理解,不过重要的是学习一些简单提取数据的元字符就够用了,常用的什么身份证,Email,手机号码正则表达式都不用我们自己下手写,其实都可以Copy;都有很多的在线正则表达式测试,比如菜鸟教程里面,OSCHINA里面的在线工具等;都可以很好的帮助我们去写一些测试,多理解多动手敲一下就OK了~最最主要的就是爬虫中对于网页标签内容和标签属性的抓取,就需要咱们的惰性匹配,一定要去理解和实践一些。下面就是我学习的聚焦爬虫过程中数据解析的第一类:正则
2022-03-28 15:27:18
813
原创 Python字典练习题
初始字典如下:dic = {"k1": "v1", "k2": "v2", "k3": "v3"}完成以下练习题目#?遍历字典 dic 中所有的keyfor ele in dic.keys(): print(ele)#?b.遍历字典 dic 中所有的valuefor ele in dic.values(): print(ele)#?c.循环遍历字典 dic 中所有的key和valuefor k,v in dic.items(): print(k,v)
2022-03-24 23:27:14
13040
原创 爬取食品药监局首页企业详情数据(二)
今天的主要学习内容就是修改第一次的爬虫代码。第一次爬取是获得首页全部的企业信息数据,那么这次就是要获得全部的企业信息数据;第一步,要得到每一家企业的ID,通过访问URL地址,获得每一家企业的ID,存放在列表里面;URL ='http://scxk.nmpa.gov.cn:81/xk/itownet/portalAction.do?method=getXkzsList'第二步,遍历存放企业ID的列表,访问企业详情页URL地址,获得每一家企业详细信息,最后存放在JSON文件中。req_u
2022-03-24 23:21:53
598
原创 爬取食品药监局首页企业详情数据(一)
学习Python爬虫的第二题,今天这个比较有难度,因为首页和企业详情页的数据都是动态加载的,要使用抓包工具去观察,找到一定的规律,写了很多注释和代码。值得开心的是,成功爬取到了数据。对于抓包工具的使用上要更加熟练,合理使用它,就可以快速定位我们对于这个网页数据抓取的理解。并且编码过程不要着急,要顺一下这个思路,写好注释,方便我们回头复习。是我写的代码啦,如果有不太理解的地方,私信我,看到会回复呢~
2022-03-24 23:19:10
485
1
原创 Python爬虫学习
小白一枚,想要入行Python数据分析~已经毕业两年了,定居西安,大学专业软件工程,当时毕业没去互联网公司上班,选择了少儿编程行业,如今的教育行业不是很理想哇,挺迷茫的~现在就想重新入行程序员,可能会掉头发,哈哈哈,但是我好像头发还挺更多,掉就掉吧~看了很多关于Python数据分析师岗位的招聘,基本要求都是Excel,Mysql,Python,PPT,BI工具,分析方法啥的,这些我基本上都会一些些,现在就是缺乏系统的学习路线;最近关注了一个UP主@戴戴戴师兄,提供了一个我认为比较有参考...
2022-03-24 23:16:50
1741
转载 unity 学习
动画控制器 Animator Controller : 动画控制器在工程右键,找到,之后把这个控制器可以拖入给Aniamtor组件 双击这个控制器添加动画状态添加动画有两种方式 第一种在BaseLayer右键创建新的状态,然后自己在检视面板里改名字,添加手动拖入对应的状态 第二种是直接拖入动画到BaseLayer,unity会根据动画自己创建一个。 创建状态转换点击状...
2018-10-29 16:26:49
408
原创 死锁以及避免死锁
线程死锁是指两个或者多个线程互相持有对方所需要的资源,导致这些线程处于等待状态,无法前往执行。当线程进入对象的synchronized代码块时,便占有了资源,直到它退出该代码块或者调用wait方法,才释放资源,再次期间,其他线程不能进入该代码块。当线程互相持有对方所需要的资源,会互相等待对方释放资源,如果线程都不主动释放所占有的资源,就会产生死锁。 产生死锁的四个条件: 互斥条件:进程...
2018-10-13 12:49:36
133
原创 多线程编程的注意点
明确目的,为什么要使用多线程,如果是由于单线程读写或网络访问(例如HTTP访问互联网)的瓶颈,可以考虑使用线程池,如果是对不同的资源(比如SOCKET连接)进行管理,可以考虑多个线程。 线程使用中要注意,如何控制线程的调度和堵塞,例如利用事件的触发来控制线程的调度和堵塞,也有用消息来控制的 线程中如果用到公共资源,一定要考虑公共资源的线程安全性。一般用LOCK锁机机制来控制线程安全性,一定要保...
2018-10-13 12:34:40
1464
原创 线程和进程的区别
进程-----资源分配的最小单位,线程-----程序执行的最小单位进程是操作系统资源分配的基本单位,而线程是任务调度和执行的基本单位两者之间的区别体现在以下方面: 因为进程拥有独立的堆栈空间和数据段,所以每当启动一个新的进程必须给分配给它独立的地址空间,建立众多的数据表来维护它的代码段,堆栈段和数据段,这对多进程来说十分“奢侈”,系统相对来说开销就比较大,而线程不一样,线程具有独立的堆...
2018-10-13 10:42:01
116
原创 TCP和UDP区别小结以及步骤
TCP与UDP区别总结:1、TCP面向连接(如打电话要先拨号建立连接);UDP是无连接的,即发送数据之前不需要建立连接2、TCP提供可靠的服务。也就是说,通过TCP连接传送的数据,无差错,不丢失,不重复,且按序到达;UDP尽最大努力交付,即不保证可靠交付3、TCP面向字节流,实际上是TCP把数据看成一连串无结构的字节流;UDP是面向报文的UDP没有拥塞控制,因此网络出现拥塞不会使...
2018-10-13 10:14:50
146
原创 vector删除指定元素
C++ vector中实际删除元素使用的是容器vecrot中std::vector::erase()方法。C++ 中std::remove()并不删除元素,因为容器的size()没有变化,只是元素的替换。1.std::vector::erase() 函数原型:iterator erase (iterator position); //删除指定元素 iterator ...
2018-10-11 16:43:49
23572
原创 NGUI和UGUI的区别
NGUI和UGUI的区别: UGUI的canvas有世界坐标和屏幕坐标 UGUI的image可以使用material UGUI通过mask来裁剪,而NGUI通过panel的clip NGUI的渲染前后顺序是通过widget的depth,而UGUI渲染顺序根据hierarchy的顺序,越下面渲染在顶层 UGUI不需要绑定Colliders,UI可以自动拦截事件 UGUI的anchor是...
2018-10-10 10:31:40
422
原创 牛客网错题小结1
判断char 型变量c1是否为小写字母的正确表达式 (c1>='a')&&(c1<='z')new 运算符 可以用来动态创建对象和对象数组,使用它创建的对象和对象数组可以使用运算符delete删除,使用它创建对象要调用构造函数,可以不指定初始值 逗号表达式是一组由逗号分隔的表达式,这些表达式是从左向右计算。逗号表达式的结果是其最后边表达式的值,如果最后边的...
2018-09-16 02:52:03
202
unity3D 菜单
2017-09-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人