- 博客(12)
- 收藏
- 关注
原创 TypeError: object is not callable
If you want to define classes that are callable that’s of course fine but you need to define the call protocol method:class MyModelingFunction(object):…def __call__(self, *args, **kwargs): """d...
2018-09-30 11:21:12 1243
原创 如何获取user = 'admin'中的
#从第五个"开始做切片print(‘593f\t"cn.er"\t"3$8ER8CXQeTBk"\t"成都信安电子有限公司"’.split(’"’)[5])print(type(“user = ‘admin’”.split("’")[1]))print(“user = ‘admin’”.split("’")[1])...
2018-09-29 14:54:23 416
原创 gou(1):第一次页面爬取遇到的一些简单问题
错误1:我把item = TyunItem()写在了for循环外面,导致存入数据库中的内容一直一样。def parse(self, response): li_list = response.xpath('/html/body/section/div[2]/div[2]/table/tbody/tr') # return for li in li_list: ...
2018-09-29 11:32:07 337
原创 从列表中取出字符串并保存在csv中
import csvimport jsonwith open('A.csv','rt',encoding="utf-8") as csvfile: reader = csv.DictReader(csvfile) column = [row['symptom_list'] for row in reader] #["肢端缺血"] # print(column)f ...
2018-09-17 16:07:40 1486
原创 爬取得文本内容中一般需要替换的字符
replace(‘”’, ‘“’) replace(“’”,’\”’) replace(“\r\n”, “”) replace(“xa0xa0”,” ” ) replace(“xa0”,” “)去掉内容中的“”replace(‘”’, ‘\”’) #将内容中双引号替换成\” replace(“’”, ‘”’) #再将我们key中的单引号替换成双引号...
2018-09-17 15:06:15 483
原创 百度Unit编辑对话意图
1.答复:用于BOT做出固定答复的情况2.引导至对话意图:用于进一步获取终端用户意图,引导至相应的对话意图,给用户更精准的答复3.引导至问答意图:用于进一步获取终端用户意图,引导至相应的问答意图,通过问答方式给用户更精准的答复设置回应方式: 当会话过程中包含“没有了”,”完了”等词时,触发答复。当会话过程中不包括“没有了”,“完了”等词时,会一直问“请问您还有哪些症状?”...
2018-09-17 10:53:10 696
原创 百度Unit学习笔记
面向任务的理解与交互能力。1.对话意图列如:换到中央台 对话意图就是“换台”2.问答意图用于圈定某一个范围或主题的问答对3.词槽是满足用户对话意图时的关键信息或者限定条件,可以理解为用户需要提供的筛选条件。列如查天气时,词槽就是地点和时间。 例如:“换到中央台”,中央台就是一个“电视台词槽”,它会一定程度上影响系统对“换台”这个对话意图的执行。4.词...
2018-09-16 10:45:32 578
原创 当content中有双引号时如何替换
replace('"', '\"') #将内容中双引号替换成\"replace("'", '"') #再将我们key中的单引号替换成双引号
2018-09-09 22:35:08 643
原创 mitmproxy的安装及环境搭建
不得不承认,环境搭建看似简单,但有时如果一步没有弄好,确实会浪费很多的时间。我的问题主要是安装完mitmproxy后,在iOS端一直无法安装证书,百度了各种办法,就是没有解决。最后还是强大的谷歌帮我找到解决方案。特此特地写一个教程,记录一下这个简单而又恼人的问题的解决方式。 1.安装mitmproxy. GitHub:https://github.com/mitmproxy/mitmproxy...
2018-09-09 21:25:09 13955 3
原创 抓包工具 Charles Response Contents中文乱码解决方法
打开Charles,上方菜单栏 —-》Proxy —-》SSL Proxy Settings —-》Add,如图: Host:填*表示所有网站都抓 Port:443 点击OK,就不再乱码了。O(∩_∩)O哈哈~
2018-09-07 15:20:59 3248 1
原创 Json_to_csv
有时我们获取到了数据的Json格式,但现在需要将其转换为csv格式,该怎么快速取出我们想要的内容呢?import json, csv, sysimport pandas as pdfrom pprint import pprintimport codecsdef print_col_to_csv(d): #去掉csv中空行 f = open('ym.csv...
2018-09-07 11:01:34 574
原创 update the database content
2万多条数据已经爬去完毕,发现格式不正确,该怎么办?爬取的结果如下:[{“title”: “工艺:”, “content”: [“油爆”]}, {“title”: “口味:”, “content”: [“咸鲜味”]}, {“title”: “菜系:”, “content”: [“福建菜”]}, {“title”: “功效:”, “content”: [“福建菜”, “通乳调理”, “气血双...
2018-09-03 14:32:27 282
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人