Python编程语言
爱做梦真是太好了
开发工程师(java c) 算法工程师
展开
-
sklearn的模型训练与预测
目录sklearn的模型训练与预测分类任务流程三步走xgboost算法分类随机森林算法分类sklearn的模型训练与预测sklearn是强大的python机器学习工具,支持丰富的机器学习算法和数据预处理,在学术界和企业中应用广泛,下面是sklearn的代码编写流程和各种算法使用示例(以分类为例)。分类任务流程三步走创建模型对象训练预测与性能评价xgboost算法分类''' *...原创 2020-03-26 10:30:51 · 3824 阅读 · 2 评论 -
立即清理python指定对象内存,让占用内存较大的程序正常运行
python有垃圾回收机制,使用程序计数器标记一个对象,如果一个对象没有任何引用指向它,则它的程序计数器标记是0,就会被自动进行垃圾回收。想要清理pca指向对象,可以使用下面代码即可。import gcdel pcagc.collect()先删除变量,再gc.collet()...原创 2019-11-23 11:43:03 · 2593 阅读 · 0 评论 -
动态规划题目及简要分析
动态规划题目及简要分析摘要在算法分析和实现中,动态规划是一种常见且重要的思想。掌握了该思想,会显著提高你的编程能力,几乎可以解决遇到的绝大多数问题。动态规划非常适合解决最大最小值、最多最少和最优等最值问题。动态规划常常与分治法放在一起比较,它们有许多共同点,放在一起比较可以更好地理解和掌握这两种方法。因此本文的主要内容有以下几点:动态规划思想简介动态规划与分治的对比动态规...原创 2018-08-23 15:14:34 · 168 阅读 · 0 评论 -
使用Python语言读写Excel数据demo
import openpyxlfrom openpyxl import load_workbook f = open(file='data/10886数据集/最原始数据/电子病历对应病历号from10886.txt', enco...原创 2019-04-13 16:55:23 · 732 阅读 · 0 评论 -
Python的正则表达式例子(demo)
正则表达式是程序员非常重要的知识,在编程语言中具有通用性。因此,掌握它是很有必要的。1. 以某个字符串开头的文本# 以“诊断计划”开头的文本列表。temp_list = re.findall('(诊疗计划.*?)', all_content)2. 以某个字符串结尾的文本# 以入院查体结尾的文本列表temp_list = re.findall('(.*?入院查体)', all...原创 2019-04-08 10:16:13 · 703 阅读 · 0 评论 -
Python排序例子(demo)
# path为某个路径下的所有文件名列表;通过sorted函数,可以将所有文件名按照文件名中的数字大小排序。path = os.listdir(root_path)path = sorted(path, key=lambda i: int(re.match(r'(\d+)', i).group()), reverse=False)二:对路径下的所有文件,按照文件大小排序import...原创 2019-04-08 10:30:09 · 353 阅读 · 0 评论 -
Python生成文档向量
1 相关技术 gensim包2 生成文档向量模型import gensimimport numpy as npfrom gensim.models.doc2vec import Doc2Vec, LabeledSentenceTaggededDocument = gensim.models.doc2vec.TaggedDocumentdef get_corpus...原创 2019-05-16 22:35:05 · 1734 阅读 · 6 评论 -
Python编码规范及技巧
1 循环里面不要使用+或者+=这类的符号避免在循环中用+和+=操作符来累加字符串. 由于字符串是不可变的, 这样做会创建不必要的临时对象, 并且导致二次方而不是线性的运行时间. 作为替代方案, 你可以将每个子串加入列表, 然后在循环结束后用 .join 连接列表. (也可以将每个子串写入一个 cStringIO.StringIO 缓存中.)正例: items = ['<table&...原创 2019-07-06 11:55:57 · 122 阅读 · 0 评论 -
scikit-learn下k-Nearest Neighbors、Linear SVM、RBF SVM、决策树、随机森林、Adaboost、Naive bayes、LDA、QDA算法示例代码(dem)
scikit-learn版本:0.21.3scikit-learn对机器学习相关的算法API支持很好,这里是简单的示例代码,可以为我们提高参考。代码如下:import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapfrom sklearn.model_selec...原创 2019-09-02 17:39:50 · 441 阅读 · 0 评论 -
python脚本:自动启动windows软件
先安装win32apipip install pypiwin32然后运行这个脚本import win32api# 打开pycharmwin32api.ShellExecute(0, 'open', r'D:\PyCharm Community Edition 2019.2\bin\pycharm64.exe', '', '', 1)...原创 2019-09-26 17:33:03 · 839 阅读 · 0 评论 -
Tensorflow学习笔记1
目录 摘要Tensorflow基本概念摘要Tensorflow是一种通过计算图构建神经网络、深度学习等模型,并用于实现相关任务的的工具。它主要由python语言实现,内部计算用C++实现,所以它的特点为:简单、高效、稳定。通过使用tensorflow不仅可以实现我们常见的深度学习任务,而且让我们从复杂的实现细节中解放出来,更加关注我们的任务本身,从而节省了宝贵的时间。本文主要是...原创 2018-08-27 10:30:30 · 250 阅读 · 0 评论 -
保留文本文件中指定字符串前面的所有文本(Python)
class ObstetricsText: @staticmethod def __removeAfterI__(key_text, read_path, save_path): """ # remove text after key_text, including key_text. :return: """ ...原创 2018-05-01 22:32:23 · 2359 阅读 · 0 评论 -
python脚本,完成mulan项目的输入文件生成
这个脚本是我要完成特定任务而写的,可以提高我的科研效率,如果你是python语言的爱好者,或者是多标签分类的研究生,获取会有一点启示。但说实话,这个任务太具体,不具有普遍性,如果没有具体的正确格式文件,甚至很难跑通,所以不要抱有太大的希望,如果只是感兴趣,倒是还行,我的目的仅是为我以后的查阅而已。代码如下#! /usr/bin/python# coding=utf-8# 此脚本的功能是:将ide原创 2017-11-13 09:35:55 · 722 阅读 · 0 评论 -
震惊!Python竟然是这样的修改全局变量
Python变量问题Python函数内部修改函数外部的变量 我比较熟悉Java,所以今天在修改一个函数外部的一个变量时调试了好久,原来是这样修改一个外部变量。 x = 20 func(): global x x = 100 print(str(x))打印结果为 100原创 2017-11-06 16:47:47 · 21571 阅读 · 15 评论 -
爬取百度百科上有关妇产科的语料
我写了一个Python程序,爬取了百度百科上有关妇产科的语料,把它放在了python文件同级目录 “data/产科语料.txt”, 所以要想跑通这个程序,一定要把data文件夹建立上,不然会报找不到文件错误。我的实验环境是 python 3.5 ,第三方包:BeautifulSoup(解析html的包,可以通过相应pip命令下载获得),本程序与操作系统无关。程序目录如下图:程序如下:#! /原创 2017-11-06 22:13:59 · 439 阅读 · 0 评论 -
python学习笔记
IDEPython的集成开发环境很多,比较好的是Spyder、Ipython、Pycharm、Eclipse等,都挺好。Python(x,y)与Spyder的区别:前者是一个启动台,用它可以启动spyder,所以前者大于后者。后者是一个IDE,非常好用,因为和Matlab界面相似。前者将很多python很多包都下载好了(像numpy、scipy等),所以省去的包下载不匹配的问题。但有一个缺点,似乎不原创 2017-12-02 21:08:06 · 225 阅读 · 0 评论 -
回归问题实战一
数据集每条数据的预测值只有一个,属于连续值。 数据为数值类型。实现代码import pandas as pdfrom keras.layers import Dense, Activationfrom keras.models import Sequential# 加载数据data_train = pd.read_csv("dat/d_train_20180102.cs原创 2018-01-29 14:52:53 · 450 阅读 · 0 评论 -
Python数据结构与Java数据结构的对照关系
元组(()) –> 数组(Array) 列表 ([])–> 列表(List) 字典({})–> 映射(Map) 集合(set())–> 集合(Set)原创 2018-04-02 13:42:57 · 990 阅读 · 2 评论 -
Python版本的tensorflow所遇到的问题
问题一:安装所遇到的问题 环境:windows 10 64位、Python36 主要问题在于Python与tensorflow不一致,应该保证它们都是64位的。还有就是命令要正确 cpu版的命令是:pip3 install --upgrade tensorflow如果不行的话,就看英文官方文档8,不容易出错。 注意:tensorflow在windows上不支持3...原创 2018-04-12 08:46:42 · 5579 阅读 · 0 评论 -
罗马数字转化为数值类型
罗马数字都有对应的数值标识,如:VII标识7。 问题描述:给定一个罗马数字,将其转换成整数。返回的结果要求在 1 到 3999 的范围内。算法核心思想: 1、相同的数字连写,所表示的数等于这些数字相加得到的数,如:Ⅲ = 3; 2、小的数字在大的数字的右边,所表示的数等于这些数字相加得到的数, 如:Ⅷ = 8;Ⅻ = 12; 3、小的数字,(限于Ⅰ、X 和C)在大的数字的左边,所表示的...原创 2018-04-05 13:41:07 · 408 阅读 · 0 评论 -
小算法实现
1. 我的日程安排算法实现问题描述:实现存储日程事件的 MyCalendar类。如果没有重复或者交叉事件,则添加该事件到MyCalendar类实例中。你的类拥有book(int start, int end)方法. 形式上, 间隔范围为[start, end) 。 重复或者交叉事件为start、end在某个间隔中间,注意:start、end可以等于间隔的后端值。添加成功,book方法...原创 2018-04-05 22:28:00 · 252 阅读 · 0 评论 -
!!只保留文本中的中英文和符号.,其余都删除
只保留文本中的中英文和符号.,其余都删除 想要只保留文本中的中英文和符号.,其余都删除吗?下面这个程序可以帮您。它简洁、高效,用python实现,只要把正则表达式换成你想要的就可以了。(python3实现) 代码实现:import remy_file_path = 'data/百度百科语料.txt'save_file_path = 'data/百度百科语料_去除符号.txt'# 打开文件原创 2017-11-10 13:55:10 · 15544 阅读 · 9 评论