在python下,大家可能需要操作IE访问网站。也许有人要问了,我们有很多优秀的网站访问插件呀,比如之前提到的 mechanize
其实大家仔细看 mechanize 就知道了,它是不支持 js 操作的。虽然我们很多时候可以通过模拟 js 的业务逻辑来模拟。但是也有极端的情况下是无法做到的。比如,你需要向一个网站投递新闻,而同时需要输入验证码。而且这个新闻呢,也必须注意格式,也就是说投递者本人必须看到内容,同时可以做修改。那这样的情况,mechanize就无能为力了。
废话不多说,进入正题。让我来介绍今天的主角 PAMIE.
PAMIE使用 依赖于 win32com 这个组件。在此基础上操作IE. 附件中提供 win32com 及 PAMIE 供大家下载
简单的例子:
- import PAM30
- ie = PAM30.PAMIE()
- ie.navigate('www.google.com')
- ie.setTextBox('q','PAMIE')
- ie.clickButton('btnG')
但是我们实际使用中,实际上会碰到许多的控件。如,input ,radio ,checkbox.
下面针对不同控件给出函数列表, 大家看名字大概就应该明白是干什么的. 权当手册使用吧,呵呵 :
状态控制
实际应用中,需要考虑IE的状态,比如访问一个网页,随即进行操作,在网页未下载完成的情况下,容易出错
PAMIE 则考虑到下面的情况
- _wait() : 等待整个页面下载完成
- _frameWait() : 等待一个frame下载完成
- _docGetReadyState: 获取文档对象的状态
TextArea
- getTextArea (name): 获取一个textarea,可能使用 id,name 或者 index
- getTextAreaValue(name, attribute): 获取一个textarea的属性值
- getTextAreasValue() 获取所有textarea
- setTextArea(name): 给textarea赋值
- textAreaExists(name): 查看指定名称的textarea 是否存在
Input
- getTextBox(name):
- getTextBoxValue(name, attribute):
- getTextBoxes():
- getTextBoxesValue()
- setTextBox( name, value):
- getInputElements():
Button
- buttonExists(self, name): 检查一个button是否存在
- clickButton(self, name): 点击一个按钮, name 可以是 name,id,index甚至是value属性的值
- clickButtonImage(self, name): 同上,点击一个图片按钮
Radio
- getRadioButton(name):
- def getRadioButtonSelected(name):
- getRadioButtonValues(name):
- getRadioButtons():
CheckBox
- checkBoxExists(self, name): 检查一个单选框是否存在
ListBox
- getListBox(name):
- getListBoxItemCount(name):
- getListBoxOptions(name):
- getListBoxSelected(name):
- getListBoxValue(name, attribute):
- listBoxUnSelect(name, value):
- selectListBox(name, value):
Image
- getImage( name):
- getImageValue(name, attribute):
- getImages():
- getImagesValue( attribute):
- imageExists(name):
form
- formExists( name):
- getForm( name=None):
- getFormValue( name, attribute):
- getFormVisibleControlNames( name=None):
- getForms():
- getFormsValue( attribute):
a
- clickHiddenLink( name):
- getLink( name):
- getLinkValue( name, attribute):
- getLinks( filter=None):
table
- getTable( name):
- getTableData( name):
- getTableRowIndex( name, row):
- getTableText(tableName,rownum,cellnum, frameName=None):
- getTables( filter=None):
- tableCellExists( tableName, cellText):
- tableExists( name):
- tableRowExists( name, row):
div
- divExists( name):
- getDiv( name):
- getDivValue( name, attribute):
- getDivs():
- getDivsValue( attribute):
通用 Element
- clickElement( element): 点击一个节点。
- clickHiddenElement( element):
- findElement( tag, attributes, val, elementList=None):
- findElementByIndex( tag, indexNum, filter=None, elementList=None):
- findText( text):
- fireElementEvent( tag, controlName, eventName):
- textFinder(text):
- getElementChildren( element, all=True):
- getElementParent( element):
- getElementValue( element, attribute):
- getElementsList( tag, filter=None, elementList=None):
操作类函数:
用于控制IE的动作
- navigate( url):
- changeWindow( wintext): 转而控制另外一个窗体对象
- pause( string = "Click to Continue test"):
- goBack(self):
- findWindow( title, indexNum=1):
- closeWindow( title=None):
- refresh(self):
- resize( iWidth, iHeight):
- quit(self):
信息资源类:
获取当前IE的属性
- getIE(self):
- getPageText(self):
- locationURL(self):
- outerHTML(self):
- randomString( length):