天猫淘宝商品原数据API返回格式|字段解析|测试流程

taobao.item_get_app 获得淘宝app商品详情原数据

API功能:通过商品id获取淘宝的商品详情页原数据,天猫商品也可以拿到。

请求参数

请求参数:num_iid=520813250866

参数说明:num_iid:淘宝商品ID

响应示例(部分)

item: {
brandValueId: "1927269016",
businessId: "default",
cartUrl: "https://h5.m.taobao.com/awp/base/cart.htm",
categoryId: "50012453",
commentCount: "0",
countMultiple: [ ],
exParams: [ ],
favcount: "171224",
h5ItemUrl: "https://new.m.taobao.com/detail.htm?id=678264636662&hybrid=true",
h5moduleDescUrl: "//mdetail.tmall.com/templates/pages/itemDesc?id=678264636662",
images: [
"//img.alicdn.com/imgextra/i3/3691886865/O1CN01CJeRJZ20aE18bUJCu_!!3691886865.jpg"
],
itemId: "678264636662",
moduleDescParams: {
f: "desc/icoss3493626717ab12aff0f7bb2462",
id: "678264636662"
},
moduleDescUrl: "//hws.m.taobao.com/d/modulet/v5/WItemMouldDesc.do?id=678264636662&f=icoss3493626717ab12aff0f7bb2462",
openDecoration: "false",
pcADescUrl: "//market.m.taobao.com/app/detail-project/desc/index.html?id=678264636662&descVersion=7.0&type=1&f=icoss!0678264636662!13367810860&sellerType=B",
rootCategoryId: "50014812",
skuText: "请选择颜色分类 ",
subtitle: "德国奥拉氟 科学分龄防蛀 温和不辣口",
taobaoDescUrl: "https://market.m.taobao.com/app/detail-project/desc/index.html?id=678264636662&descVersion=7.0&type=0&f=desc/icoss3493626717ab12aff0f7bb2462&sellerType=B",
taobaoPcDescUrl: "https://market.m.taobao.com/app/detail-project/desc/index.html?id=678264636662&descVersion=6.0&type=1&f=icoss!0678264636662!13367810860&sellerType=B",
title: "兔头妈妈高纯奥拉氟儿...",
tmallDescUrl: "//mdetail.tmall.com/templates/pages/desc?id=678264636662"
},

specification: [
{
pname: "颜色分类",
pid: "1627207",
values: [
{
sku_url: "http://img.alicdn.com/imgextra/i2/3691886865/O1CN01xDgMBi20aE16XHVSL_!!3691886865.jpg",
vname: "【高纯奥拉氟】1-3岁50g*2支(蜜桃+草莓)+10g*2",
vid: "36174313878"
},
{
sku_url: "http://img.alicdn.com/imgextra/i3/3691886865/O1CN010aAntH20aE175XJIV_!!3691886865.jpg",
vname: "【高纯奥拉氟】3-12岁50g*2支(蜜桃+草莓)+10g*2",
vid: "36174313879"
},
{
sku_url: "http://img.alicdn.com/imgextra/i2/3691886865/O1CN01HABHIh20aE163N2zj_!!3691886865.jpg",
vname: "【高纯奥拉氟】13岁50g*2支(蜜桃*2)+10g*2",
vid: "36174313880"
},
{
sku_url: "http://img.alicdn.com/imgextra/i1/3691886865/O1CN01tZ2jep20aE18ZjLye_!!3691886865.jpg",
vname: "【高纯奥拉氟】3-12岁50g*4支(蜜桃*2+草莓*2)+10g*2",
vid: "36174313881"
},
{
sku_url: "http://img.alicdn.com/imgextra/i3/3691886865/O1CN019FaGeE20aDyadWKvo_!!3691886865.png",
vname: "[经典奥拉氟]1-3岁50g*2支(蜜桃+草莓)",
vid: "36174313883"
},
{
sku_url: "http://img.alicdn.com/imgextra/i2/3691886865/O1CN01zBRTSq20aDsVJg8XD_!!3691886865.jpg",
vname: "[经典奥拉氟]3-12岁50g*2支(蜜桃+草莓)",
vid: "36174313882"
},
{
sku_url: "http://img.alicdn.com/imgextra/i4/3691886865/O1CN01fUvGVi20aE0O2CfyU_!!3691886865.jpg",
vname: "[3支新口味]儿童防蛀牙膏35g*3(橘子汽水+多肉蜜瓜+爆汁葡萄)",
vid: "36184330639"
},
{
sku_url: "http://img.alicdn.com/imgextra/i2/3691886865/O1CN01BToo1s20aDqfRUIxU_!!3691886865.jpg",
vname: "[经典奥拉氟]3-12岁50g(蜜桃)",
vid: "36174313884"
},
{
sku_url: "http://img.alicdn.com/imgextra/i4/3691886865/O1CN01nrhGJh20aDqjwDSMK_!!3691886865.jpg",
vname: "[经典奥拉氟]3-12岁50g(草莓)",
vid: "36174313885"
}
]
}
],

 

字段解析 

Version: Date:2022-04-04

名称类型必须示例值描述

item

item[]1宝贝详情数据

num_iid

Bigint1520813250866宝贝ID

title

String1三刃木折叠刀过安检创意迷你钥匙扣钥匙刀军刀随身多功能小刀包邮宝贝标题

desc_short

String0商品简介

promotion_price

Int0优惠价

price

Float125.8价格(当商品价格为0时,当前值为-1),价格来自于未登入的划线价格,会有个别商品价格无法与页面匹配

total_price

Float00

suggestive_price

Float00

orginal_price

String025.80原价

nick

String0欢乐购客栈掌柜昵称

num

Int03836库存(没有精确,是模糊值)

min_num

Int00最小购买数

detail_url

String0http://item.taobao.com/item.htm?id=520813250866宝贝链接

pic_url

String1//gd2.alicdn.com/imgextra/i4/2596264565/TB2p30elFXXXXXQXpXXXXXXXXXX_!!2596264565.jpg宝贝图片

brand

String0三刃木品牌名称

brandId

Int08879363品牌ID

rootCatId

Int050013886顶级分类ID

cid

Int150014822

crumbs

Mix0[]导航菜单

created_time

String0

modified_time

String0

delist_time

String0

desc

String0商品详情

desc_img

Mix0[]商品详情图片

item_imgs

Mix0item_imgs[]商品图片

item_weight

String0

item_size

String0

location

String0发货地

express_fee

Float00.00快递费用

ems_fee

Float0EMS费用

post_fee

Float0物流费用

shipping_to

String0发货至

has_discount

Boolean0false是否有优惠

video

video[]0商品视频

is_virtual

String0

is_promotion

Boolean0false是否促销

props_name

String01627207:1347647754:颜色分类:长方形带开瓶器+送工具刀卡+链子;1627207:1347647753:颜色分类:椭圆形带开瓶器+送工具刀卡+链子;商品属性名。格式为pid1:vid1:name1:value1;pid1:vid2:name2:value2。

prop_imgs

prop_imgs[]0商品属性图片列表

property_alias

String020509:9974422:36;1627207:28326:红色;20509:9975710:38;1627207:28326:红色;20509:9981357:40;1627207:28326:红色销售属性值别名。格式为pid1:vid1:alias1;pid1:vid2:alia2。

props

Mix0[{ "name": "产地","value": "中国" }]商品属性

total_sold

Int0

skus

skus[]0商品规格信息列表

seller_id

Int02844096782卖家ID

sales

Int0138销量

shop_id

Int0151372205店铺ID

props_list

Mix0{20509:9974422: 尺码:36}商品属性

seller_info

seller_info[]1卖家信息

tmall

Boolean0false是否天猫

error

String0错误信息

warning

String0警告信息

url_log

Mix0[]

favcount

Int00

fanscount

Int00

method

String0item_tmall:pget_item

promo_type

String0

props_img

Mix01627207:28326": "//img.alicdn.com/imgextra/i2/2844096782/O1CN01VrjpXt1zyCc9DvERE_!!2844096782.jpg属性图片

shop_item

Mix0[]

relate_items

Mix0[]

测试步骤 

1、注册测试账号获取key和密钥

2、查看API文档请求示例

3、进入API测试页或者自行测试

### 如何使用Python爬虫抓取淘宝天猫商品评论数据 要实现从淘宝天猫平台上抓取商品评论数据的任务,可以参考现有的技术方案和工具。以下是详细的说明: #### 技术背景 网络爬虫是一种自动化程序,用于从互联网上收集特定的数据。对于像淘宝天猫这样的电商平台,其网页结构复杂且可能包含动态加载的内容。因此,构建一个高效的爬虫需要考虑以下几个方面: - **HTTP请求**:通过`requests`库发送GET/POST请求获取目标页面的HTML内容。 - **解析HTML**:利用`BeautifulSoup`或`lxml`等工具解析HTML文档,提取所需的信息。 - **处理JavaScript渲染**:由于许多现代网站依赖于JavaScript动态生成内容,传统的基于静态HTML的爬虫无法有效工作。此时可采用`selenium`或其他浏览器自动化工具模拟真实用户的操作。 #### 方法描述 一种常见的做法是从指定的商品详情页开始,逐步深入到各个分页下的用户评价区域。下面给出具体实现思路及相关代码片段: 1. **安装必要的库** 确保已安装所需的第三方模块,例如 `requests`, `re`, 和 `pandas`. 如果计划使用Selenium,则还需额外配置 WebDriver. 2. **设置初始参数** 定义URL模板、headers头信息以及其他任何自定义选项以伪装成合法访问者减少被封禁风险[^1]. 3. **发起请求并接收响应** 利用循环遍历不同页数链接地址,并调用相应函数下载每一页对应的数据流[^4]. 4. **分析返回结果** 应用正则表达式或者XPath/CSS Selector定位感兴趣字段位置,比如用户名、评分星级及时机反馈文字等内容项[^2]. 5. **保存成果至本地文件** 创建DataFrame对象容纳整理后的表格型资料最后导出CSV格式便于后续统计分析用途[^3]. ```python import requests from bs4 import BeautifulSoup as soup import pandas as pd import time from selenium import webdriver def get_page(url): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)' ' AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89 Safari/537.36' } response = requests.get(url=url, headers=headers) if response.status_code == 200: return response.text else: raise Exception('Failed to load page {}'.format(response.url)) def parse_html(html_content): parsed_data = [] sp = soup(html_content,'html.parser') comments_section = sp.find_all("div", {"class": "comment"}) for comment in comments_section: user_name = comment.select_one('.username').text.strip() rating_star = int(comment.select_one('.rating')['value']) review_text = comment.select_one('.review-text').get_text(separator=" ").strip() entry = {'Username':user_name, 'Rating Stars':rating_star , 'Review Text' :review_text} parsed_data.append(entry) df = pd.DataFrame(parsed_data) return df if __name__=='__main__': base_url='https://example.tmall.com/reviews?page={}' all_reviews_df=pd.DataFrame(columns=['Username','Rating Stars', 'Review Text']) driver=webdriver.Chrome(executable_path='/path/to/chromedriver') try: for i in range(1, max_pages+1): current_url =base_url.format(i) # Use Selenium when JavaScript is involved driver.get(current_url) time.sleep(random.uniform(2,5)) raw_html =driver.page_source temp_df =parse_html(raw_html ) all_reviews_df=all_reviews_df.append(temp_df , ignore_index=True ) output_file ='tmall_product_comments.csv' all_reviews_df.to_csv(output_file,index=False) print(f"All reviews saved into {output_file}.") finally: driver.quit() ``` 上述脚本展示了如何结合Requests与Selenium两种方式分别应对简单场景及需执行JS的情况;同时也体现了将最终采集所得存入Pandas DataFrame再转储为标准CSV形式的过程[^5]。 #### 注意事项 尽管技术可行性强,但在实际部署前务必审慎评估法律合规性和道德责任。未经授权的大规模复制他人站点资源不仅违反服务条款还可能导致法律责任追究。始终优先寻求官方API接口作为首选解决方案。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值