爬虫入门，百度翻译 response 出错

zooo · 发表于 2016-3-6 23:59:28

本帖最后由 zooo 于 2016-3-7 00:12 编辑

模仿鱼哥的程序写的，翻译的结果是在 v2transapi 中可以找到，按照下图填的字典，然而返回的html是一大串例句之类的无关东西，正确的翻译结果没有显示

我的程序：

import urllib.request
import urllib.parse
import json
content = input("请输入需要翻译的内容：")
url = 'http://fanyi.baidu.com/v2transapi'
data = {'from':'en',
'to':'zh',
'query':content,
'transtype':'trans',
'simple_means_flag':'3'}
data = urllib.parse.urlencode(data).encode('utf-8')
response = urllib.request.urlopen(url, data)
html = response.read().decode('utf-8')
print(len(html))
print(html)
#target = json.loads(html)
#print("翻译结果：%s" % (target['translateResult'][0][0]['tgt']))

复制代码

鱼哥的程序：

import urllib.request
import urllib.parse
import json
while True:
content = input("请输入需要翻译的内容：")
url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=http://www.youdao.com/"
data = {}
data['type'] = 'AUTO'
data['i'] = content
data['doctype'] = 'json'
data['xmlVersion'] = '1.6'
data['keyfrom'] = 'fanyi.web'
data['ue'] = 'UTF-8'
data['typoResult'] = 'true'
data = urllib.parse.urlencode(data).encode('utf-8')
response = urllib.request.urlopen(url, data)
html = response.read().decode('utf-8')
target = json.loads(html)
print("翻译结果：%s" % (target['translateResult'][0][0]['tgt']))

复制代码

还不太清楚原因，求各位鱼油指导

hldh214 · 发表于 2016-3-6 23:59:29

不同网站的json数据格式不一样, 你的17行需要按照百度的格式修改, 我大概看了一下, 改成这样

print(target['trans_result']['data'][0]['dst'])

复制代码

你可以先print原始target看看格式

zooo · 发表于 2016-3-7 13:01:15

hldh214 发表于 2016-3-7 12:33
不同网站的json数据格式不一样, 你的17行需要按照百度的格式修改, 我大概看了一下, 改成这样
你可以先prin ...

懂了，可以直接通过审查元素里的 response 找到键值，然后直接索引

【gogogo】 · 发表于 2017-9-21 15:42:56

我现在爬百度翻译都是这个结果，{'msg': 'ARG_NULL', 'error': 8}
我是被屏蔽了吗。。。。。
2017-9-21

徐延钊 · 发表于 2018-3-24 21:49:06

import urllib.request
import urllib.parse
url="http://fanyi.baidu.com/v2transapi"
data={}
data["from"]="en"
data["to"]="zh"
data["query"]="I love you"
data["transtype"]="translang"
data["simple_means_flag"]=3
data["ue"]="UTF-8"
data=urllib.parse.urlencode(data).encode("utf-8")
req=urllib.request.Request(url,data)
head_add={"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari"}
head_add={"Referer":"http://fanyi.baidu.com/"}
response=urllib.request.urlopen(req)
html=response.read().decode("utf-8")
print(html)

徐延钊 · 发表于 2018-3-24 21:49:50

徐延钊发表于 2018-3-24 21:49
import urllib.request
import urllib.parse
url="http://fanyi.baidu.com/v2transapi"

哪位大神帮我指点一下，爬百度翻译为什么总是报错{“error”：“997”}

andayanglei · 发表于 2018-8-29 20:28:55

结局了吗？我也是这样子的啊

andayanglei · 发表于 2018-8-29 20:29:30

解决了吗？

andayanglei · 发表于 2018-8-29 22:21:21

结局啦~~

andayanglei · 发表于 2018-8-29 22:22:03

徐延钊发表于 2018-3-24 21:49
哪位大神帮我指点一下，爬百度翻译为什么总是报错{“error”：“997”}

import urllib.request
import urllib.parse
import json

# 百度实时翻译的接口，只能翻译英语到汉语
#百度翻译审查元素中原网址为：http://fanyi.baidu.com/v2transapi，在此需要改为：http://fanyi.baidu.com/transapi
url = 'http://fanyi.baidu.com/transapi'
content = input("请输入待翻译内容:")
head = {}
head['User-Agent'] = 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
data = {}
# 默认是：英语 -> 汉语，若要实现：汉语->英语，则将'from'和'to'的值对调即可,也即:zh和en对调
data['from'] = 'zh'
data['to'] = 'en'
data['query'] = content
data['transtype'] = 'translang'
data['simple_means_flag'] = '3'
data['sign'] = '127170.332787'
data['token'] = '082414939c81a68badde6faf2191d261'
data = urllib.parse.urlencode(data).encode('utf-8')

req = urllib.request.Request(url, data, head)
response = urllib.request.urlopen(req)
html = response.read().decode('utf-8')
target = json.loads(html)
#print(target)
print("翻译结果: %s" % (target['data'][0]['dst']))

TCY · 发表于 2018-12-1 18:41:49

百度不能直接爬……

账号		自动登录	找回密码
密码			立即注册

爬虫入门，百度翻译 response 出错

最佳答案