鱼C论坛

 找回密码
 立即注册
查看: 1842|回复: 5

[已解决]爬取有道翻译加密数据的问题

[复制链接]
发表于 2017-9-20 18:57:46 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 小六12 于 2017-9-20 19:00 编辑

请问如何解决有道翻译加密了的数据使爬虫得到的是乱码?
  1. import urllib.request
  2. import urllib.parse
  3. url='http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&sessionFrom='
  4. data={}
  5. data['i']='褒めてください。'
  6. data['type']='AUTO'

  7. smartresult:dict

  8. data['doctype']='json'
  9. data['version']='2.1'
  10. data['keyfrom']='fanyi.web'
  11. data['ue']='UIF-8'

  12. data['typoResult']='true'
  13. data=urllib.parse.urlencode(data).encode('utf-8')
  14. response=urllib.request.urlopen(url,data)
  15. html=response.read().decode('utf-8')
  16. print(html)
复制代码

QQ截图20170920185913.png
最佳答案
2017-9-20 19:56:42
data['ue']='UIF-8' 可以不要
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2017-9-20 19:56:42 | 显示全部楼层    本楼为最佳答案   
data['ue']='UIF-8' 可以不要
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-9-20 19:56:57 | 显示全部楼层
或者
  1. import os,urllib.request
  2. import urllib.parse
  3. import json
  4. a = 5
  5. while a > 0:
  6.         txt = input('输入要翻译的内容!')
  7.         if txt == '0':
  8.                 break
  9.                
  10.         else:
  11.                 os.chdir('e:\\python')
  12.                 url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&sessionFrom=https://www.baidu.com/link'

  13.                 data = {
  14.                 'from':'AUTO',
  15.                 'to':'AUTO',
  16.                 'smartresult':'dict',
  17.                 'client':'fanyideskweb',
  18.                 'salt':'1500092479607',
  19.                 'sign':'c98235a85b213d482b8e65f6b1065e26',
  20.                 'doctype':'json',
  21.                 'version':'2.1',
  22.                 'keyfrom':'fanyi.web',
  23.                 'action':'FY_BY_CL1CKBUTTON',
  24.                 'typoResult':'true'}

  25.                 data['i'] = txt

  26.                 data = urllib.parse.urlencode(data).encode('utf - 8')
  27.                 wy = urllib.request.urlopen(url,data)
  28.                 html = wy.read().decode('utf - 8')
  29.                 print(html)

  30.                 ta = json.loads(html)
  31.                 print('翻译结果: %s '% (ta['translateResult'][0][0]['tgt']))
  32.                 a = a - 1
  33.                
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-9-22 10:28:27 | 显示全部楼层
ba21 发表于 2017-9-20 19:56
data['ue']='UIF-8' 可以不要

所以那个有道翻译其实并没有加密咯?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-9-22 10:32:06 | 显示全部楼层
ba21 发表于 2017-9-20 19:56
data['ue']='UIF-8' 可以不要

还有那个requesturl要去掉_o才能正常运行,不然会出现Error50 这是为什么呢?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-9-22 10:40:48 | 显示全部楼层
小六12 发表于 2017-9-22 10:32
还有那个requesturl要去掉_o才能正常运行,不然会出现Error50 这是为什么呢?

不加o的应该是老版本,加o的新版本
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-24 12:54

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表