鱼C论坛

 找回密码
 立即注册
查看: 3071|回复: 6

这是什么原因啊

[复制链接]
发表于 2016-8-7 21:15:27 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. import urllib.request
  2. import os

  3. def get_page(url):
  4.     req = urllib.request.Request(url)
  5.     req.add_header('User-Agent','Mozilla/5.0 (Windows NT 5.1; rv:47.0) Gecko/20100101 Firefox/47.0')
  6.     response = urllib.request.urlopen(url)
  7.     html = response.read().decode('utf-8')

  8.     a = html.find('current-comment-page')+23
  9.     b = html.find(']',a)
  10.    
  11.     print(html[a:b])



  12. def find_imgs(url):
  13.     pass

  14. def save_imgs(folder,img_addrs):
  15.     pass


  16. def download_mm(folder='OOXX',pages = 10):
  17.     os.mkdir(folder)
  18.     os.chdir(folder)

  19.     url = "http://jandan.net/ooxx"
  20.     page_num = int(get_page(url))

  21.     for i in range(pages):
  22.         page_num -= i
  23.         page_url = url +'page-'+str(page_num)+'#comments'
  24.         img_addrs = find_imgs(page_url)
  25.         save_imgs(folder,img_addrs)

  26. if __name__=='__main__':
  27.     download_mm()
  28.         
复制代码

  1. Traceback (most recent call last):
  2.   File "E:\lorraine\01\Python\爬妹子图00.py", line 38, in <module>
  3.     download_mm()
  4.   File "E:\lorraine\01\Python\爬妹子图00.py", line 29, in download_mm
  5.     page_num = int(get_page(url))
  6.   File "E:\lorraine\01\Python\爬妹子图00.py", line 7, in get_page
  7.     response = urllib.request.urlopen(url)
  8.   File "C:\Python34\lib\urllib\request.py", line 161, in urlopen
  9.     return opener.open(url, data, timeout)
  10.   File "C:\Python34\lib\urllib\request.py", line 470, in open
  11.     response = meth(req, response)
  12.   File "C:\Python34\lib\urllib\request.py", line 580, in http_response
  13.     'http', request, response, code, msg, hdrs)
  14.   File "C:\Python34\lib\urllib\request.py", line 502, in error
  15.     result = self._call_chain(*args)
  16.   File "C:\Python34\lib\urllib\request.py", line 442, in _call_chain
  17.     result = func(*args)
  18.   File "C:\Python34\lib\urllib\request.py", line 685, in http_error_302
  19.     return self.parent.open(new, timeout=req.timeout)
  20.   File "C:\Python34\lib\urllib\request.py", line 470, in open
  21.     response = meth(req, response)
  22.   File "C:\Python34\lib\urllib\request.py", line 580, in http_response
  23.     'http', request, response, code, msg, hdrs)
  24.   File "C:\Python34\lib\urllib\request.py", line 508, in error
  25.     return self._call_chain(*args)
  26.   File "C:\Python34\lib\urllib\request.py", line 442, in _call_chain
  27.     result = func(*args)
  28.   File "C:\Python34\lib\urllib\request.py", line 588, in http_error_default
  29.     raise HTTPError(req.full_url, code, msg, hdrs, fp)
  30. urllib.error.HTTPError: HTTP Error 503: Service Temporarily Unavailable
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-8-7 21:17:32 | 显示全部楼层
urllib.error.HTTPError: HTTP Error 503: Service Temporarily Unavailable
是不是网站没有响应?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-8-7 21:53:06 | 显示全部楼层
sunqiangzai 发表于 2016-8-7 21:17
urllib.error.HTTPError: HTTP Error 503: Service Temporarily Unavailable
是不是网站没有响应?

我也不知道,用浏览器又可以打开
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-8-7 22:04:06 | 显示全部楼层
好巧我也正学到这一节,也是503错误
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-8-7 22:29:35 | 显示全部楼层
云飘飘 发表于 2016-8-7 22:04
好巧我也正学到这一节,也是503错误

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-4-24 10:57:16 | 显示全部楼层
设置一个模拟浏览器,还有ip地址也代理一个
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-4-24 11:03:53 | 显示全部楼层
https://baike.baidu.com/item/503错误/1827145
服务器出错。类似404NOT FOUND就是。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-21 00:13

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表