鱼C论坛

 找回密码
 立即注册
查看: 773|回复: 3

为什么urllib.reqest.urlopen()打开的网址不是www开头就会出错呢?

[复制链接]
发表于 2018-6-10 19:39:35 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
代码不出错:
import urllib.request
import re
import os

url="http://www.ifeng.com"
res=urllib.request.urlopen(url).read().decode("utf-8")



代码出错:
import urllib.request
import re
import os

url="https://xueqiu.com/u/9548239780"
res=urllib.request.urlopen(url).read().decode("utf-8")


两段代码,只有url不同,为什么下面一个会出错呢?
求解。谢谢!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-6-10 19:50:22 | 显示全部楼层
url="https://xueqiu.com/u/9548239780"

url="http://www.ifeng.com"

你2个网站不一样好吧。出不出错跟www没关系。

至少下面这个没有出错。
url="http://www.ifeng.com"
url="http://ifeng.com"

什么问题可以看错误代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-6-10 19:51:13 | 显示全部楼层
和www没关系,雪球网有反爬,他检测出来你是个爬虫就返回403了。
网址存在就行,有没有www无所谓。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-6-14 16:58:00 | 显示全部楼层
本帖最后由 colinshi 于 2018-6-14 17:03 编辑

好像是你请求的页面的问题
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-20 20:08

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表