最近刚开始学习python爬虫

wyf345491656 · 发表于 2018-6-14 23:03:21

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

了解到python中需要导入urllib模块的request方法，然后通过urlopen来获取网页数据，再利用read方法来读取页面数据，但是由于各个网页的编码方式不同，需要手动去页面查找编码，我就想到能不能有自动获取页面编码方式数据的模块，由此就找到了chardet模块，通过其中的detect方法来自动获取页面的编码方式，试了几个页面成功了，但是在http://www.qq.com网页上，自动获取编码方式的时候经常会显示None，但是偶尔又有成功的时候，一直想不通是什么原因。

账号		自动登录	找回密码
密码			立即注册

[见证历程] 最近刚开始学习python爬虫

马上注册，结交更多好友，享用更多功能^_^