最近刚开始学习python爬虫,我的学习路,资源分享,鱼C论坛

wyf345491656 发表于 2018-6-14 23:03:21

最近刚开始学习python爬虫

了解到python中需要导入urllib模块的request方法，然后通过urlopen来获取网页数据，再利用read方法来读取页面数据，但是由于各个网页的编码方式不同，需要手动去页面查找编码，我就想到能不能有自动获取页面编码方式数据的模块，由此就找到了chardet模块，通过其中的detect方法来自动获取页面的编码方式，试了几个页面成功了，但是在http://www.qq.com网页上，自动获取编码方式的时候经常会显示None，但是偶尔又有成功的时候，一直想不通是什么原因。

页: [1]

鱼C论坛's Archiver

最近刚开始学习python爬虫