网页爬虫求助

jiulanrensan · 发表于 2017-9-22 20:18:58

您需要登录才可以下载或查看，没有账号？立即注册

x

刚刚接触爬虫，在网易云看的爬虫课程，也是按照课程的代码，运行却出错了，报错看得不是很懂，请教各位大神，谢谢

import requests
import json
res = requests.get ('http://comment5.news.sina.com.cn/page/info?version=1&format=js&channel=ty&newsid=comos-fymesii4872432&group=&compress=0&ie=utf-8&oe=utf-8&page=1&page_size=20')
jd = json.loads(res.text)
print (jd)

复制代码

hldh214 · 发表于 2017-9-22 21:42:24

这个并不是标准的 json 格式, 而是 js 代码
简单点就取 `var data=` 之后的数据再 jsonDecode
稍微稳一点用正则吧

gopythoner · 发表于 2017-9-30 11:28:47

先用正则提取到json格式的代码，然后再转换

账号		自动登录	找回密码
密码			立即注册