[已解决]请问如何提取网页的#document中的数据？

hcx623 · 发表于 2016-12-20 09:17:56

您需要登录才可以下载或查看，没有账号？立即注册

x

请问大家，我要爬取的数据是在网页的#document中。请问要如何通过爬虫爬取？？？
刚学爬虫的小白一个，请各位大神给予帮助。

最佳答案

调皮的小屌

2016-12-21 15:45:24

请使用正则，如果不会正则的话可以使用取中间文本的方式，也就是前后为固定常量，中介为你要取的值！

hldh214 · 发表于 2016-12-20 09:38:52

先普及一下 http 协议相关

李长风 · 发表于 2016-12-20 17:30:04

用正则过滤爬取得信息

调皮的小屌 · 发表于 2016-12-21 15:45:24

请使用正则，如果不会正则的话可以使用取中间文本的方式，也就是前后为固定常量，中介为你要取的值！

忘忧草123456 · 发表于 2016-12-27 22:08:52

提示: 作者被禁止或删除内容自动屏蔽

账号		自动登录	找回密码
密码			立即注册

忘忧草123456 忘忧草123456 当前离线 UID 402079 日志相册贡献荣誉积分 69 狗仔卡头像被屏蔽	发表于 2016-12-27 22:08:52 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽
	想知道小甲鱼最近在做啥？请访问 -> ilovefishc.com
	回复支持反对使用道具举报显身卡