关于scrapy xpath的问题有大大来解惑一下吗

丢丢yhj · 发表于 2017-9-13 15:14:22

您需要登录才可以下载或查看，没有账号？立即注册

x

在用xpath 定位需爬取信息的时候出现了以下问题：
sel.xpath('//div/div/div/div[@class = "table_day15"]/ul/li').extract()
出现的是下图
QQ图片20170913150827.png

得到了我要爬取的内容而且能解析出来的话是很规整的都是我想要的
sel.xpath('//div/div/div/div[@class = "table_day15"]/ul/li/text()').extract()
出现了下图
QQ图片20170913150845.png

我的白天夜晚就这样被吃了如果单独其中每一项可以完成但是阴多云这些就会被吃掉
下面是网页结构截图希望大大帮我看看是怎么回事
QQ图片20170913151320.png

丢丢yhj · 发表于 2017-9-13 16:02:08

查了好久终于查到了
sel.xpath('//div/div/div/div[@class = "table_day15"]/ul/li/descentand::text()').extract()

直接用text并不能解析出子节点的内容所以要用 descentand 或者 //text()

、尾指一勾 · 发表于 2017-9-13 23:57:40

多看几遍 W3C的Xpath教程就看出来了

账号		自动登录	找回密码
密码			立即注册

关于scrapy xpath的问题 有大大来解惑一下吗